従来の構文解析は、idesで使用しているCabochaのように「係り受け解析」を基礎とするものが大半でした。
もちろん、係り受け解析は、構文解析の最初の一歩であり、これがうまくできなければ、あとの処理は全部うまくいかないとも言えるもので、とても重要です。
しかし、係り受け解析だけでは、充分に「文の意味」を抽出することはできません。
「高田の趣味」という語句であれば、係り受け解析によって「(高田 の)趣味」というように適切に展開されますが、それが何を意味しているのかを知るためには、さらに詳細な処理が必要になります。
たとえば、そのな場合、まず、「高田」というトークン(idesの一連の研究では、チャネル理論に沿って「名称」を「トークン」という語で表現します)は、
ある人物[α1]というタイプ(同じく、チャネル理論に沿って、内部で用いられる概念のことを「タイプ」という語で表現します)に分類されます。
同様に、「趣味」というトークンはα2というタイプに分類されます。
さらに、「高田の趣味」というトークンは、α3というタイプに分類されますが、そのときα3は、[α1の α2]という下位形式を持つことになります。
そしてさらに、「高田の趣味は盆栽です」(※ウソです)という文をF1というトークンであるとすると、
F1 |= φ1
("|=" という記号は、x |= y という場合に、xがyに分類される ということを意味します)
というように、φ1というタイプに分類され、また、φ1というタイプは、
φ1:α4(α3)
φ1:α4(α1の α2)
(ここで、x(y)とは、yがxというクラスに分類される、という意味です。)
「盆栽」 |= α4
なる叙述文(事実)が登録されることになります。
このように、少々面倒な形式に変換することによって、たとえば、
「高田の兄の妻の弟」
などという表現であっても、
「高田」 |= α1, 「高田の兄」 |= α5, 「高田の兄の妻」 |= α6, 「高田の兄の妻の弟」 |= α7
という4人の人物を、それぞれ概念(タイプ)として登録することができます。
そうすれば、「高田の兄」の固有名詞が「高田たかし」だとした場合に、
「高田たかしの妻」と「高田の兄の妻」が、同じタイプ(概念)として登録されます。
このように、それぞれの概念の意味や、文の意味構造を反映するように、あるメタ形式に変換するやりかたのことを、
「意味論的構文解析」もしくは Semantic Parsing と呼びます。