意味論的構文解析

　従来の構文解析は、idesで使用しているCabochaのように「係り受け解析」を基礎とするものが大半でした。もちろん、係り受け解析は、構文解析の最初の一歩であり、これがうまくできなければ、あとの処理は全部うまくいかないとも言えるもので、とても重要です。
　しかし、係り受け解析だけでは、充分に「文の意味」を抽出することはできません。「高田の趣味」という語句であれば、係り受け解析によって「（高田　の）趣味」というように適切に展開されますが、それが何を意味しているのかを知るためには、さらに詳細な処理が必要になります。
　たとえば、そのな場合、まず、「高田」というトークン（idesの一連の研究では、チャネル理論に沿って「名称」を「トークン」という語で表現します）は、ある人物［α1］というタイプ（同じく、チャネル理論に沿って、内部で用いられる概念のことを「タイプ」という語で表現します）に分類されます。同様に、「趣味」というトークンはα2というタイプに分類されます。さらに、「高田の趣味」というトークンは、α3というタイプに分類されますが、そのときα3は、[α1の α2］という下位形式を持つことになります。
　そしてさらに、「高田の趣味は盆栽です」（※ウソです）という文をF1というトークンであるとすると、

F1 |= φ1 （"|=" という記号は、x |= y 　という場合に、xがyに分類される　ということを意味します）

というように、φ1というタイプに分類され、また、φ1というタイプは、

　φ1：α4(α3)
　φ1：α4(α1の α2)
　（ここで、x(y）とは、yがxというクラスに分類される、という意味です。）
　「盆栽」 |= α4

なる叙述文（事実）が登録されることになります。
　このように、少々面倒な形式に変換することによって、たとえば、

　「高田の兄の妻の弟」

などという表現であっても、

　「高田」 |= α1，　「高田の兄」 |= α5，　「高田の兄の妻」 |= α6，　「高田の兄の妻の弟」 |= α7　

という４人の人物を、それぞれ概念（タイプ）として登録することができます。そうすれば、「高田の兄」の固有名詞が「高田たかし」だとした場合に、「高田たかしの妻」と「高田の兄の妻」が、同じタイプ（概念）として登録されます。

　このように、それぞれの概念の意味や、文の意味構造を反映するように、あるメタ形式に変換するやりかたのことを、「意味論的構文解析」もしくは Semantic Parsing と呼びます。

top

">previous