An automatic indexing of compound words based on mutual information for Korean text retrieval
発行日:1997年3月31日Published: March 31, 1997
最近,自然語テキスト表現に対する索引語として単語と複合語が広く利用されてきている。本稿では,膠着語,特に韓国語に適した複合語の自動索引手法を提案している。まず,索引語としての複合語を組み立てるための条件を述べ,次に,テキスト全体から連続する名詞群に適用できる分解規則を示した。最後に,情報理論に基づき複合語における語の連合の程度を算出する,語の利用可能性を測定する一つの尺度として相互情報を提案した。この方法を当てはめた結果,複合語の語の精度は72%から87%に向上した。
© 1997 三田図書館・情報学会© 1997 Mita Society for Library and Information Science
This page was created on 2022-03-15T17:00:46.410+09:00
This page was last modified on
このサイトは(株)国際文献社によって運用されています。