論 文Papers

CONFERENCE (DOMESTIC)

新旧のタグなしコーパスを用いた新エンティティ収集の評価

井上裁都、粟村誉、長田誠也、立石健二、宮崎林太郎、山下達雄

言語処理学会第24回年次大会(NLP2018), 2018/3

Category:

自然言語処理 (Natural Language Processing)

Abstract:
一般にEntity Linkingの研究は,固定の知識ベース(辞書)とタグ付きコーパスを使った評価を前提とすることが多い.しかし,実世界への応用においては,辞書を常に新しい状態にすることはもちろん,更新した辞書の品質を評価できることが重要になる.とはいえ,更新した辞書の品質評価は,コストの観点で容易ではない.新しい辞書を定量的に評価するには,辞書中の新しいエンティティを含む新しいタグ付きコーパスが必要になる.本論文では,コスト削減のため,新しい辞書をタグなしコーパスを用いて評価する手法を提案する.提案手法は,新旧の辞書を使って新旧のコーパスを解析し,その結果の差分を分析することで評価する.
Download:

新旧のタグなしコーパスを用いた新エンティティ収集の評価(外部サイト/External Site Link)