論 文Papers

WORKSHOP (DOMESTIC)

2 段階のクラウドソーシングによる談話関係タグ付きコーパスの構築

河原 大輔 (京大), 町田 雄一郎 (京大), 柴田 知秀 (京大), 黒橋 禎夫 (京大), 小林 隼人颯々野 学

情報処理学会研究報告. 自然言語処理研究会報告, 2014/6, Vol. 2014-NL-217, No. 12. pp.1-7

Category:

自然言語処理 (Natural Language Processing) クラウドソーシング (Crowdsourcing)

Abstract:
本稿では、クラウドソーシングを活用することによって、談話関係タグ付きコーパスを構築する手法を提案する。談話関係のタグ付けは従来は非常に長い時間とコストがかかるものであったが、提案手法ではこれを 2 段階のクラウドソーシングのタスクに分けることによって短時間で構築する。1 文書が 3 文からなる短い日本語テキストを対象としてクラウドソーシングを行い、1 万文書 (3 万文) からなるコーパスが 8 時間弱で構築できることを示す。また、構築したコーパスを利用して談話関係解析器を開発し、コーパスの有用性を示す。