論 文Papers

WORKSHOP (DOMESTIC)

画像を利用したニュース記事のマルチモーダル要約システム

中井 亮(東京大学), 小林 隼人, 田頭 幸浩, 野口 正樹, 村尾 一真, 中山 英樹(東京大学)

SSII2017(第23回画像センシングシンポジウム), 2017/6

Category:

自然言語処理 (Natural Language Processing) 画像処理 (Image Processing) 機械学習 (Machine Learning)

Abstract:
近年,機械翻訳タスクにおいて提案された Encoder-Decoder モデルやアテンション機構が,要約タスクにも応用されてきた.これらの手法は文書のみを入力として利用しているが,ニュース記事のように,文書に画像が付属している場合,画像を利用することでより精度の高い要約を行うことができると考えられる.本研究では,画像情報と文書情報に基づき,画像 Encoder と文書 Encoder の 2 つの Encoder から構成され,各々がアテンション機構を持ったマルチモーダルな要約システムを提案するとともに,モデルの学習に際し,難易度の低いタスクから高いタスクへ段階的に進めるカリキュラム学習法を提案する.また,提案手法を Yahoo!ニューストピックスから得られたデータセットに適用し,提案手法の有効性を示す.
Download:

画像を利用したニュース記事のマルチモーダル要約システム(外部サイト/External Site Link)