Papers

CONFERENCE (DOMESTIC)

Doc2Vec 手法による映画レビューサイトからのクエリと意味的に類似した評価表現の発見

栗原 光祐(青学大)、莊司 慶行(青学大)、藤田 澄男、Martin J. Dursty(青学大)

第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), 2019/3

Category:

Natural Language Processing Information Retrieval Data Science

Abstract:
本研究では,Doc2Vec を用いて,映画レビュー文からクエリ語の語意をよく言い表した多様な表現を得る 手法を提案する.現在,「みんなが『驚いた』と言っている映画を探す」というように,レビュアからの評判に基づい て映画を検索する方法は確立されていない.レビュー文には,似た意味を表す様々な表現が含まれる.簡潔なクエリ からレビュー文を検索するためには,検索クエリと対応するレビュー中の表現をできるだけ多く抽出する必要がある. 提案手法では,レビューを映画ごとにまとめてDoc2Vec を学習し,それを用いて各レビュー文を事前にベクトル化す る.辞書を用いて拡張したクエリをベクトル化し,それぞれの文のベクトルと比較することで,クエリと意味的に近 いレビュー中の文をランキングする.Yahoo!映画の実際の約130 万件のレビューデータと,クラウドソーシングを用 いた大規模被験者実験により,提案手法の有用性を示す.
Download:

Doc2Vec 手法による映画レビューサイトからのクエリと意味的に類似した評価表現の発見(External Site Link)