論 文Papers

WORKSHOP (DOMESTIC)

Copulaを用いたスコア統合手法とその有効性の検証

小松田 卓也 (東京工業大学), 清水 伸幸, 田島 玲, 欅 惇志 (東京工業大学), 宮崎 純 (東京工業大学)

第7回データ工学と情報マネジメントに関するフォーラム(DEIM2015), 2015/3

Category:

情報検索 (Information Retrieval) データサイエンス (Data Science)

Abstract:
本研究では,確率モデルである Copula を用いて複数の評価尺度(クエリとの適合度や文書の新鮮さなど) の統合において,限られたランキング上位文書のみで学習した場合においても利用可能なスコアリング手法を提案す る.複数の評価尺度を用いた情報検索は,線形結合やランキング学習によって実現されているが,線形結合には評 価尺度間の依存関係を考慮していない,ランキング学習には結果に対する理由付けが困難であるという問題がある. その点 Copula は評価尺度間の依存関係を考慮するために線形結合やランキング学習の問題点を解決できる.既存の Copula 統合式はすべての評価尺度を同時に扱うものの,限られたランキング上位文書のみでは上手く学習を行うこと ができない.本稿では,ある評価尺度に加重が可能な,Copula を用いたスコアリング手法を提案し,学習時の影響度 の大きな評価式の比重を大きくすることで,そのような課題を解決する.QA サイトを用いた評価実験の結果,提案 する Copula を用いたモデルを利用することでランキング学習や従来の Copula によるモデルと比較して,より正確に 検索を行うことが可能であることを示した.