論 文Papers

CONFERENCE (DOMESTIC)

オンライン広告におけるウェブ閲覧系列の分散表現の獲得

田頭 幸浩小林 隼人、小野 真吾、田島 玲

2016年度人工知能学会全国大会(第30回), 2016/6

Category:

自然言語処理 (Natural Language Processing) 機械学習 (Machine Learning) データサイエンス (Data Science)

Abstract:
オンライン広告を限られた時間や予算のもとで効率的に配信するためには,その広告に興味を持ったり,広告主の顧客になりそうなユーザーに対して,優先的に広告を表示することが好ましい.そのため,ウェブ上の行動をもとにユーザーをモデリングし,広告を表示するユーザーを適切に絞り込むことは,非常に重要なタスクである.近年,自然言語処理の分野では,ベクトル空間上での単語の分散表現が注目を浴びている.また,パラグラフや文書などの,可変長のテキスト列の分散表現を得る研究もなされている.これらの研究を受けて,我々は,Paragraph Vectorを用いてウェブ上のユーザーの行動列を集約するアプローチを提案した.このアプローチでは,ユーザーをパラグラフもしくは文書,ウェブページ訪問を単語と見なし,ユーザーのウェブページ訪問系列に対してこの自然言語処理の手法を適用する.学習で得られたユーザーを表現する低次元の特徴量ベクトルは,ユーザーに関連した各種予測タスクで共通して用いることができる.さらに,英語版WikipediaとYahoo! JAPANのアクセスログをもとに作成したウェブ閲覧系列の,二つのデータの分布の違いに着目し,Paragraph Vectorを修正したBackward PV-DMを提案し,その有用性について確かめた.上記のアプローチでは,ユーザーのベクトル表現をログから教師無し学習で得ることができるため,ウェブサイトやスマートフォンアプリ全体ではユーザーの行動ログが潤沢に得られる一方で,個々の予測タスクの学習データが少ない場合に,このベクトル表現は有効な特徴量になると期待される.本稿では,まず我々のアプローチの概要を述べ,続いて学習データ量を変化させた時の,予測タスクの性能の変化について報告する.
Download:

オンライン広告におけるウェブ閲覧系列の分散表現の獲得(外部サイト/External Site Link)