論 文Papers

CONFERENCE (DOMESTIC)

検索クエリによる小児外科疾患特有の機械学習モデル改善の試み

山口 修司、内田 広夫(名古屋大学)、檜 顕成(名古屋大学)、坪内 孝太田島 玲

第55回日本小児外科学会学術集会, 2018/5

Category:

データサイエンス (Data Science)

Abstract:
【背景】人工知能 (AI) が普及し、その用途が急速に拡大している。制度面からもAIを医療現場で活用するための環境が整いつつあり、さまざまな場面で医療従事者の業務をAIに支援させ、医療の効率や質を高めようという試みが始まっている。我々は医療機関に集積された医療情報を解析することなく、日常使用しているYahoo! JAPAN検索エンジンの検索クエリ(ビックデータ)から小児外科疾患の早期発見の支援にチャレンジする。 【目的】これまでの研究から、検索クエリには小児外科疾患特有の症状や病態に関するワードが多く含まれ、早期発見に活用できる可能性があることがわかっている。今回はユーザごとに検索クエリに現れる症状・病態に関するクエリの時間ごとの変化についてさらに調査を行い、それにより機械学習データの前処理部分を改善し、より精度の高い学習モデル作成を目的とした。 【対象】2016年9月から2017年8月の間にYahoo! JAPAN検索において小児外科疾患名(1小児がん・2鼠径ヘルニア・3停留精巣・4急性虫垂炎・5食道閉鎖症・6肥厚性幽門狭窄症・7十二指腸閉鎖症・8小腸閉鎖症・9鎖肛・10胆道閉鎖症・11胆道拡張症)を含むユーザを対象にした。 【方法】各疾患名を検索しているユーザの対象期間中の検索クエリを抽出し、症状に関連するクエリについて時間ごとの現れ方の変化について調査を実施する。次に調査結果から疾患ごとに最適な前処理を実施し、機械学習モデルを作成する。機械学習はロジスティック回帰分析を採用し、モデルの精度はhold-out法により評価を行う。 【結果】疾患または症状により検索クエリに時間方向の特性に違いがあり、症状により疾患名への到達の傾向に違いがあることがわかった。また、各疾患について学習モデルが約80%の精度で作成でき、学習モデルには疾患に関連するものが現れていることが確認できた。今後、この知見を前処理のみでなく機械学習アルゴリズムの改善に活用することを目指す。