論 文Papers

WORKSHOP (DOMESTIC)

LSTMを用いたキーワードスポッティング

増田 嵩志(東大),張 豪逸(東京工業大),磯 健一

日本音響学会2017年春季研究発表会, 2016

Category:

音声処理 (Speech Processing)

Abstract:
本研究ではLSTMを用いたキーワードスポッティングシステムを提案した。従来のHMMベースの手法に対し大幅な精度向上を達成した。DNN ベースの手法と比べ、よりシンプルな枠組みでキーワードスポッティングを行うことが可能である。 キーワード終了ラベルを付与することで時系列入力から直接キーワードを検出することが出来る。ラベルを付与する位置および区間はCTC によって同時に最適化することも可能である。 実験では、LSTM ベースのキーワード検出がDNN ベースのものよりもシンプルな枠組みであるだけでなく、より高精度な検出手法であることを示した。
Download:

LSTMを用いたキーワードスポッティング(外部サイト/External Site Link)