Publications

CONFERENCE (DOMESTIC) Wakeupワードに特化したDNNマスクを用いた背景発話に頑健な音声認識

木田 祐介、Dung Tran、大町 基、谷口 徹、藤田 悠哉

日本音響学会2018年秋季研究発表会

September 12, 2018

スマートスピーカなどで音声認識を起動するトリガとして使われているwakeupワードに着目した、背景発話に頑健な音声認識を提案する。提案法は、検出されたwakeupワード区間の信号にDNN(Deep Neural Network)マスクを適用して混合信号をwakeupワードと背景発話に分離する。次に、分離された二つの信号から最小分散ビームフォーマのフィルタを推定し、wakeupワード以後の発話に適用する。提案法のメリットは、目的発話に関する制約や、目的話者による事前の音声収録を必要とせず、wakeupワードを発話した任意の話者の音 声を強調できる点である。背景発話の存在する実環境での音声認識実験の結果を報告し、提案法の有効性を検証する。