Koichi Miyazaki, "Validity Verification of Data Enhancement using Noise Superimposed in Detection Acoustic Scenes"

2016/12/18 19:32 に 後藤太一 が投稿

本研究では,音声データ中から足音や鳥の鳴き声といった環境や非音声言語による音響イベントを検出することを目的とする.
今回は上記のタスクにおいて,雑音重畳によるデータ拡張によって性能がどう変化するか検証を行った.
検出器としてBidrectional RNNを用いて実験を行った結果,データ拡張による有効性は確認できなかった.
今後は異なる認識手法や,ピッチシフトを用いたデータ拡張などを行っていく.
Comments