最新ゼミ情報


Koichi Miyazaki, "Dataset Enlargement using Noise Convolution in Sound Event Detection"

2017/02/05 20:15 に 後藤太一 が投稿


本稿では,音響イベント検出における雑音重畳によるデータセット拡張の有効性の調査を行った.
具体的には,NOISEX-92やChiME4などの雑音データセットを学習データに重畳し,認識手法は林らのBLSTM-RNN, BLSTM-HSMMを用いた.
実験の結果,学習データセットの拡張を行ったことで性能が向上することが確認された.
今後は,異なる認識手法や音響イベント検出に対する新たな特徴量について調査を行う.

Naren Bao, "Analysis Individual Differences in the Importance of the Various Features"

2017/02/05 20:05 に 後藤太一 が投稿


本稿では,各個人が車線変更シーンに対するリスク感に影響を及ぼす要因についてランダムフォレストを用いて分析を行った.
調査する要因は,ドライバの行動(アクセル・ブレーキ踏力),車両状態(速度,各軸方向の加速度),周辺車情報(各車両のTTCやTHW)などである.
実験を行った結果,全体的に速度,強いブレーキ,縦軸方向の加速度などが危険度に影響を与えていることが確認された.
一方で,道路の曲率については個人毎に異なる影響度合いが異なることが示された.
今後は,これらの要因がどのように危険度に影響を与えているのか調査を行う.

Daiki Hayashi, "Analysis of Visibility Action by Driving Instructor in Intersection"

2017/02/05 19:51 に 後藤太一 が投稿


交差点におけるドライバの運転行動をモデル化することを目的とし,本稿では交差点の形状や一時停止標識の有無といった
パラメータの有無によってドライバの運転行動に違いが生じることを確認した.
市街地走行による実験を行った結果,特に視行動について,
三叉路においては正面を見ている割合が高く,また四差路においては一時停止標識の有無によって左右確認を行うタイミングが異なることが確認された.
今後の課題として,見通しの悪さやカーブミラーの有無などのパラメータに対する影響の調査が挙げられる.

Tomoki Hayshi, "Duration-controlled LSTM for Polyphonic Sound Event Detection"

2017/02/05 19:33 に 後藤太一 が投稿


In this study, we aim at sound event detection.
To deal with problems such as cannot represent actual duration of each sound event and decrease performance under noisy condition,
we proposed new method that combine Sound Activity Detection Network with BLSTM-HSMM.
Result of experimental comparison, proposed method shoe higher performance than exiting techniques.
Henceforth, apply to real & big recording dataset.

Seita Noda, "Various Studies on Acoustic Model Training Using Normal Speech for NAM Recognition"

2017/01/29 19:02 に 後藤太一 が投稿


本研究では,非可聴つぶやき(Non-Audible Murmur: NAM)の音声認識について,通常の学習に加えさらに通常音声を加えたDNNに基づく音響モデルを提案する.
前回の報告では,通常音声を用いることによる性能の改善が確認されたが,話者数と改善率の関係については明らかになっていなかったので,
学習に用いる通常音声話者数の変化によって性能がどのように変わるか調査をした.
実験を行った結果,通常音声話者数を増やすほど通常音声の特徴に依存したモデルとなってしまい,20人を境目に性能が低下する傾向が確認された(NAM話者は40人).
一方で,学習後のモデルに対してNAM音声のみによる再学習を行うと,通常音声話者数を増やすほど性能が上がることが確認され,
今後はNAM音声に依存するような学習の手法を調査,検討を行う.

Yusuke Sakai, "Study related to Emotion Recognition in Daily Life using Multimodal Biosignal and Machine Learning"

2017/01/29 18:52 に 後藤太一 が投稿


本研究では,感情認識の手法の中でも日常的に得ることが可能となりうる生体信号に着目をし,生体信号を用いて感情認識を行うことを目標とする.
今回は,生体信号の中でも感情との相関が示されている,心電図と筋電図に着目をした.
両指標について時間領域および周波数領域における特徴量を抽出し,喜怒哀楽,4分類の感情認識実験を行った結果,
心電図のみを用いた場合は51.25%,両方用いた場合は46.25%の認識率が得られた.
筋電図を使用すると下がった原因として,皮膚の分泌物により電極が剥がれ,波形が乱れてしまったことが考察される.
今後は,さらに呼吸に基づく特徴量などの使用を検討していく.

Kanji Toyama, "Progress Report on Lecture Support System based on Visualize of Articulation Index"

2017/01/29 18:40 に 後藤太一 が投稿


本研究では,音の伝達を可視化することによる講演支援システムの構築を目標とする.
前回までの調査から,音の伝達度合いを表す指標として話し手と聞き手が受け取る音声の相関値が適当であるという結論を得たので,
今回の報告では,相関値と聞き手の明瞭度の関係について調査を行った.
6名の被験者による,雑音の重畳された単語の書き取り実験を行った結果,相関値0.5以上で100%近い正答率を得ることができると確認された.
今後は,実験の結果をベースに具体的な話者へのフィードバックの手法を検討し,実装を行う.

Kohei Tsuzuki, "Incident Detection based on Deep Learning using Viewdata"

2017/01/25 18:45 に 後藤太一 が投稿


本稿では,ヒヤリハットデータベース内から有効なデータを自動検出するため,当該データベース内から危険なヒヤリハットを検出することを目的とする.
以前の実験では,一枚の画像を用いたCNNによって検出を行ったが,今回は映像データの時系列の相関を捉えるため,3D-CNNおよびCNN-RNNに基づく検出を行った.
これらの検出器の性能を実験により評価を行った結果,CNN-RNNが最もよい性能となった.
今後は,何秒間のデータを使えばよいのかといった問題や,各ネットワークにおけるパラメータの最適化を行うことにより性能向上を図る.

Syunya Seiya, "Generation of Learning Database for Automatic Driving based on Deep Learning"

2017/01/25 18:33 に 後藤太一 が投稿   [ 2017/01/25 18:36 に更新しました ]


現在,レベル2の自動運転機能としてレーンキープアシストやアイサイトが普及している.
これらはif-then形式のルールベースに基づくシステムであるが,ルールに記述していない未知のデータへの頑健性が低いという問題点がある.
そこで,本研究では機械学習による自動運転に着目をする.
機械学習による自動運転には大量の学習データが必要となるため,既存研究にならい,複数カメラを用いることによる学習データの増加を行った.
具体的には,視点変換プログラムと教師データ付与プログラムを用いることによってレーン中心からずれたさいのデータを新たに生成する.
動作確認により問題なくデータ生成が行えていることが確認できたので,
今後は,学習データを増加することによる影響について調査を行う.

Tomohiro Takeyama, "Invesigation for Improvement of Speech Intelligibility based on Stastical Speech Waveform Conversion in Noise Enviroment"

2017/01/25 18:22 に 後藤太一 が投稿   [ 2017/01/25 18:35 に更新しました ]


本稿では,通常音声からロンバート音声へと変換を行うことによる音声了解度の向上を目的とする.
従来手法では,特定の周波数成分の強調や時間周波数領域におけるエネルギーの再割り当てなどのルールベースの手法が提案されているが,
本研究では統計的音声波形変換に着目をする.
通常音声・ロンバート音声・変換音声による書き取り実験を行った結果,
音声波形変換処理による若干の了解度の向上が見られたが,特に優勢子音の認識率が低く,更なる調査が必要であることが確認された.
今後は,従来方であるSSDRCの実装を行う.

1-10 of 98