最新ゼミ情報


Taichi Goto, "Lane Change Prediction using Omnidirectional Image"

2016/12/21 18:30 に 後藤太一 が投稿


本研究では,深層学習に基づき車線変更を予測することを目的とする.
既存の研究で,車線変更と周辺車両情報には関連があることが示されているが,
前方以外に存在する車両の特徴量化についてはあまり議論がされていない.
そこで,全方位画像を用いることで上記の問題を解決すること試み,
ボトルネック構造をもつCNNによって特徴量化を行った.
車線変更の予測実験を行った結果,全方位映像による予測は困難であることが示された.
今後は,3DCNNを用いて,入力画像間の変化に基づく特徴量化を検討している.

Yuya Takenaka, ''Error Minimization Learning of HSMM in Score Alinment"

2016/12/21 18:25 に 後藤太一 が投稿


本研究では,自動伴奏を想定した50ms以下での楽譜アライメント精度の向上を目的とし,
楽譜アライメントモデルのパラメータの最適化を行う.
具体的にはWuらによるHMMの誤差最小化学習を,HSMMに拡張することによってこれを実現する.
RWC研究用音楽データベースを用いて実験を行った結果,
更新を行うごとにより短い時間での誤差許容範囲において性能が向上することが確認された.
今後の課題として,更なるアライメント制度の確認が挙げられる.

Tu Chenxi, "Continuous Point Cloud Data Compression Method based on SLAM"

2016/12/21 18:14 に 後藤太一 が投稿


本研究では,SLAMに基づくポイントクラウドデータの圧縮手法について提案の行う.
SLAMとは自己位置推定と環境地図作成を同時に行う手法であり,
提案手法ではこSLAMより将来の画像を予測し,その差分を活用することで圧縮を行う.
実験にて評価を行った結果,既存手法であるMPEGやJPEGよりも高い圧縮性能を示すことが示された.
今後は,以前に提案した手法との比較をおこなっていく.

Koichi Miyazaki, "Validity Verification of Data Enhancement using Noise Superimposed in Detection Acoustic Scenes"

2016/12/18 19:32 に 後藤太一 が投稿


本研究では,音声データ中から足音や鳥の鳴き声といった環境や非音声言語による音響イベントを検出することを目的とする.
今回は上記のタスクにおいて,雑音重畳によるデータ拡張によって性能がどう変化するか検証を行った.
検出器としてBidrectional RNNを用いて実験を行った結果,データ拡張による有効性は確認できなかった.
今後は異なる認識手法や,ピッチシフトを用いたデータ拡張などを行っていく.

Shogo Seki, "Proposal Spectral Envelope Regurarization based on Autoregiressive Model and Experimental Assessment about Cepstrum Reguralization NTF"

2016/12/18 19:20 に 後藤太一 が投稿


本研究ではCD音源などのステレオチャンネル信号に対する,非負値テンソル因子分解(NTF)を用いた劣決定音源条件化の楽曲音源分離を目的とする.
ケプストラム正則化NMFに対して自己回帰に基づく新たな正則化手法の提案および評価を行った.
実験により,提案した正則化手法を用いることで,類似した異なる楽曲を学習データとして利用可能となり,
楽曲によらない分離性能の向上が確認された.
今後は,正則化パラメータや混合数,特徴量次元などの最適化を行っていく.

Toshiki Yamamura, "Wavefront Synthesis using Inverse filter of Interior Inpulse Response"

2016/12/18 19:11 に 後藤太一 が投稿


本研究では,車内空間における臨場感の高い通話システムの構築を目的とする.
今回の発表では,実際の車内でのWFSによる音源生成を行い,測定されたインパルス応答を基に逆フィルタを作成,
車内環境の影響を抑制する実験について報告を行った.
シミュレーションにより逆フィルタの性能を評価した結果,特定の箇所における再現精度の改善が確認されたが,
観測領域全体での性能は悪化してしまった.
今後は,週間評価による逆フィルタの効果を調査していく.

Naren Bao, "Individual Risk Prediction During Highway Lane Change Scenes Based on Structured Random Lasso"

2016/12/11 19:28 に 後藤太一 が投稿


ドライバが運転中に感じるリスク感について様々な研究がなされているが,個人毎に分析を行った研究はあまり行われていない.
そこで本研究では,ドライバ個人のリスク感について分析を行っていく.
具体的には,自車情報や周辺環境情報などから最適な特徴量の数を設定し,それら特徴量化からその数に応じた特徴量を選択することによって実現をする.
リスク感推定実験を行った結果,ハイパーパラメータの設定によって結果が不安定となってしまうことが判明した.
今後は木構造による特徴量選択,交差検証法などにより最適なハイパーパラメータを検討する.

Daiki Hayashi, "3-D Point Cloud Analysis for Quantification of Intersection Visibility"

2016/12/11 19:09 に 後藤太一 が投稿


本研究では,最も交通事故が発生している場所が交差点であるという背景をもとに,交差点における見通しを定量化することを目的とする.
今回は,市街地走行における交差点における見通しの主観評価実験を行い,三次元点群データとの相関を分析した.
見通しが良い・悪いの二種類に分類をし,それぞれについて交差点の中心周囲50m内の点群データを比較した結果,
見通しの悪い交差点では入り口付近,高さ15mあたりに障害物が存在し,かつ走行道路の幅が比較的狭いことがわかった.
今後は得られた特徴を踏まえ,交差点の見通しの定量化について具体的な手法を検討していく.

Seita Noda, "Machine Learning using exophosia for NAM Recognition"

2016/12/11 18:46 に 後藤太一 が投稿


本報告では,非可聴つぶやき音声(NAM)認識性能向上のための通常音声を用いた学習の枠組みについて報告を行った.
これはNAMデータのみを用いて学習されたモデル(NAM-SI)をベースとして,通常音声用の話者依存線形層をモデルに別途挿入を
することによって実現される(NAM-SP-LTL).
さらに線形依存層の後段に通常音声からNAM音声へと変換を行うような非線形層挿入したモデル(NAM-SP-LTL-S2N)も作成し,
これらの性能をWERによって評価した結果,通常音声を用いることで性能の向上が確認され本手法の有効性が示された.
今後はよりNAMに依存した学習を行うような枠組みを検討していく.

Tomohiro Takeyama, "Improvement of Speech Intelligibility based on Statistical Voice Conversion in Noisy Environment"

2016/12/04 19:12 に 後藤太一 が投稿


本発表では,雑音環境下において通常音声からロンバート音声へ変換する手法の比較検討について報告を行った
差分スペクトラル包絡に基づく差分VC,DRCなどの手法を実装し実験を行った結果,
差分VCによる変換音声はロンバート音声に近い聞こえ具合であったが,DRCによる変換音声は
通常音声の聞こえやすさとほとんど変わらないということが判明した.
今後は従来手法SSDRCと比較を行うほか,了解度の評価手法の調査などを行っていく.

1-10 of 88