Signal Analysis Lab.
Research
スタンドアロン音声認識システムの開発
インターネットを介さず、雑音に強い、完全ハンズフリーな単語音声認識システムを開発しています。iPhoneに搭載されているSiriやGoogleの音声検索など、音声インターフェースが普及してきていますが、いずれもインターネットに接続することを前提としている方式です。インターネットを介し大規模なサーバーにアクセスすることで、複雑な認識処理を高速に実行することができます。しかし、インターネット接続は通信コストやセキュリティにおいて依然として課題があります。そこで我々は、音声信号を新たな角度から解析し、インターネットを介さずに高い認識性能を実現する新たな認識エンジンの開発に取り組んでおります。また、これらの成果を論文発表、学会発表、産学連携により世の中に発信し、音声認識の更なる普及を目標としております。
事前知識を利用した領域抽出に関する研究
スマートフォンの普及とともに、インターネットを介した個人間商品取引(メルカリ・ヤフオク等)の市場規模が増大傾向にあります。出品者は、商品の外観が写る画像をアップロードし、商品の特徴(商品名・メーカ情報等)をテキスト入力することで出品作業を完了できますが、この手間を削減する自動化技術の開発が求められています。そこで、我々はアップロードされた商品画像をクエリとして、商品を特定する画像認識技術の研究に着手しています。現在、画像領域分割を事前処理とし、認識に不要な領域を予め除去する手法を構築中です。研究成果は随時発表し、個人間商品取引サービスの利便性向上を支援しています。
深層学習を利用した悲鳴音声の強調とモバイル端末への応用
防犯・セキュリティ分野において、新たな犯罪防止・抑止技術が望まれています。現在主流のセキュリティシステムに監視・防犯カメラがありますが、人件費等の問題から常に監視することは稀で、単に録画しているだけの場合が多いです。そのため、犯罪発生後の捜査にとっては有効ですが、犯罪防止・抑止の効果としては限定的でした。このような背景から、当研究室では、音声を利用した新たな犯罪防止・抑止システムとして、人が発する悲鳴音声を解析し、それを自動で検知するシステムの開発に取り組んでいます。近年注目を集めている深層学習を利用し、雑音に埋もれた悲鳴音声から悲鳴のみを抽出し、悲鳴検出精度の向上を図っています。