情報通信 医用生体工学(脳科学 音響心理学 神経生理学 音声工学) 録音・再生 サンプリング 音響 音声 抽出 合成 検索 認識 補聴 集音器 話速変換 もし小学生にこう問いかけられたら、答えられますか。「音声と物音の違いはなあに?」違いを分ける音声信号の正体は、実はまだわかっていません。本研究は、人の喉笛で作られたただのうなり声が、音声として知覚されるメカニズムを紐解くものです。脳が認識するのは音声波形の中のごく一部の情報。計測した音声波形から、音声として知覚されるための最小限度の構造(=音色の設計図)を導き出します。広大で未だ手つかずの音響・音声機器市場の開拓を推進することが可能です。 音には「大きさ」「高さ」「音色」という3要素があります。「大きさ」と「高さ」は振幅と周波数で表せますが、「音色」を表現し制御する手段はまだありません。小鳥のさえずりや人の声色を伝えるには、録音して聞かせるしかないのです。音色の特徴を1枚の紙に書く=「音色の設計図」を作ることができて初めて、音色の違いを目で見て確認できるようになります。コンピュータを使って良く似た声色の人を探し出したり、声色を改造するといった応用にもつながります。人は耳の中で音を大きく低音、中音、高音に分けています。音の波形(白線)の中で、黄色の丸印で示した山と谷を記録することが第1歩です。黄色の丸印の中で、人の脳が音色として認識する情報は、ごく一部。認識に必要な最小限の黄色の丸印だけを選び出した後に、黄色の丸印同士をつないでやると、元通りの音色を再現することができます。また黄色の丸印をピンセットでつまんで、赤い線で示すように修正すると、音色を改変する事も可能です。この手法を活用すると、人の聴覚機能を実現するロボットの耳(人工知能)が開発できます。ありとあらゆる雑多な生活雑音を、これは大事な音、これは知人の声、これは不明音、これは要注意音、これはペットの鳴き声と大きく分類してくれたら便利です。音声によって、過去の膨大な出来事を、映像よりもすばやく検索することも可能になります。現在のコンピュータの処理能力があれば、どんな小さな情報端末にもこの機能を組み込めるはずです。音響機器や医用機器を始めとする幅広い音声ビジネスへの応用が考えられます。 1.好きな人の声色で音声合成(プライバシーを保護した中立音声(*)の合成)音声圧縮音響情報抽出音色や声色の設計図を作成声紋分析感情推定ストレス推定声帯の病変推定2.音響検索(ボイスレコーダへ搭載)音響イベントの可視化音響による見守り(映像を補完)3.集音器音声強調騒音下補聴声質変換話速変換(ゆっくりはっきり携帯電話へ搭載)4.効果音発生音響ベース管理(音色に番号)モーフィング(他人の声色から知人の声色へ)*話者を特定できないように合成した中立・中性・平均的な音声 ●『ソフトなサイエンスで学ぶ先端科学』バイオメディカル・ファジイ・システム学会編日本理工出版会ISBN97848901991122009●音響情報の抽出方法特許第3682539号2005年●周波数解析装置特許第2988914号1999年 音を独自の方法で解析し「音色の設計図」の作成に成功しました。音声の操作、検索、創生に応用できます。幅広い音響・音声ビジネスに展開が可能。企業や研究者との共同研究による、新たな用途の開拓も期待しています。
PDFファイル:9-It-yoshida-eng.pdf