0609 音声認識もここまで来たか、と



 難聴者の情報保償システムとして要約筆記とかパソコン筆記などのようにスクリーンに文字で投射する方法があります。究極の姿が音声認識でしょう。
 複数の人の話し言葉を完全自動で投射できるのが理想ですが、今のところ一人の人間に限ります。前もって特定の人の話し癖をパソコンに覚えさせる必要があるので、ぶっつけ本番とはいきません。

 私のパソコンはIBM製で、これを求めた7年前からVia-Voiceという音声認識のソフトがついていました。当時300問の例題を繰り返し繰り返し朗読してパソコンに癖を覚え込ますまで何時間かかったでしょうか。
 一発でOKが出ることもあれば、何度読み返しても「もう一度」もう一度」とやり直しを命じられるのでホトホト疲れました。敵もさすがで100問ごとに関所を設けて「嫌になったらここで止めたっていいよ」と誘惑してくれるのです。

 そうかと言ってそれに乗ると「認識率が落ちるなるけど、それでも良いか?」と説明書にチャンと書いてある。イジワルですね。で、気を取り直してトライを続けてどうやらゴールできました。
 耐え抜いただけあって、その結果は目を見張るものでした。しゃべる端から数秒遅れで漢字交じりの文字が現れるのは本当に面白い。当然のこととして同音異義語での文字化けはありますが、たいした数ではない。語り終わってから訂正するのが楽しいくらい僅かなものです。ウンノジュウザがサラリと海野十三と出たのには思わず喝采しましたね。

 結局のところ数時間を楽しく遊ばせて貰っただけで私は使いませんでした。私にはカナ入力でキーを叩いた方が速くもあり、性に合っていたからです。以後一度も使ったことがありません。
 話し癖を覚えさせる時間の短縮がこれからの勝負だな。当時そう思いました。あれから7年、新しいバージョンが次々と生まれているようで、さぞ進歩を見せているものと想像します。

 横浜に友人がおります。私とは逆に右が殆ど聞こえません。左が1000ヘルツで50dBくらい、8000ヘルツで100dBと言ったところで補聴器無しでも話が通じます。が、大事な場面では補聴器を取り出すようにしているそうです。
 その彼は永年かけて音声認識を徹底的に追いかけてきた人で「最近のソフトは演習時間が短くなって正解率も大したもんだよ」と誘ってくれるので拝見にでかけました。

 なるほど彼の言葉通り大したものでした。控え室で数分間演習できる余裕があるなら個人の講演などでは今すぐにでも実用になるでしょう。ドラゴンスピーチ/セレクト7と言います。詳しくは http://www.dragonspeech.jp18,900円は安いと思う。

 彼はなんとも親切な人で、一日おいてカタカナだけではどうなるか、分かち書きはどうするか、吹き込んで文字にしてメイルで送ってくれました。でも、あの程度の時間の遅れで漢字交じり文が出るのなら敢えてカナモジにこだわることはありませんね。文字化けを修正する係を一人配置するだけで十分です。

 となると益々複数の話し手による会議用が欲しくなりますが、これは夢ではなくて一千数百万円のお金を出す用意があるなら今でも可能だそうです。「宝くじが当たったら絶対買うんだ」彼は楽しそうに笑いました。

直線上に配置
 

中・軽度難聴者のページ へ戻る

 補聴機器勉強会 ホームに戻る