4. ハードウェア

4.1. サウンドカード

音声は比較的低い帯域幅を必要とするので, 中程度から高品質の 16 ビットサウンドカードなら使えるでしょう. カーネルでサウンドを有効にして 正しいドライバをインストールしなければなりません. サウンドカードについて のこれ以上の情報は http://www.LinuxDoc.org/ にある "The Linux Sound HOWTO" を見てください. サウンドカードの品質については精度とノイズの 影響について, しばしば議論がまき起こります.

最も綺麗な A/D (アナログからディジタル) への変換機能を持ったサウンドカードを 勧めますが, しばしばディジタルサンプルの明瞭さはマイクの性能に依存し, 周囲のノイズにはいっそう大きく依存します. モニタや, PCI スロット, ハードディスクなどからの電気信号的なノイズはふつう, コンピュータのファンや 椅子のきしむ音, 呼吸から聞こえるノイズに比べて小さなものです.

ASR ソフトウェアパッケージには特定のサウンドカードを必要とする ものがあります. 特定のハードウェアへの依存を避けるのは通常良いことです, なぜなら将来の選択肢を狭めてしまうからです. もし適切に動作するためには特別なハードウェアが必要となるようなパッケージを 考えているのなら, あなたは利益とコストを考慮しなければならないでしょう.

4.2. マイク

マイクの品質は ASR を使う上で重要です. 多くの場合において, 卓上マイクはこの使用法に向きません. 周囲のノイズを拾いがちになるので, ASR プログラムがうまく動作しないことに なります.

マイクをずっと持ちつづけているのは大変なので, ハンドマイクも 最善の選択ではありません. 周囲のノイズの量を抑えながら, 頻繁に話者が 変わる場合や認識装置に向って話すことがあまりない場合は (ヘッドセットを付け ることも選択できないとき) 最も便利です.

断然人気のある一番よい選択はヘッドセットです. それを使えば, いつもあなたの口もとにマイクを置いたままでも, 周囲の騒音を最小に抑えることができます. ヘッドセットはイアホンの無いものと あるもの (モノラルかステレオか) もあります. ステレオのヘッドホンを勧めますが, それは個人の好みの問題です.

$25 から $100 くらいで素晴らしい性能を持ったヘッドセット型マイクが買えます. http://www.headphones.com か http://www.speechcontrol.com から探してみてください.

レベルについての短かいメモ: マイクのボリュームを上げることを 忘れないでください. これは XMixer か OSS Mixer のようなプログラムを使って 行なうことができます, そして フィードバックノイズを避けるように使用する ことに注意してください. ASR ソフトウェアが自動調節プログラムを含んでいれば, それらを代りに使ってください, それらはその特定の認識システムに最適化 されています.

4.3. コンピュータ/プロセッサ

ASR アプリケーションはプロセッサの速度に強く依存することがあります. これは ASR では大変な量のディジタルフィルタリングと信号処理が 起こりうるからです.

CPU 負荷の高いソフトウェアと同じく, 速いほど良くなります. また, メモリが大きい程よくなります. いくつかの ASR は 100MHz と 16MB の RAM でも可能ですが, 高速で処理する (大きな辞書や複雑な認識スキーム, 高サンプルレート) には, 最低でも 400MHz で 128MB の RAM が良いでしょう. 必要とする処理性能の関係で, ほとんどのソフトウェアでは最小限の 必要条件が記載されています.

大規模の認識を行なうのに, クラスタ (Beowulf や他ものも) を利用することは 行なわれていません. 進行中や開発中のプロジェクトをご存知ならお知らせください. scook@gear21.com