Camtasia (Windows): Microsoft 音声認識エンジンの設定方法 (キャプション/字幕の音声入力)

Camtasia Studio 7.1以降では、Microsoft音声認識エンジンを利用して音声入力と呼ばれる新機能を追加し、音声をキャプションへ変換できます。

参考) 音声入力でキャプション(字幕)を作成する方法については、チュートリアルの「キャプションシリーズ」から「音声入力」のビデオをご参照ください。

以下は、最適な音声入力を得るための Microsoft エンジンの設定方法です。

インストール

Windows 7 / Vista

Microsoft 音声認識(スピーチ)エンジンは、OSの一部として搭載されているので、改めてインストールする必要はありません。Camtasia Studio 7.1 をインストール後、音声認識機能が使用可能です。

使用できる言語:

  • 英語(米国、英国)
  • ドイツ語
  • フランス語
  • スペイン語
  • 日本語
  • 繁体字中国語
  • 簡体字中国語

Windows XP

Windows XPでは、音声認識エンジンがデフォルトでOSにインストールされていません。しかし、MS Office XP以降がインストールされていると、Officeアプリケーションでインストールされている可能性があり、その場合は、Microsoftのサイトに従って音声認識エンジンを起動し、Camtasia Studio(およびその他のアプリケーション)で使用します。 

 参考) Windows XPをご使用で、日本語版Office 2003 CD-ROMがお手元にある場合は、音声認識エンジンのバージョン6.1 をインストールできます。

Windows XPでOfficeがインストールされていない場合は、Microsoftのサイトから 「SpeechSDK5.1.exe」、および「SpeechSDK51 LangPack.exe」をダウンロードする必要があります。

SpeechSDK 5.1のインストール方法

  1. ダウンロードして解凍し、setup.exe を実行します。
  2. インストールウィザードに従ってインストールします。
  3. インストールが完了したら、Windowsの[スタート] > [コントロールパネル] > ([サウンド、音声、およびオーディオデバイス]) > [音声認識] > 認識タブの[言語]で [Microsoft English Recognizer V5.1] が選択されているのを確認します。

SpeechSDK51LangPack.exeのインストール方法

  1. ダウンロードして解凍し、setup.exe を実行します。
  2. インストールウィザードのSetup Type画面で、[Custom]を選択します。
  3. Custom Setup画面で、必要でない[Simplified Chinese engines] で [This feature will not be available] を選択します。
  4. ウィザードに従いインストールが完了したら、Windowsの[スタート] > [コントロールパネル] > ([サウンド、音声、およびオーディオデバイス])> [音声認識] > 認識タブの[言語] で [Microsoft Japanese Recognizer V5.1] が選択されているのを確認します。

使用できる言語:

  • 英語(米国)
  • 日本語
  • 簡体字中国語

音声認識エンジンを正しくインストールすると、Camtasia Studioで音声入力機能を使用することができます。

 

コンピュータのボイストレーニングとマイクの設定


音声録音をより正確に音声入力するには、音声認識ソフトウェアにより提供されているボイストレーニングチュートリアルを行うことをお勧めします。
音声をディクテーションするために、ご使用のパソコンをトレーニングしてマイク設定をすることを奨励します。パソコンのトレーニングを行うと(約4時間が目安です)、再度トレーニングする必要はありません。
トレーニング情報のプロファイルは、エクスポートしてインポートすると、別のログインや別のコンピュータで再度使用できます。ユーザーは、各ログインで 1つ以上のプロファイルを持つことができます。
したがって、ご使用のコンピューターに他の人のプロファイルファイルをインポートしておくと、その人が録音した音声ファイルを文字に書き起こすことができます。ただし、現在は、複数のプロファイルを同時に使用できないため、音声ファイルに複数の人の音声が録音されている場合、ひとりの人のプロファイルを使用してもあまり役には立ちません。

Windows 7 / Vista 音声プロファイルは、次のツールにより管理できます: http://www.microsoft.com/en-us/download/details.aspx?id=16296

Windows XP 音声プロファイルは、次のツールにより管理できます: http://www.microsoft.com/en-us/download/details.aspx?id=22358

 

音声認識エンジンの精度を高めるヒント

 

  • できる限り最も性能の良い認識エンジンを使用します。たとえば、Windows XPでは、一般にデフォルトになっているMicrosoft音声認識エンジンのバージョン5.1ではなく、Microsoft音声認識エンジンのバージョン6.1を使用します。
  • 音声認識の精度はトレーニングとオーディオの品質により良くなります。最もよい精度を得るには、4、5 時間のトレーニングが必要とされています。使用しているコンピュータをトレーニングすればするほど、精度が良くなります。コンピュータをトレーニングするには、Camtasiaからアクセスできます。
    Camtasiaのメイン画面 > [ツール] > [スピーチ] > [スピーチのプロパティ] > Windowsの[音声認識のプロパティ] > [プロファイルのトレーニング] をクリックしてWindowsで行います。
  • 専門用語など普段一般にあまり使用されない用語などは、ユーザーの辞書にテキストの単語と発音された単語をコンピュータに学習させることで追加できます。(たとえば、あなたが "カムタジア" とどのように発音するかをコンピュータに認識させるために、はっきりと発音して学習させます。)辞書に追加するには、Camtasiaからアクセスできます。
    Camtasiaのメイン画面 > [ツール] > [スピーチ] > [音声入力の向上] > [辞書への語句の追加を開始する]をクリックして行います。
  • 音声認識エンジンには、サンプルモデル、音質設定などはありません。
  • 良い品質のマイクを使用してマイクの設定を正しく行ってください。
    [スピーチのプロパティ] > Windowsの[音声認識のプロパティ] > [マイクの構成] をクリックしてWindowsでマイクの設定を行います。
  • 音声認識のために正しいトレーニングプロファイルを使用します。
  • 静かな場所で通常の話す速度で、ご自分の音声を録音、またはディクテーションします。
  • ご自分のアクセントに合う音声認識エンジンを使用します。(たとえば、米国の英語、または英国の英語をトレーニングする場合)

英語以外の言語の場合は、MS Language Packのインストールが必要な場合があります。

 

役立つ情報


Windows XP サポート: http://support.microsoft.com/ph/1173#tab0kb/306537

Microsoft Speech API: http://en.wikipedia.org/wiki/Microsoft_Speech_API

 

 

 

 

203729278

 

 

この記事は役に立ちましたか?
0人中0人がこの記事が役に立ったと言っています