こんにちは。Takitaです。
Audacityを利用してm4aの音声ファイルをwavに変換する
GoogleのCloud Speech-to-Textを利用する際にm4aがサポートされてないため、手動でwavファイルに変換してみたので手順をまとめておきます。
ドキュメント: Cloud Speech-to-Text - 音声認識 | Cloud Speech-to-Text | Google Cloud
$ gem -v google-cloud-speech
2.7.6.2
dmgからインストールします。
m4aをAudacityで読み込むにはFFmpeg libraryをインストールする必要があります。
すでにAudacityを起動している場合は再起動すればライブラリが読み込まれるはずです。
読み込まれない場合は、メニュー > 環境設定 > ライブラリから設定を確認してください。
ファイル > 開く > hoge.m4a を選択します。
sample_rate_hertz
に合わせて周波数を変更します。
今回は以下のオプションを利用しているので、44100に合わせます。
CONFIG = {
language_code: 'ja-JP',
sample_rate_hertz: 44100,
encoding: 'LINEAR16',
enable_word_time_offsets: true
}.freeze
最後に ファイル > 書き出し > WAV として書き出し からWAV形式で書き出します。
これでm4aをWAVに変換して文字起こしが可能になります。