Juliusで文字起こしの環境を作ってみたけど、認識率がなかなか思わしくなくこれをチューニングするのはかなり大変そうだなと思えてきた。
そんな中、Google Document(以下、Google Docs)で文字起こしできるよと情報がいくつもヒットする。
設定は動画ファイルや音声ファイルから文字起こしをする環境を構築するのはこんな感じ。
ところで、Windows 10のバージョンが1903だと上記記事の通りにならない。1903以降だと「設定」─「システム」─「サウンド」の設定はスクリーンショットの通り。
Juliusでの文字起こし練習で作った記者会見の音声ファイルから文字起こしをすると、9割がた正確に文字起こしをしてくれる。
使い物になりそうということはわかったが、Google Docsからマウスフォーカスが外れると文字起こしが終わってしまう。これだと弊社でやりたいことには使えない。
ここで終わると面白くないので、苦手そうな歌詞の文字起こしをしてみることに。
ブログに貼る分は、歌詞の著作権が現存していると面倒なので童謡でやってみた。使ったのはAmazon Prime Musicのこれ。
オレが歌詞を知らない曲は困るので、「いぬのおまわりさん」「ぞうさん」「ねこふんじゃった」の3曲。
変換結果はこちら。「ねこふんじゃった」は猫しか聞き取ってくれないw
Google Docsはこんな感じで文字起こしをしていく。YouTubeにアップしようとしたら著作権侵害で公開をブロックされてしまったので、GIFファイルにした。
ということで、わりと歌詞が明瞭に聞こえる童謡でも歌詞の文字起こしには向かないという結果に。まあ、通常の話し言葉に合わせているはずなのでこれは仕方ない。
あと、もっと歌詞が聞き取りやすいかとこの曲もやってみた。
バリバリに歌詞の著作権がある曲なので変換結果はお見せしないけど、結構面白い感じになった。元の歌詞に無さそうな
富士急に頑張れ
というフレーズはどこから来たんだ?ww