いろいろやってみるにっき

なんとか自分の会社を立ち上げるところまで漕ぎ着けた、てきとーに生きている奴の日記

https化に伴い、表示できなくなっているリンクについて修復中。
2018年から遡って修正し、2015年分まで修正完了。


Google Documentで歌詞の文字起こしできるか

Juliusで文字起こしの環境を作ってみたけど、認識率がなかなか思わしくなくこれをチューニングするのはかなり大変そうだなと思えてきた。 

 


そんな中、Google Document(以下、Google Docs)で文字起こしできるよと情報がいくつもヒットする。


設定は動画ファイルや音声ファイルから文字起こしをする環境を構築するのはこんな感じ。


ところで、Windows 10のバージョンが1903だと上記記事の通りにならない。1903以降だと「設定」─「システム」─「サウンド」の設定はスクリーンショットの通り。

f:id:shigeo-t:20191209085713p:plain

 

Juliusでの文字起こし練習で作った記者会見の音声ファイルから文字起こしをすると、9割がた正確に文字起こしをしてくれる。

f:id:shigeo-t:20191209085916p:plain

 

使い物になりそうということはわかったが、Google Docsからマウスフォーカスが外れると文字起こしが終わってしまう。これだと弊社でやりたいことには使えない。

ここで終わると面白くないので、苦手そうな歌詞の文字起こしをしてみることに。

 

ブログに貼る分は、歌詞の著作権が現存していると面倒なので童謡でやってみた。使ったのはAmazon Prime Musicのこれ。

よいこの童謡ベスト from HiHiRecords

よいこの童謡ベスト from HiHiRecords

  • 発売日: 2017/01/16
  • メディア: MP3 ダウンロード
 

 

オレが歌詞を知らない曲は困るので、「いぬのおまわりさん」「ぞうさん」「ねこふんじゃった」の3曲。

f:id:shigeo-t:20191209090831p:plain

変換結果はこちら。「ねこふんじゃった」は猫しか聞き取ってくれないw

f:id:shigeo-t:20191209093005p:plain

Google Docsはこんな感じで文字起こしをしていく。YouTubeにアップしようとしたら著作権侵害で公開をブロックされてしまったので、GIFファイルにした。

f:id:shigeo-t:20191209093245g:plain

 

ということで、わりと歌詞が明瞭に聞こえる童謡でも歌詞の文字起こしには向かないという結果に。まあ、通常の話し言葉に合わせているはずなのでこれは仕方ない。

 

あと、もっと歌詞が聞き取りやすいかとこの曲もやってみた。

さくら(独唱)

さくら(独唱)

 

 バリバリに歌詞の著作権がある曲なので変換結果はお見せしないけど、結構面白い感じになった。元の歌詞に無さそうな

富士急に頑張れ

というフレーズはどこから来たんだ?ww