AIで文字起こしするGoogle Pixel6って実際どう?【メリットやデメリット】
先日、Google Pixel6の文字起こし機能を使って書き起こされた原稿の手直しをする案件を経験しました。
AIの音声認識技術って実際のところどうなの?
という疑問について、文字起こし屋の端くれの個人的な感想を踏まえてお話しします。
AIで文字起こしするGoogle Pixel6って実際どう?【メリットやデメリット】
AIのGoogle Pixel6の文字起こし機能のメリット
タイピングの労力が要らない
一から人間の耳を使って起こす場合、万年肩こりになってしまうほどかなりのタイピング労力が必要です。
ところが、Google Pixel6の文字起こし機能はかなり高い精度で自動的に書き起こしてくれるので、タイピングによる万年肩こりとは無縁になれそうです(笑)。
音声がクリアであればあるほど手直しが要らないぐらい自動で書き起こしてくれます!
複雑な音はまだ厳しいけれど、オーディオブックのようにクリアではっきりとした話し方で録音されたものであれば、Google Pixel6の文字起こし機能を使ったほうが効率的に起こせます。
AIのGoogle Pixel6の文字起こし機能のデメリット
①複数の話者を区別する想定をしていない
Google Pixel6の文字起こし機能は、話者を区別することができないので、話者が替わってもそのまま続けて書き起こされます。
なので、話者を区別する必要がある場合は、人間による大量のチェックと手直しが必要になってしまうので、逆に不便です(>_<)
②Okoshiyasu2など音声再生ソフトが使えない
今回、私が受けた案件は、Google Pixel6でつくられたテキストをGoogleアカウント上で編集するというものでした。
文字起こしを仕事としている多くの人は、Okoshiyasu2のような一時停止、再生の機能が搭載された音声再生ソフトを使用していると思います。
ところが、今回の案件はGoogleアカウト上で編集するため、Okoshiyasu2のような音声再生ソフトを使用することができませんでした。
Google Pixel6で録音した音源をダウンロードできれば、一時停止や再生機能がついた音声再生ソフトを使って効率良く手直しすることができるのですが、今のところ、Googleアカウントから音源をダウンロードする方法が調べきれておらず、その解決法がわかりません(>_<)
※Google Pixel6で録音した音声をダウンロードして、Okoshiyasu2などの音声再生ソフトが使用できる方法をご存知の人がいれば、ぜひ教えてください<(_ _)>
結論として、今回、私が受けた案件のような場合は、音声再生ソフトが使えないという点から、自分の耳で聞いて起こしたほうが速い!と思いました。
まとめ
Google Pixel6の文字起こし機能を使って書き起こされた原稿を手直しするという案件を経験したので、AIによる音声認識機能について一文字起こし屋としての観点から個人的な感想をご紹介しました。
今回、私が経験した案件は、Google Pixel6で録音された音声をGoogleアカウント上で編集をするというものでした。
Googleアカウント上では、Okoshiyasu2のように一時停止して再生するという文字起こし独特の作業ができるような機能はないので、私が今回受けた案件の場合は逆に大変です。
まだ調べきっていないのでできるかどうかはわかりませんが、もしもGoogle Pixel6で録音した音声をダウンロードすることができるならば、Google Pixel6で起こした原稿をOkoshiyasu2などの音声再生ソフトで人間が手直しするだけでよくなるので、Google Pixel6の文字起こし機能は、文字起こしを仕事にしている人にとって大きな助っ人となるありがたいツールだと思います。
また、最近では、中国の検索エンジン「百度(バイドゥ)」から文字起こしイヤホンなんていうものも登場しています。
アプリと連動させれば編集も可能です。
今回、Google Pixel6関連の仕事を受けてみて、文字起こしの仕事におけるAIの音声認識技術についてはまだまだ人間の力が必要だなと思いました。
でも、それと同時に、将来はもっと精度の高い技術が開発されていくだろうと思ったので、これからもAIの音声認識技術に注目していきたいと思います。
あわせて読んでほしい記事