レコーダーアプリの文字起こし機能に期待! Google「Pixel 6」シリーズの音声認識機能を試す

拡大画像を見る

Googleが10月28日に発売した5G対応の新スマートフォン「Pixel 6」「Pixel 6 Pro」の音声認識機能をレビューにてご紹介します。

Pixel 6シリーズは、GoogleがPixelのために独自開発したシステムオンチップ(SoC)の「Google Tensor」を搭載。カメラや音声認識など、AIと機械学習を利用するPixelの独自機能をオンデバイス処理できるようになったのが特徴です。音声認識機能で大きく進化したのが、音声を記録するレコーダーアプリとリアルタイム翻訳機能。いずれも発売時点で日本語に対応しているのが嬉しいところです。

レコーダーアプリは、Pixel 4から音声を録音するのと同時にテキスト化して保存できる「文字起こし」機能が搭載されていました。ただし、この機能は英語のみに対応したもので、日本語音声では利用できませんでした。それがついに、Pixel 6から日本語の文字起こし機能に対応したのです。

ライブ配信番組「ガジェット通信 LIVE」で、ゲストに旅のサブスク「HafH(ハフ)」を運営するKabuk Styleの大瀬良亮代表を迎えた回を再生して、日本語の文字起こしに挑戦してみました。

旅のサブスク「HafH(ハフ)」って何だ!?特集 / ガジェット通信LIVE 第37回(YouTube)
https://youtu.be/NPEAMdKw_pM

レコーダーアプリを起動して録音を開始、「文字起こし」をタップして言語を日本語に切り替えると、音声を録音しながらPixel 6が認識した日本語をテキスト表示していきます。重要なポイントは、この処理はPixel 6がネットにつながっていない状態でも動作するということ。オンデバイスでAIと機械学習の処理を実行するので、オフラインでも文字起こしができるのです。

文字起こしした日本語の精度はまだ少し甘い部分もあるのですが、ゼロから書き起こす手間を考えると非常に助かる機能。記者や編集者に限らず、テープ起こしに苦労した経験がある人なら便利に思うのではないでしょうか。録音した音声を再生中に「文字起こし」をタップすると、しゃべっている単語をリアルタイムでハイライト表示してくれるので、間違って認識した個所も音声を聞きながら確認することができます。

英語の文字起こしは、既にほぼ完ぺきな精度。日本語の音声認識の精度については、今後アップデートで改善していく可能性もありそうです。

さらに、文字起こしで便利になるのが検索機能。録音した音声の中で、例えば「ウェブサービス」という単語が出てくる個所をキーワード検索で見つけられるので、確認したいトピックを抽出したり、また聞きたいときに重宝します。

録音内容は recorder.google.com のウェブサイトからPCやスマートフォンで確認できる他、音声やテキストをGoogleドライブやメールで簡単に共有が可能。音声がデータとして活用しやすい“超高機能ボイスレコーダー”と考えるだけでも、Pixel 6が欲しくなる人がいるのでは?

続いて、リアルタイム翻訳機能を見てみましょう。Googleアシスタントを起動して「英語の通訳になって」と話しかけると、音声をリアルタイム翻訳する通訳モードが利用できます。こちらは、聞き取った英語音声を文字起こしして、対訳となる日本語を表示しながら音声で読み上げる形で通訳になってくれる機能。長文で一気に話すのはまだ苦手そうですが、相手と顔を突き合わせながら会話する場合なら問題なく活躍してくれるのではないでしょうか。こちらもオフラインで利用が可能。ただし、オフラインでは話者が英語を話しているのか日本語を話しているのか、2種類のマイクボタンをタップして認識させる「手動モード」のみの対応となります。

日本語の音声認識は、Gboardの音声入力にも対応。マイクボタンをタップすると話した内容をテキスト入力して、「絵文字:大笑い」など絵文字の入力も可能になりました。「送信」「消去」「停止」といった、メッセージアプリやメーラーの音声操作にも対応します。

関連リンク

  • 11/4 20:00
  • ガジェット通信

スポンサーリンク

記事の無断転載を禁じます