音声入力を便利にするアプリ「スピーチノート」を発見してから、音声入力どっぷりです。
しかし使う中でだんだん、音声入力の弱点がわかってきました。
Android(Google音声入力)の場合、残念ながら「話したことがそのまま文字に!」とはほど遠いのが実情。
とはいえ、いろいろ工夫することで実用レベルに持っていくこともできます。
そこで今回は、Androidスマホの音声入力で長文を効率よく書くコツを3つ共有します。
音声入力のクセや限界を理解すれば、今よりもっと効率よく執筆できますよ。
※「スピーチノート」アプリ経由でGoogle音声入力を使っている前提です
Google音声入力、3つの弱点
1 音声認識漏れ
あまり頻発しないと思っていた音声認識漏れが、長く喋っていると30秒に1回ぐらい起きます。
「なんだそのくらいか……」と思うかもしれませんが、実際に漏らされると結構なストレス。
特に誤変換の言い直しの時にやられると「テメエちゃんと言うこと聞かんかいコラ!」って気分になります。
2 避けられない誤変換
元々の認識精度は高いものの、どうしても避けられない誤変換があります。
たとえば、
- その誤変換→その後変換
- 点→10(テン)
のように、何回言っても直らないものがあるんです。
おそらく音声認識の技術的な限界なんだと思います。同音異字とかありますし。
3 専門用語や固有名詞の誤認識
一部でしか使われていないマニアックな専門用語や固有名詞も誤変換されやすいです。
- ドロイド会議2018(DroidKaigi2018)
- ベビーメタル(BABYMETAL)
- 粘着服バカ(粘着ブクマカ)
おそらくGoogle音声入力の辞書に載ってないだけかもしれません。
音声入力を効率良く使って長文をサクサク書く3つの工夫
認識漏れ、誤変換、専門用語や固有名詞……
これら弱点は、音声入力ソフト側だけではクリアできません。
なので、使う側が工夫しましょう。
まとまりごとにマイクを切る
音声入力の挙動を見てみると、入力時間が長いほど認識落ちが発生しやすくなっています。
おそらく、1回の入力で認識できる時間や言葉の数に限りがあるのでしょう。
そこで文の終わりや句読点を打つタイミングで一度音声入力をオフ→オンするようにしたところ、認識落ちの発生頻度が減りました。
残念ながら0にはならないものの、以前と比べるとはるかに少ないレベルです。
「スピーチノート」アプリならUI的にマイクのオンオフもしやすいので、息継ぎのついでに一度音声入力を切ると、ちょうどよく使えます。
言い直しは単語でなく「区切り」単位で
誤変換となると、どうしても間違えた1〜2文字だけ直そうとしてしまいがち。
しかしそこにワナがあります。1〜2文字だけ音声入力し直そうとすると、高い確率で誤変換してしまうのです。
「に」→「2」→違う!!……というプレイを延々と続けることになります。
そのため、音声で入力し直すなら、単語単位ではなく文節などの区切りのよい単位でやるほうが早いです。
「直す部分を小さくする」と無意識でやっている効率化は、音声入力の世界では非効率です。
手入力と音声認識を織り交ぜる
それでも直せない専門用語などは、素直に手入力を使いましょう。
音声入力を使っていると、どうしても「全部音声でやりきりたい!」と思いがち。
しかし、別に「音声入力縛り」にしなければならない理由はどこにもありません。
音声入力はあくまで文字入力のスピードを早めるツール。苦手な局面で無理に使うと、効率は逆に下がります。
専門用語、固有名詞、少ない文字数の書き直し、数字の入力など、誤認識率が高い部分は手入力しましょう。
両手フリック入力なら結構スラスラ書けますよ。
そもそも認識されない言葉は封印する?
音声認識されない
=一般的な言い回しではない
=読者にとって分かりにくい
……とするなら、認識されない言葉遣いを封印するのも手です。
あなたの言葉が認識されないのは、分かりにくい言葉や言い回しを使いすぎているからかも?しれません。
まとめ: 音声認識のクセを理解しよう
以上、音声認識をヘビーに使って分かった音声入力効率化のコツについてお話ししてきました。
今回はAndroidでのGoogle音声入力が対象なので、iPhoneのSiriでは少し違うコツが必要かもしれません。
もしもっと良いコツがあれば、ぜひ教えてください!