音声認識が最近すごいぞ | セール情報大好き

音声認識が最近すごいぞ

どうもこんばんは、ポゴ廃になりかけてるオザキです。

今日だか昨日だか忘れてしまいましたが、Twitterの方でシェアした記事を読んで来るところまで来たなあという最近の感想です。これ↓

音声入力万歳

何を隠そう僕は結構音声入力信者ですが、音声入力はもうと本当に最近伸びてきていておりますね。
僕が注目していた2、3年ぐらい前よりも格段に精度も上がっているし日本語としても音声認識としてもめちゃくちゃ使いやすくなっています。
あんまり使ってないという人はiPhoneじゃなくてAndroidも買って使ってみてください。僕は2台(以上)持ちです。

1、2年ぐらい前の話で恐縮ですが、ブログを書くときも最近はアルゴリズム的には音声入力のような平坦な単語で、あまり難しくない単語を使って書いているブログの方が伸びるっていうことが聞いたことがあります。
もしかしてこれは時代のトレンドになっているのかもしれないということを思い出しました。

Google検索が簡単な方がいいとは、やはり英語圏のトレンドなのですかね。
英語はグローバルな言語なので色々な人が英語を喋っています。
ネイティブスピーカーは実際はあまり多くありませんということもあり、英語を喋ると言っても本当に簡単な単語を使って喋る人が多く、あまり難しい単語を使っても伝わらないことが多い気がします。
イキって複雑な単語を口語で使うと痛い目を見るときがあるとかないとか。

こういう事実を踏まえて考えてみると、英語というのは難しい単語を書いて小難しい感じの記事にしているという場合よりも、平坦で簡単な単語を使って分かりやすく書いていく方が求められているということになります。
まあおそらくこれは分かりやすく相手に伝えるというのはグローバルなトレンド(特にビジネス)であるとは思いますが、それが Google の検索結果などにも使われているというのは結構驚きであるし納得もいくような気がしますね。
それが日本のブログ系の記事でも反映されているっていう感じでしょうか。

もし僕の最近のブログの記事を読んでいただいて、読みやすい!簡単に読める!と思っていただいている方がいらっしゃいましたら、おそらくそれは文語ではなく口語で文字を書いているからだと思います。
捉え方によってはすごく読みづらい、冗長な記事になっているかもしれませんが、そこはご了承くださいませ。
実際に現在この機器も音声入力で80%か90%ぐらいは書いているという感じですね。
改行などはまた別にキーボード使ったりしてます。

Androidの音声認識は群を抜いているのと、Microsoftもなかなかすごいよ

少し話は逸れましたが冒頭の音声入力の記事でもありましたが、最近Twtich上の広告でも散々流れているGoogleのPixel 6で使われている音声入力はすさまじいものがあります。
特に自動音声認識&翻訳は本当にすごい。ここまで来るか。(ただし言語を知らなくていいということにはまったくならないんですけどね。あくまで補助)
そして上記の記事中にもあったiOS のアプリのGroupで使われているこのGroup TranscribeのMicrosoftのアプリも少し使ってみましたがこれまた技術がかなり高く、どんどん日本語を読み取っていくことができました。
これはなかなかすごい。
暇があれば皆さんも試してみてくださいな。

Group Transcribe

Group Transcribeすごいよ

面倒くさいは新たなイノベーションのはじまりかもしれない

音声入力の需要が高まっているということと、AI の技術が伸びているということはとてもわかるのですが、音声認識が伸びていく背景には、本質として「キーボードを叩いて文字を打つ」というのは割と非効率(というか面倒くさい)なのではないかなと、考えようによっては考えることもできます。

僕は新卒で社会に出たころは10人に1人ぐらいはキーボードを叩けなくてフリック入力しかできないと言う人もいました。
それは割と遅れているとかキーボード入力ができなくてダサいとかではなく、考えようによっては時代の最先端をいっているような人なのかもしれないと思うこともできます。
そして、最近の大学生とかで聞くのは、キーボード入力はせずにフリック入力で論文を書いていくという学生がいるというのを聞いたことがあります。
そのうちそこをすっ飛ばして、フリック入力すらせず音声入力で書いていくという未来も割となくもないなーと思います。

こういうイノベーション的なことが起きる時っていうのは、必ず誰かめんどくさいなあと思うことがあったりして、そこから伸びていくことが多々あると思います。
人間の仕事が産業革命以後、機械化していったの人間が仕事をするのが面倒くさくて機械に任せた方が早く進むし、正確に進むということもありました。
車も馬車を使うより車の方が正確だし疲れないし、言うことを聞くと面倒くさいことを省いてくれたから普及したということもあげられるかもしれません。

最近で言うと、アフリカだともはやパソコンすら使わず携帯でスマホでの送金なども出来るし、かなりモバイルの文化が進んでいるということを聞いたことがあります。
これはお金の現物の管理が面倒くさいし、安全性利便性などが影響しているとは思います。
何かイノベーションが起きる時には何かをショートカットしたり時間を短縮するなど、そういった経緯がありますね。
もしかしたら最近の若い人たちがキーボードで入力するのを面倒くさがるのは、音声入力のイノベーションになったりするような気もしますし、ならないかもしれません。
そこはわかりませんがもしかしたらわくわくするようなことがその面倒臭いから発生するかもしれません。

人間の本質はもしかしたら面倒くさいことを省くことが未来へのイノベーションにつながっているのかもしれません。
ということで今日も皆さん色んな事をめんどくさがりましょう。
そしてキーボード入力よりも音声入力を使って仕事をする日が来るかもしれませんよ。
一旦長い文章は音声入力でだらだら書いてその後下書きだけちょこっと編集するのをキーボードでやるみたいな感じですかね。
今のうちに慣れておきましょう。

というところで、だらだらした文章でしたが読んでいただいてありがとうございました。

スポンサーリンク

シェアする

  • このエントリーをはてなブックマークに追加

フォローする