G1ラボ - デジタルマーケティングを研究する為の備忘録

これからのデジタルマーケティングは技術と方法に加え、OfflineとOnline、HardwareとSoftware。6軸+αの時代を生きるデジタルマーケッター

認識が広げるロボティクス

人間の代わりをする為にロボットが必要としている技能は色々ありますが、その根幹をなすものは「認識技術」でしょうね。特に早くから開発が始まっているのが下記の2つ。

音声認識

・画像認識

音声認識は今から15年前、実際にそのソフトウェアの開発現場にいました。当時、エンジニアの人が徹夜でプログラムを組んで翌朝テスト、しかし認識失敗!で切れる!という様子を何度も見ていました。難しいんですよ。音声認識って。声の高低で認識が異なる時代だったのです。そして日本語の場合はアクセントが違えば意味も違う言葉がありますよね。例えば「橋」「端」「箸」。本当にやっかいなんですよ。あれは。

「箸が落ちた」と言えば「橋が落ちた」となる。とてもじゃないけど音声認識入力で新聞なんか書けないねと。そこで考えたのが前後の文章。今でこそディープラーニングなどでご飯に関わる話と判断すれば箸となるけど、当時は本当に大変で。でもそのロジックは今の音声認識の基礎につながっていて、エンジニアの皆さんの血の滲むような努力によって、今ではコールセンターのオートメーション化ができるほどの優秀な音声認識ができあがりました。

画像認識も同じです。Facebookを使っていればわかると思いますが、ものすごい精度の高い顔認識技術があります。しかしあれも、バーコード認識の頃からのエンジニアの努力の賜物です。直線が読めた!曲線が読めた!複数の情報の組み合わせが読めた!と、初期の頃は1つ1つ階段を上がっていたのですね。今、画像認識でARにも関わっていますが、ARの画像認識型の機能は、ある領域においてどれくらいの割合が一緒かという認識基準で判断をするわけです。そう考えると画像認識技術はフレキシブルかつ「大人になったな」と思います。意味わからないか。

 

でも最近ではその2つだけではなく、嗅覚認識の開発が進んでいるようです。凄いですよね。嗅覚ですよ。くさいとか、いい匂いとか。想像しただけで凄い。そして何が凄いってやっぱり人間の能力。五感と共に各種認識を装備してしまっている。ロボットが人間を抜くのはいつなのかな。

 

これらの認識技術を例えてみるとこんな感じ。

 

音声認識を搭載したロボットが対応できる指示は

「ビールちょうだい」

 

音声認識と画像認識を搭載したロボットが対応できる指示は

アサヒビールちょうだい」

 

音声認識と画像認識と嗅覚認識を搭載したロボットが対応できる指示は

「フルーティな香りのするベルギービールちょうだい」

 

そして更にそこに温度認識ができるロボットだと・・・

「キンキンに冷えたフルーティな香りのするベルギービールちょうだい」

 

うはっ!

 

やはり各種の「認識技術」はコンシェルジュ型ロボットに向いてるのだなと思います。ミスしたら笑ってごめん!の笑顔機能をつけておけばALL OK。

 

 

・・・と今日、画像認識エンジニアと雑談した中で盛り上がった話題でした。僕らはこれから全て認識するものを開発しようかなって思っています。遠い先の話かもしれないし、明日の話かもしれない。でも、面白いんですよ。認識って。

 

これらの認識技術が電気信号に変換できて脳にリンクできれば痴呆症などの物忘れに関わる症状や病気に対する対応策になるかもしれないからね。妄想を考える事は止めちゃいけないわけです。