
画像認識は、人工知能(AI)の発展によって複雑で精度の高い識別ができるようになっています。そのため、AIブームを機に、画像認識を使ってみたいという方もいるでしょう。しかし、基本的なシステムの仕組みや、画像認識に使えそうなサービスをよく知らないかもしれません。そこで、今回は人工知能(AI)を使った画像認識の仕組みやできること、3つのサービスなどをご紹介します。
▼もしAIを使った開発を検討している場合は、Automagica Labで無料の開発相談をしてみませんか?
目次
人工知能(AI)を使った画像認識の仕組み
人工知能(AI)には、最新の技術を使った画像認識の仕組みがあります。利用を始める前に、基本的な知識として歴史や仕組みを押さえましょう。
画像認識の歴史
人工知能(AI)を使った画像認識は、元々は1940年代に登場した「バーコード」が始まりです。日本では、1978年に店のレジなどで導入されて普及します。バーコードは商品の金額や識別番号などの情報があり、それを画像認識で読み取ることができます。
次に出てきたのが、画像認識の方法で共通認識となった「テンプレートマッチング」です。テンプレートマッチングは、画像の中に同じ物体があることを探す画像認識の方法で、探索する対象を指定し、元の画像と比べて画像の場所を特定します。しかし、この方法では写真の光加減や誤差によって人工知能(AI)が判断を間違うことも珍しくありませんでした。
最後に、2012年に脚光を浴びたのが「ニューラルネットワーク」を活用する方法です。現時点では、画像認識として最先端の技術を意味します。人間の脳を模範して、ニューラルネットワークの仕組みを応用した機械が自ら学習する方法です。これを活用して、精度の高い画像の識別ができるようになりました。例えば、防犯カメラやロボット動作の視覚処理などに使われています。
画像認識の仕組み
画像を認識する仕組みは、人工知能(AI)が取り込んだ画像を識別し、写っているものの特徴を捉えるというものです。その際に、画像の特徴量をもとに、類似している画像を判断することができます。判断に人の手は入っておらず、可能性の高いものから自動的に決定します。
ただし、画像認識の精度を上げたいからといって、人間は判断の過程をチェックすることはできません。人工知能(AI)内部はブラックボックスとなっており、精度を上げたいときは出力された結果からAIのパラメーターを開発者が変更する必要があります。画像認識の精度を上げるためのトレーニングも、人工知能(AI)内部の仕様を変更せずに、調整することが求められるでしょう。そのため、画像認識を使いたいときは、後ほどご紹介する専門的な知識・技術が必要ないサービスがおすすめです。"
画像認識を使ってできること
画像認識は、その技術でできることが多々あります。
翻訳
画像と聞くと、イラストや絵を思い浮かべる人もいますが、写真や画像の中に文字が含まれていれば、その形や特徴から文字を読み込んで翻訳することができます。例えば、Google翻訳は画像から文字を読み取り、翻訳することができます。スマホに文字入りの画像があれば使用でき、テキストデータである必要はありません。発音も読み方もわからない外国語を手早く翻訳する際は、大いに重宝するでしょう。
画像検索
画像認識を使うことで、画像検索が可能になります。検索エンジンでは現在、画像検索のメニューが検索用のGoogleブラウザに組み込まれています。画像検索の特徴は、手元の画像から類似した画像を探し出して、検索結果として表示されることです。例えば、名前や名称のわからない人物やモノ・製品があった際に、テキストで打ち込める情報がなくても画像認識の機能で探し出すことができます。
もちろん、正確に情報を探し出すためには特徴がはっきりした写真が必要です。また、検索エンジンの画像に登録されていない画像は調べることはできません。ネット上に画像がない個人の写真を検索しても、出てくるのは他人の人物画像だけです。しかし、キャラクターや有名な商品の画像なら、画像検索を使って一瞬で探し出すことができます。ただし、画像認識は写真の中の対象を人間のように理解しているわけではありません。特徴量の近いものから似たものを表示しているに過ぎないと考えましょう。
在庫管理
物流業界では、画像認識を在庫管理に使用するケースもあります。在庫はバーコードでの管理が増えており、画像認識の基本的な技術が使われているのです。バーコードをハンディターミナルのデバイスを使って一度読み込むだけで、在庫がどこにあり、何個が発送されたのか、リアルタイムな管理ができます。
また、インベントリー(棚卸し)の際に写真を撮ることで、何がどのくらいの在庫があるのか判断する在庫管理への活用の仕方もあります。在庫管理では年度末や一定期間ごとの在庫チェックが発生し、それには人の手による作業が行われるでしょう。その手間を人工知能(AI)なら減らすことができ、業務効率化や人件費削減ができます。
自動運転
画像認識の活用は、自動運転の技術にも使われています。自動車や電車の運転は視覚情報から安全を確認して、人の手で乗り物を発進・停止させるのが基本です。自動運転では、人工知能(AI)が映像を画像認識で自動的に識別・判断します。画像認識と同じ仕組みが使えるのは、目の前の状況を画像として捉えているためです。
しかし、自動運転の技術はまだ未完成で、完全な自動化は実現していません。自動運転の実現範囲は、全部で6つあるレベル0~5の中のレベル3(条件付き自動運転・限定領域)までとなります。ドライバーが監視の中で範囲を制限する必要があり、これらを限定しない完全な自動運転には安全上のさまざまな課題が残されています。
画像認識を提供するサービス
ここでは、ディープラーニングの技術で提供されているクラウド型の画像認識サービスを3つご紹介します。
Google Cloud Vision API
人工知能(AI)のサービス開発に力を入れているGoogleの画像認識サービスには「Google Cloud Vision API」があります。Vision APIと省略して呼ばれることもあり、商品のラベルを画像から識別したり、表情を読み取って防犯カメラなどの分析・検知が得意なシステムです。例えば、機能には画像の切り抜きや文章抽出があり、さらに看板の文字や場所の識別もできます。
Amazon Rekognition
大手ECモールのAmazonが提供している画像認識のサービスが「Amazon Rekognition」です。主に、静止画像や動画をもとに人物や顔、シーン、物体、文字などを判別します。一定の特徴があるものは、人工知能(AI)が自動的に判断します。サービスの使い方としては、防犯や安全確認、人物探し、顔や表情分析などです。専門の知識や技術がなくても扱えるため、APIを活用した導入が簡単に行えます。
Azure cognitive services
対話型AIで有名なMicrosoftの画像認識サービスには「Azure cognitive services」があります。視覚情報の分析を得意としており、その場の映像分析や空間内の動きの判別、シーンの説明などが可能です。顔検出も可能となっており、その上で画像の保存ができない仕組みです。そのため、プライバシーの保護にも配慮しています。
画像認識を使いたいならクラウドサービスを利用するところから始めよう
人工知能(AI)による画像認識の仕組みはバーコードから始まり、ディープラーニングの登場から精度の高い技術としてAIの可能性を広げました。画像認識は、画像検索や在庫管理、自動運転などさまざまな場面で有効に活用されています。導入したい方は、活用方法を押さえた上で、クラウド型の3つの画像認識サービスを検討してみましょう。