近年、AI(Artificial Intelligence:人工知能)を活用した画像認識ソリューションが話題となっています。

今回は、AIによる画像認識技術が可能とすることやその仕組み、顔認識技術や画像認識技術との違いや実際に画像認識技術が実生活の場面でどのように使用されているか、具体例を踏まえて分かりやすくご紹介します。

1.AIによる画像認識技術とは?

AIによる画像認識といっても、具体的にはどのようなことが可能なのかを把握している方はそこまで多くはないのではないでしょうか。

 

まず、AIによる画像認識とはどのようなものかを一言で言うと「画像内に何が映っているのかを把握することができる技術」です。

例えば、どこにでも存在するようなある街角を写した画像に、人間が何人映っているのかを把握するような技術はその一例です。対象物を画像内から検出し、その対象物が人間であることを特定するまでの流れに必要な技術が、AIによる画像認識技術であるといえるでしょう。

2.AIの人物認識技術の仕組みを解説

ここからは、AIによる人物認識とはそもそもどのようなものなのか、また、人物認識がどのような形で行なわれているのかについて、簡単に説明していきたいと思います。

2.1 AI人物認識とは

AIによる人物認識とは、ある画像に人物が映っていた場合、その存在を人物として把握する技術です。

先ほど例として挙げた、ある画像に人間が何人映っているかを認識していく技術などがその好例であり、ある街角の一定時間ごとの通行量を調べる場合などに広く用いられています。また、会社のオフィスの入口を移しているカメラの映像から人物を抽出し、来訪者を知らせるシステムなどにも応用されています。

2.2 AI人物認識の流れ

AIは、はじめから人間の特徴を把握しているわけではありません。そのため、何の学習も経ていないAIに人物の含まれた画像を与えたとしても、その中に人物が存在すると認識することはできません。そこで、AIによる人物認識を実施する場合は、まずは準備段階として大量のデータで学習を行なわせる必要があります。

 

人間はそれまで培った記憶や経験から、写真などの画像から人物や動物、物体を識別して把握することができますが、AIはそうではありません。そこで、まずはデータベースから大量に人間に関連した画像を与えて、人の姿かたちなどの特徴をAIに学習してもらうプロセスを踏みます。その結果、AIは人間の特徴を把握、理解し、同じような特徴を有する対象物を人物として認識するようになります。

 

近年、いわゆるディープラーニングと呼ばれる技術の革新的な進歩により、人物認識を含めた画像認識全体の分野は急速な進展を見せています。ディープラーニングの一例としては、「畳み込みニューラルネットワーク」と呼ばれる技術が挙げられます。この技術の特徴は、ピクセルで構成されている画像データをコンピュータが直接扱うことで、人間によってピクセルデータからベクトルデータへ変換する手間をかけず、ピクセルデータのままコンピュータに特徴を把握させます。

 

具体的には、フィルタを画像データに一部に施して演算を実施し、演算対象の領域をずらしながら同様の演算を行ないます。そうして画像全体に演算処理を行い、画像の特徴を抽出します。AIは画像の特徴を繰り返し抽出しながら対象物が人間であるかどうかを推測すると同時に正解のデータで答え合わせをしながら学習を繰り返し、その精度を高めていきます。

3.AIの人物認識技術と顔認識技術との違い

人物認識とよく合わせて紹介されるのが顔認識技術です。顔認識技術とは、画像や映像などのデータに撮影されている人物の顔から情報を自動的に把握し取得するシステムを指しています。例えば、ある人物の姿が画像データに存在していた場合、人物の顔から性別や年齢層、あるいはその時の感情など、ある人物をその人物たらしめている情報を取得するシステムです。

 

顔認識についても、AIにその識別ができるようにさせるプロセスは基本的に人物認識と同じです。特徴抽出を学習させるために大量の人間の顔画像をAIに与え、機械学習を行なわせていきます。学習が進展するにつれてAIは人間の顔の特徴を徐々に習得していき、初めは目、鼻、口などの基本的な人の顔の造作から、顔の特徴に則ったグループ化、ある画像同士を同一人物として認識するなど、高度な識別能力を身に付けていくようになります。

 

顔認識技術は、現在さまざまな場面で活用されています。例えば、カメラから得た顔の画像と元々AIに与えておいた顔のデータベースを照合して個人を特定する顔認証システムや街頭広告にカメラを設置し、広告へ視線を向けたり足を止めて見入った人物をAIで抽出します。広告へ興味関心をいだいた人物群の性別や顧客層、また、その広告に見入った時間や広告の箇所を分析するなどのシステムに応用されています。

 

よく混同されますが、人物認識技術と顔認識技術はその目的が異なります。顔認識技術は先ほど述べたような人物そのものの特定や固有人物の特定に用いられるため、後ろに顔情報のデータベースが存在していて照合を行います。一方で人物認識技術はAIが人間の存在そのものを感知し把握する技術です。画像のどの部分に人物が存在しているのか、画像内には何人の人物がいるのかなどの不特定の人物情報を取得・判断することに使われています。

4.AIの人物認識技術と画像認識技術との違い

画像認識技術も、人物認識技術と並んで注目されることの多い技術です。画像認識技術の対象範囲は、人物だけにはとどまりません。

例えば、ある画像に人物も含めて何が写っているのかを把握することを目的としています。

また、文字の形などを抽出し、記載された文字が何の文字であるのかを特定するような技術(OCR:Optical Character Recognition;光学的文字認識)も、画像認識技術の一つです。

 

最近は人間が手書きで記した文字を撮影するだけで自動的に文字起こしを行なったり、標識や本に書かれた文章を撮影するだけで自動的に翻訳を行なってくれるアプリケーションソフトウェアも登場していますが、これらも画像認識技術の進展とともに飛躍的な発展を見せています。

 

さらに、最近の自動車に多く登載されるようになった標識を検知して運転手に警告を発したり、自動的に速度を調整したりするシステムも画像認識技術によって培われたものです。そのほか、工業製品の不良品検知や、画像の色彩調整システムの実装なども画像認識技術の進展の賜物です。

 

この技術も、AIに大量のデータを機械学習させることで人間を含めたさまざまな対象の特徴を抽出、把握できるようにするプロセスが求められている点では、人物認識や顔認識技術とさほど変わりません。画像認識技術は、広い意味で人物認識技術も包含した概念であるといえるでしょう。

5.AI人物認識技術の活用例

最近急速に普及している好例が、自動車に登載された歩行者検知システムです。このシステムにはAIによる人物認識技術が存分に活用されており、自動車の周囲に歩行者が存在する場合にその位置などを検知し、運転手に警告を発するなどの形で知らせます。

以前は高級車にのみ実装されている装置でしたが、今では普及帯の価格の車にも数多く登載されるようになりました。

また、美術館や図書館、オフィスなどの各施設への入出場者の状況を把握するシステムにも、AIによる人物認識技術が用いられています。

監視カメラなどが撮影した映像の中から、一定時間ごとの来場者を画像認識技術によって把握し、その数を時間ごとに算出して入出場者数を記録するなどの目的でシステムが導入されています。

6.AI人物認識技術の活用サービス

ここまで、AIによる画像認識の概要やその仕組み、また、顔認識技術や画像認識技術との技術上の類似点や相違点、実際に私たちの生活の中でAIの画像認識技術が用いられている具体例まで含めて説明してきました。

皆様のAIの画像認識についての理解に、少しでもお役に立てたなら幸いです。

6.1Actcast

最後に、現在Idein株式会社が提供するIoTプラットフォームサービスである、Actcastについてご紹介いたします。

 

Idein株式会社では「実世界のあらゆる情報をソフトウェアで扱えるようにする」ことを目的に掲げ、そのためのIoTプラットフォームサービスとしてActcastを展開しています。

これまでのIoTシステムでは、振動や温湿度、スイッチなどの各種センサーに基づく比較的シンプルな情報をもとに認識を行なっていましたが、ActcastではAIによるディープラーニングを用いた画像認識技術などを用いて、より詳細で多彩な情報を取得可能です。その応用分野はセキュリティからサイネージ、店舗のマーケティングや在庫の管理、インフラ監視など多岐に渡ります。

 

Actcastの特徴はコストやリスクが低いことです。イニシャルコストやランニングコストが抑えめであることに加えて、遠隔操作によるデバイス管理や運用ソフトウェアの更新も可能となっています。そのうえ、プライバシーや機密情報に関連する情報も適切に扱えるシステムが実装されています。

 

株式会社INDUSTRIAL-Xでは、ホテル業や小売流通業などを中心に顔認証システムや顔認証体温管理システムの導入や運用およびそのコンサルティングを数多く手掛けています。当社で導入サポートしますので、お気軽にご相談ください。