Idein、AIモデル「CLIP」活用の画像解析アプリを提供–プロンプト入力で対象検出
今回は「Idein、AIモデル「CLIP」活用の画像解析アプリを提供–プロンプト入力で対象検出」についてご紹介します。
関連ワード (マーケティング、流通テック最前線等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
エッジAI開発プラットフォームなどを展開するIdeinは発表会を開催し、同社の取り組みを紹介するとともに、画像解析アプリ「CLIP on Actcast」の提供開始を発表した。
発表会に登壇したIdein 代表取締役/最高経営責任者(CEO)の中村晃一氏は「クラウドAIでは収集したデータをデータセンターに集めてAI処理を行うのに対し、エッジAIではデバイスや付近のサーバーで階層的にAI処理する」と説明した。エッジAIに注目が集まる背景には、「プライバシーの保護」「データセンター・通信インフラの負荷分散」「低遅延処理」があるという。
Ideinはビジョンとして「ソフトウェア化された世界を創る」を掲げており、中村氏は「世界をソフトウェアでアップデートし、変化に追従できるようにする。物理空間の物事は置き去りになりがちだが、ソフトウェアで柔軟にアップデートできるようにする」と語った。
Ideinは2020年からメイン事業として、エッジAI開発プラットフォーム「Actcast」を展開している。同プラットフォームは、監視カメラなどの映像データをAIで解析することで、映像内の人物や動物、車両などの情報を自動で抽出する。これにより、映像を確認する手間を軽減し、必要な情報のみを素早く集約することが可能となる。
例えば、ファミリーマートは同社店舗内で展開するデジタルサイネージメディア「FamilyMartVision」にActcastを搭載したAIカメラを導入しており、導入済みの店舗数は2200以上に上る。カメラ内部で映像を処理・破棄し、クラウドには広告の視聴率や来店客の年齢/性別情報などをテキスト形式で集約することで、広告の効果測定とプライバシーの保護を両立している。
Actcastは、AIデバイスソリューションの開発・拡張にかかるコストを大幅に削減する。AIデバイスソリューションの開発では従来、ソリューション部分を支えるインフラ部分の開発に数億〜数十億円規模の投資が必要だったが、企業は同プラットフォームを活用することで、差別化につながるソリューション部分の開発に集中できるという(図1)。
Actcastは、小売だけでなく、防犯、製造、広告、都市/交通など多様な分野で活用されている。Ideinは伊藤忠商事や清水建設、トヨタグループで自動車部品のサプライヤーであるアイシンなどとパートナーシップを締結し、事業を共創している。
今回提供を開始した画像解析アプリのCLIP on Actcastでは、クラウドと通信することなく、プロンプト(指示文)を設定するだけで任意の物体を分類できる。同アプリには、OpenAIのAIモデル「CLIP」(Contrastive Language-Image Pre-training)をIdeinのエッジデバイス「ai cast」に搭載している。CLIPは、2021年に発表されたマルチモーダルの基盤モデル。画像と言語のマルチモーダルな情報を同時に処理し、画像とテキストの関連付けを行う。
例えば、CLIP on Actcastを活用することで、工場の特定部品や店舗の特定商品などの数を集計可能。「作業者がヘルメットを着用しているか」「特定の場所にトラックが止まっているか」といった状態も分類できるため、リアルタイムな異常検知にも活用できる。