動画ポータルサイト

フロー

2024

Tech Blog 「GigE Visionを使ってカメラ映像を4K60fpsで表示してみた!」【1月10日】

Tech Blog 「GigE Visionを使ってカメラ映像を4K60fpsで表示してみた!」で紹介しているデモになります。

10GigE 4K60fps Vision Camera Platform

  • 5Mpixのカメラからの高解像画像を、高速画像伝送GigE Vision® で伝送。4K60fpsの高速伝送を実現。
  • SLVS-EC IPと、GigE Vision IPをAMDのエッジAI向けKria™ K26 SOM に最適実装

1つのソリューションとして着目したのが、生産ラインでの活用をイメージした“FAカメラシステム”です。
OKIアイディエスは、マシンビジョン規格のひとつである「GigE Vision® IP」を保有しており、当時、AMD社がエッジAI向けに上市したKria™ K26 SOMに実装した実績があります。この時、入力系はWeb会議などで使っているUSBカメラ(FHD30fps)でしたが、FAラインをイメージし、4K60fpsのGigE Vision カメラシステムをAIエッジデバイスKria™ K26 SOM(System On Module)にて実現することに取り組みました。Kria™ K26 SOMを搭載したKria™ K260 ロボティクススターターキットには、多画素高速イメージセンサー向けの高速インターフェース規格であるSLVS-ECというインターフェースが搭載されています。そこで、同じくエコシステムに参画されていて、産業用イメージングシステムの開発から製造、販売を手掛け、SLVS-EC対応の5Mpixカメラと、SLVS-EC IP を保有されているCIS様とタッグを組み、推進し、完成させることができました。

2023

「Edge Tech+」【11月15日】

「Edge Tech+」にて展示させていただいたデモになります。

ご覧いただけたでしょうか?デモの内容をもう少しご説明します。

  • 入力:USBカメラの前で、「グー、チョキ、パー」を出していただきます。
  • 処理:ROS2(Robot Operating System)下で、AI推論処理部とロボットハンド制御部アプリケーションを分割
    入力した前記画像の「ハンドサイン分類」を実行し、ロボットハンド制御するためのPWM信号を出力
  • 出力:処理結果から、お客様に勝てるよう「ロボットハンド」に実装されているサーボモータを制御します。
    ⇒下記例では、映像入力が「グー」なので、勝つために「ロボットハンド」を「パー」の形にします。

構成図

「第4回AI・人工知能 EXPO 秋」【10月25日】

「第4回AI・人工知能 EXPO 秋」にて展示させていただいたデモになります。

「年齢推定AI」×モデル軽量化技術「PCAS」
今回のAI・人工知能EXPO向けに開発した新作のデモです。上述しましたが、「AIモデルの軽量化」は注目されており、当社も力を入れている技術になります。この「AIモデルの軽量化」の効果をわかりやすくお伝えするデモがありませんでしたので、オリジナルモデルとOKI独自のAIモデル軽量化技術「PCAS(Pruning Channels with Attention Statistics)」で軽量化を行ったAIモデルでの動作の“差”を体感いただきました。“差”を感じていただくには、やはり比較です。ということで、同じ構成のものを2つ並べ、AIモデルのみを変えました。モニター(左):オリジナルAIモデル、モニター(右):軽量化AIモデルです。

  • 入力:USBカメラから映像を取得
  • 処理:人物の年齢を推定するために、2つのAI推論を行っています。(今回、年齢の推定としては「顔」で判別)
    ①顔検知AI:映像データから、「人物の顔」であることを判別するAIモデル
    ②年齢分類AI:その「顔」データから、人物の「年齢」を分類するAIモデル
    • 海外の方々のデータで学習を実施。(結果、日本人はやや若く判別される傾向になっています)
  • 出力:前記処理を受けて、顔部分に年齢を表示(モニターに出力)

<結果>

「第1回ものづくりODM/EMS展」【6月21日】

「第1回ものづくりODM/EMS展」にて展示させていただいたデモになります。

今回の開発テーマは「じゃんけん」です。お客様と「じゃんけん」勝負するシンプルなデモを開発しました。

ご覧いただけたでしょうか?デモの内容をもう少しご説明します。

  • 入力:お客様にUSBカメラの前で、「グー、チョキ、パー」を出していただきます。
  • 処理:AIエッジ向け「Kria K26 SoM(AMD社製)」にて、入力した前記画像の「ハンドサイン分類」を実行
  • 出力:前記処理を受けて、下記2つの出力を出しています。

出力1:「ハンドサイン分類」した結果をモニターに出力。
⇒お客様が出した手(「グー、チョキ、パー」)をAI推論、つまりAIで予想した結果を表示します。

出力2:「ハンドサイン分類」した結果から、お客様に勝てるよう「ロボットハンド」を動かします。
「KR260」にてPWM制御を行い、「ロボットアーム」のサーボモータをコントロールします。

G7群馬高崎デジタル・技術大臣会合 「デジタル技術展」【4月28日】

G7群馬高崎デジタル・技術大臣会合 「デジタル技術展」にて展示させていただいたデモになります。

「AIエッジ向けSOM(System On Module)を活用したカメラ-スマホソリューション」と題し、USBカメラから取得した映像に対し、小型エッジデバイス(Kria K26 SOM)にてAI処理、画像処理を行い、その結果をスマホで見ることができるデモを展示いたしました。


全体映像


スマホでの映像

「ぐんまDigital Land」【3月21日】

「ぐんまDigital Land」にて展示させていただいたデモになります。

オートモーティブワールドに出展した「物体検出」のデモをブラッシュアップしました。
「特定の物体」を検知するデモは、良く見かけます。そこに、「領域を設定」し、その領域内に「特定の物体」を検知したら、〇〇させる。という、異常検出系のシンプルなコンセプトです。画面に“特定領域“を設定します。シンプルに画面を6分割しました。(ピンクの線で区切っています)今回、下の写真の赤枠で囲った領域内に、「ボトル」を検出したら、「走るツナグちゃん」をリアルタイムに重畳させました。今までは静止画の表示でしたが、動画においても滑らかに表示されるところを是非ご覧ください。

AIエッジ向けAMD Xilinx製「Kria KR260(ロボティクススターターキット)」を活用したAI物体検知【1月25日】

「第15回オートモーティブワールド」にて展示させていただいたデモになります。

Plan A:録画(SDカード保存)
当社が拠点としている高崎のとある交差点の様子を撮影してきました。
車社会の群馬は、かなり車の往来があります。
このシチュエーションにおいて、“特定領域“として、下記を設定(ピンクの線で囲いました)
①横断歩道(2か所)、②信号待ちスペース
この設定した領域内で、「人」、「自転車」を検出したら、対応する「ツナグちゃんの画像」にリアルタイムに切り替えています。
詳しくは、動画をご覧ください。

動画の説明:
「横断歩道」に「人」を検知したら、「横断しているよ!」と表示
「信号待ちエリア」に「人」を検知したら、「巻込み注意!」と表示


デモ1 PlanA(録画)

Plan B:リアル(USBカメラ入力)
当日の展示会場です。
PlanAと同様に、 “特定領域“を設定します。シンプルに画面を6分割しました。(ピンクの線で区切っています)
この設定した領域内で、「ボトル」を検出したら、対応する「ツナグちゃんの画像」にリアルタイムに切り替えています。
詳しくは、動画をご覧ください。

動画の説明:
「下段左のマス」に「ボトル」を検知⇒「持込禁止!」と表示
「下段中央のマス」に「ボトル」を検知⇒「それおいしいよね!」と表示
上段のマス3ヶ所も、「ボトルを検知」すると、それぞれ表示を変えてます。


デモ1 PlanB(リアル)

2022

AMD Xilinx社主催 「Tech Day Tokyo 2022 」【10月16日】

AMD Xilinx社主催 「Tech Day Tokyo 2022 」にて展示させていただいたデモになります。

“カメラの前で特定のポーズをとると、同じポーズのキャラクター画像を重畳し、モニターにリアルタイムに表示する”デモを開発、デモを行いました。キャラクターにはOKIのバーチャルキャラクターである“緒希ツナグ®”ちゃんを起用し、デモに華を添えてもらいました。

本デモの最大のポイントは、
#1 映像取得 ⇒ #2 AI推論(姿勢推定) ⇒ #3 画像処理(重畳) ⇒ #4 GigE Visionで送信 までの処理を、“送信側のKria KR260のみで処理、実行している” ということです。
当社のFPGA/SoCにアクセラレート、最適に実装する技術を存分に活かしています。

「CEATEC 2022」【10月18日】

「CEATEC 2022」にて展示させていただいたデモになります。

技術のポイント
 PCAS(Pruning Channels with Attention Statistics)は、OKI独自のAIモデル軽量化技術で、AIモデル(ディープラーニングモデル)に内在する不必要な演算を自動的に削減、AIモデルを軽量化することが特徴です。
 Zebra(※3)は、Mipsology社のAI処理高速化プラットフォームで、AIプログラムをFPGA/SoCに最適に、自動的に実装することができます。

PCASとZebraの効果比較
PCASとZebraの効果比較

ソーベルフィルタと顔認識のデモ【9月6日】

【Kria KV260】 リアルタイム映像の顔認識AIにチャレンジしてみた。~デモ応用編~にて紹介させていただいたデモになります。

ソーベルフィルタを出力する映像全体にかけて、顔部分だけフィルタをかけないアプリを作成してみました。ソーベルフィルタは映像のエッジ強調を行うフィルタ処理で、ノイズを低減しつつエッジを強調することができます。通常のスマートカメラアプリケーションの操作手順と同様の手順でアプリを起動します。

  • 記載されている会社名、製品名は、各社の商標または登録商標です。
  • ここに記載されている仕様、デザインなどは予告なしに変更する場合があります。
  • YouTube

お問い合わせ

お問い合わせ