1127423_ja-JP

取消
显示结果 
显示  仅  | 搜索替代 
您的意思是: 

1127423_ja-JP

1127423_ja-JP

i.MXRT1050 に基づいて CV アプリケーション用の IoT エッジ ノードを設計します<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

i.MX RT1050の概要

i.MX RT1050は、業界初のクロスオーバープロセッサであり、アプリケーションプロセッサの高性能および高レベルの統合と、マイクロコントローラの使いやすさとリアルタイム機能を兼ね備えています。i.MX RT1050は、Arm Cortex-M7コアで600MHzで動作するため、浮動小数点演算や行列演算などの複雑なコンピューティングを行う能力が確実に備わっています。一般的なMCUでは、これらの複雑な操作を克服するのは難しいです。

このデモでは、PXP(ピクセルパイプライン)、CSI(CMOSセンサーインターフェース)、eLCDIF(拡張LCDインターフェース)により、カメラディスプレイシステムを簡単に構築できます

pastedImage_2.png

図1 i.MX RTシリーズ

このデモでは、PXP(ピクセルパイプライン)、CSI(CMOSセンサーインターフェース)、eLCDIF(拡張LCDインターフェース)により、カメラディスプレイシステムを簡単に構築できます

pastedImage_8.png

図2 i.MX RT1050のブロック図

Compute Vision(CV)の基本概念

機械学習(ML)は、帯域幅の制約、遅延、信頼性、セキュリティなど、さまざまな理由でエッジに移行しています。人々は、スマートスピーカーの音声認識や監視カメラの顔検出など、より高度なサービスを提供するために、組み込みデバイスにエッジコンピューティング機能を持たせたいと考えています。

pastedImage_2.jpg

図3 理由

畳み込みニューラルネットワーク(CNN)は、画像認識と画像分類を行う主要な方法の1つです。CNN は、共有重みアーキテクチャと翻訳不変性特性に基づいて、最小限の前処理を必要とする多層認識のバリエーションを使用します。

pastedImage_15.png

図4 典型的な深層ニューラルネットワークの構造

上記は、左側に入力された元の画像と、それが各レイヤーを進行して右側に確率を計算する方法を示す例です。

ハードウェア

  • MIMXRT1050 EVKボード;
  • RK043FN02H-CT(液晶パネル)

pastedImage_1.png

図5 MIMXRT1050 EVKボード

リファレンス デモ コード

  • emwin_temperature_control: emWin ライブラリのグラフィカルウィジェットを示します。
  • cmsis_nn_cifar10: CMSIS-NN ソフトウェア ライブラリの畳み込み関数、ReLU 活性化関数、プーリング関数、および全結合関数を使用した畳み込みニューラル ネットワーク (CNN) の例を示します。この例で使用されている CNN は、Caffe の CIFAR-10 の例に基づいています。ニューラルネットワークは、ReLU活性化層と最大プーリング層が散在する3つの畳み込み層と、最後に全結合層で構成されています。ネットワークへの入力は 32x32 ピクセルのカラー イメージで、10 の出力クラスのいずれかに分類されます。

注: これら 2 つのデモ プロジェクトはどちらも SDK ライブラリからのものです

ニューロ ネットワーク モードをデプロイする

図6は、組み込みプラットフォームにニューロネットワークモードを展開する手順を示しています。cmsis_nn_cifar10デモプロジェクトでは、3畳み込み層の量子化パラメータが提供されているため、この実装では、これらのパラメータを直接使用し、ところで、このモデルの精度を評価するための入力ラウンドとしてテストセットからランダムに100枚の画像を選択します。そして、数回のテストを通じて、下の図に示すように、モデルの精度は約65%であることがわかりました。

pastedImage_6.png

図6 ニューロネットワークモードの展開

pastedImage_1.png

図7 cmsis_nn_cifar10デモプロジェクトの テスト結果

CIFAR-10データセットは、MLおよびコンピュータービジョンアルゴリズムのトレーニングに一般的に使用される画像のコレクションであり、10クラスの60000 32x32カラー画像で構成され、クラスごとに6000の画像(「飛行機」、「自動車」、「鳥」、「猫」、「鹿」、「犬」、「カエル」、「馬」、 "ship", "truck")。50000 個のトレーニング画像と 10000 個のテスト画像があります。

組み込みプラットフォームソフトウェアの構造

POR の後、システム クロック、ピン マルチプレクサ、カメラ、CSI、PXP、LCD、EMWin など、さまざまなコンポーネントが初期化されます。その後、制御GUIがLCDに表示され、再生ボタンを押すとLCDにカメラのビデオが表示されます。カメラウィンドウにオブジェクトが入ると、キャプチャボタンを押して表示を一時停止し、モデルを実行してオブジェクトを特定できます。図8は、このデモのソフトウェア構造を示しています。

pastedImage_5.png

図8 組み込みプラットフォームソフトウェアの構造

オブジェクト識別テスト

3つの図はテスト結果を示しています。

 pastedImage_2.jpg

図9

pastedImage_4.jpg

図10

pastedImage_6.jpg

図11

フューチャーワーク

Pytorch フレームワークを使用して、オブジェクト認識の使用に適した、より複雑な畳み込みネットワークをトレーニングします。

i.MXRT 105倍i.MXRT 106倍
标记 (1)
无评分
版本历史
最后更新:
‎01-05-2026 10:15 AM
更新人: