1886827_ja-JP

cancel
Showing results for 
Show  only  | Search instead for 
Did you mean: 

1886827_ja-JP

1886827_ja-JP

NXPボード上のint8機械学習モデルに最適化されたチャネル数はありますか?

私はint8モデルを持っており、MIMXRT1060-EVKBで実行します。

このモデルを剪定したので、レイヤーの一部のチャネルウェイトが削除されることを意味します。モデルサイズが縮小されます。しかし、推論時間は短縮されず、増加します。

通常、機械学習モデルでは、各レイヤーのチャネル数(8、16、32)があります。ただし、プルーニング後、各レイヤーのチャネル数は5、11、27など変更されます。

NXPボード上のint8機械学習モデルに最適化されたチャネル数はありますか?私はこの問題をNvidia Jetsonボードで解決したので、この質問をしました(チャネルの数が8、16で割り切れるようにする必要があります。NXPボードにこの問題があるかどうかわかりません。

ありがとうございます。

Re:NXPボード上のint8機械学習モデルに最適化されたチャネル数はありますか?

もちろん、応援してくださり、本当にありがとうございます。

Re:NXPボード上のint8機械学習モデルに最適化されたチャネル数はありますか?

はい、その通りです。これは、プロセッサ(Cortex M7以下)の一般的な推奨事項(4で割り切れる)であり、RT1170プロセッサはCM4およびCM7と組み合わされています。

Re:NXPボード上のint8機械学習モデルに最適化されたチャネル数はありますか?

@Sam_Gao 

どうもありがとうございます。 これは非常に良いニュースです。 これは、量子化モデルをボードにデプロイするときに非常に役立ちます。この点をご確認ください。

RT1170(Cortex M7/M4)ではchのアネル数が4で割り切れるはずですが、25や61は割り切れないことを確認してください。」。 私のボードはMIMXRT1060(Cortex M7)です。これは、チャネル番号がRT1170と同じように4で割り切れるようにする必要があることを意味します。そうでしょう?

Re:NXPボード上のint8機械学習モデルに最適化されたチャネル数はありますか?

@Sam_Gao 

ご返信いただきありがとうございます。

「推論時間は チャネル数に直接 関係 、モデル計算の量 だけ 関連していません。」私の理解では、NXPはPTQ int8モデルの畳み込み層のチャネル数に関する推奨事項を持っていません。そうなんですか。

プルー ニング前のモデル の計算 グラフ の変化 モデル の計算グラフ と比較 する必要があります 。」 はい、モデルのアーキテクチャを確認しました。剪定後は変更されません。チャンネル数のみが変更されます。添付画像でご覧いただけます(モデル全体の一部です)。たとえば、プルーニング後、1 st Convolution レイヤーのチャネル数が 32 から 25 に変更されます。 2 番目の畳み込み層のチャネル数が 64 から 61 に変わります 。ただし、プルーニングされたモデルの推論時間は、元のモデルの推論時間よりも長くなります。

私は多くのケースを経験してきましたが、このような現象が起こりました。


「確かに、トポロジーは変わらないけど、チャンネル数が減れば、推論時間は長くならないでしょう」理論的には、それは真実です。しかし、実際には、それは必ずしも真実ではありません。ハードウェアの計算プロセスに関連している可能性があります。


Re:NXPボード上のint8機械学習モデルに最適化されたチャネル数はありますか?

@Sam_Gao 

進展はありますか?

Re:NXPボード上のint8機械学習モデルに最適化されたチャネル数はありますか?

@Sam_Gao 

情報が不足してすみません。

MCUXPress IDEのMCUXpresso SDK(最新)の基本プロジェクトとしてtflm_cifar10を使用しています。私のボードはMIMXRT1060-EVKBです。

申し訳ありませんが、機械学習モデルを共有できません。理解を深めるための例を挙げます。

たとえば、私の元のモデルには、4層の 畳み込み層(128チャンネル)==>畳み込み層(256チャンネル)==>畳み込み層(512チャンネル)==>密層(Cifar10の10クラス)があります。その後、モデルに剪定を適用し、剪定後、アキテクチャーを備えたモデルを取得します。

畳み込み層(128チャンネル)==>畳み込み層(231チャンネル)==>畳み込み層(455チャンネル)==>デンス層(Cifar10の10クラス)。

2 番目と 3 番目の畳み込みレイヤーのチャネル数が変更されていることがわかります (256 => 231 と 512 => 455)。

モデルサイズは小さくなりますが、プルーニングされたモデルの推論時間は、元のモデル(プルーニングなし)の推論時間よりも長くなります。どちらのモデルもINT8量子化モデルです。NXPボード上のint8機械学習モデルに最適化されたチャネル数はありますか?

お役に立てれば幸いです。

Tags (1)
No ratings
Version history
Last update:
‎11-21-2025 04:58 PM
Updated by: