2152255_ja-JP

MCXN947 の eIQ NPU はトランスベースのモデルをサポートしていますか?

こんにちは、
タイトルに述べたように、MCU の NPU はトランスベースのモデルをサポートできますか?公式サイトによれば、NPU はトランスフォーマーモデルをサポートできるとのことです。

圧縮、量子化、および flexspi 経由の外部 RAM を想定すると、小型のトランスフォーマーベースのモデルをボードに搭載できます。CAN NPU は実際に推論を加速するために使用できますか?

例としては、GitHub - maxbbraun/llama4micro: マイクロコントローラ上で動作する「大規模」言語モデルが挙げられます。
CPU で実行する代わりに、モデルを NPU で実行できますか?
このようなユースケースを MCXN にどのように適応させることができますか?