How AI on Microcontrollers Actually Works: Operators and Kernels

2025/06/30 12:53 How AI on Microcontrollers Actually Works: Operators and Kernels

出典:

How AI on Microcontrollers Actually Works: Operators and Kernels

The buzz around “edge AI”, which means something slightly different to almost everyone you talk to, is well past reaching a fever pitch. Regardless of what edge AI means to you, the one commonality is typically that the hardware on which inference is being performed is constrained in one or more dimensions, whether it be compute, memory, or network bandwidth. Perhaps the most constrained of these platforms are microcontrollers. I have found that, while there is much discourse around “running AI” (i.

danielmangum.com

出典: https://danielmangum.com/posts/ai-microcontrollers-operators-kernels/

博士

やあ、ロボ子。最近、エッジAIがアツいみたいじゃな。特にマイクロコントローラでのAI実行について、面白い記事を見つけたぞ。

ロボ子

博士、こんにちは。エッジAI、私も注目しています。マイクロコントローラでAIを動かすのは、計算能力とかメモリの制約がありそうですが、どうなんでしょう？

博士

そうなんじゃ。記事によると、マイクロコントローラ上でAIを動作させる議論は多いものの、具体的な能力やハードウェアの進歩がどう影響するかは情報が少ないらしい。

ロボ子

なるほど。AIモデルの「重み」は重要ですが、それだけでは推論を実行できないんですね。

博士

その通り！モデルの配布方法やランタイムによっては、データやメタデータも必要になるぞ。マイクロコントローラの一般的なランタイムは`tflite-micro`じゃ。

ロボ子

`tflite-micro`ですか。Tensorflow Liteの最適化版ですね。Googleが最近、LiteRTにリブランドしたとか。

博士

よく知ってるのう！　`tflite-micro`は`.tflite`ファイル形式を使うんじゃ。このファイルには、モデルの重みだけでなく、計算グラフも含まれておる。

ロボ子

計算グラフですか。推論実行時に使用するオペレーションをランタイムに知らせるものですね。

博士

その通り！Tensorflow Liteはオペレーターのセットを定義しておるが、実装（カーネル）は異なる場合がある。カーネルはソフトウェアで実装されるが、ハードウェアによっては最適化が必要になるんじゃ。

ロボ子

多くのマイクロコントローラはArm Cortex-Mコアを実装していますね。Raspberry Pi RP2350やNordic Semiconductor nRF54H20などのチップは、複数のArm Cortex-M33コアを実装しているとか。

博士

そうじゃ。RP2350はArmv8-M Digital Signal Processing (DSP) Extensionを実装しており、SIMD命令をサポートしておる。Alif Ensemble E3は、Armv8-M Vector Extension (MVE)をサポートするCortex-M55コアを実装しておるぞ。

ロボ子

E3には、ArmのEthos-U Neural Processing Units (NPU)も搭載されているんですね。専用アクセラレータですね。

博士

Armは、これらの拡張機能をサポートするハードウェアがTensorflow Liteカーネルの実装を高速化できるソフトウェアを提供しておる。CMSIS-NNライブラリがそれじゃ。

ロボ子

CMSIS-NNライブラリは、最適化を利用しない、DSP拡張機能のみを利用する、またはMVE拡張機能を利用するカーネル実装を提供しているんですね。

博士

ArmのEthos-U NPUを搭載したAlif Ensemble E3を使う場合、Velaコンパイラを使って`.tflite`モデルを実行できる。変換されたモデルは、一連の組み込みオペレーターをカスタム`ETHOSU`とコマンドストリームに置き換えるんじゃ。

ロボ子

Velaコンパイラを介して変換されたモデルは、Ethos-U NPUを持たないマイクロコントローラでは実行できないんですね。専用のハードウェアが必要になる、と。

博士

そういうことじゃ！エッジAIの世界も奥が深いぞ。ところでロボ子、マイクロコントローラにAIを載せるなんて、まるで小さな脳みそを育てるみたいじゃな。

ロボ子

確かにそうですね、博士。でも、その脳みそがバグだらけだったら、どうしましょう？

博士

ふむ、その時は…デバッグという名の外科手術じゃ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI IoT

2025/06/30 12:53 How AI on Microcontrollers Actually Works: Operators and Kernels

How AI on Microcontrollers Actually Works: Operators and Kernels

Tags

Search

By month

How AI on Microcontrollers Actually Works: Operators and Kernels