画像
Eldar Sido
Eldar Sido
AI Technical Marketing
掲載: 2023年4月20日

はじめに

組み込みデバイスの世界において高度な機械学習や信号処理機能への需要が高まっています。最新の汎用コアであるARM® Cortex®-M85は、これらの要求に応えるために、32ビットArmv8.1-Mアーキテクチャを採用し、高性能と省電力を提供しています。このコアに採用しているHelium技術、Mプロファイルベクトル拡張(MVE)は、ML/DSPアプリケーションの性能向上に貢献します(Cortex-M7と比較してML性能4倍、DSP性能3倍)。このブログは2部構成となっており、今回の第1部でHelium技術とCortex-M85が市場で際立つ特長を探ります。そして、次回の第2部でEmbedded World 2023で発表されたデモの内容についてお伝えします。

Helium-MVE

Helium技術は、Cortex-M85およびCortex-M55コアのマイクロアーキテクチャ拡張であり、オンチップ処理によって下位から中位のDSPコアを置き換えることを目的として設計されています。Heliumは、8つの128ビットベクトルレジスタを持ち、さまざまなアプリケーション向けに幅広いベクトルデータタイプをサポートしています。オーバーラップパイプライン、分岐予測の改善、ループ最適化などの機能がその性能に貢献しています。メモリアクセス命令の強化や複雑な値処理のサポートにより、HeliumはCortex-M85に強力な要素を付与しています。

Cortex-M85の特長

Cortex-M85は、他のCortex-Mコアを凌駕し、ポインタ認証、ブランチターゲット識別(PABTI)、非特権デバッグ拡張(DUE)などの強化されたセキュリティオプションを含む豊富な機能を備えています。また、このコアは、さまざまなデータタイプをサポートする7段階のスカラーパイプラインおよび9~10段階のベクトルおよび浮動小数点パイプラインを提供しています。上位3つの高性能ARMマイクロコントローラーコア間の機能比較を以下に示します。

表1. CM7 vs CM55 vs CM85の比較

  Cortex-M7 Cortex-M55 Cortex-M85
アーキテクチャ Arm v7-M Arm v8.1-M Arm v8.1-M
セキュリティ     PACBTI
    非特権デバッグ拡張 非特権デバッグ拡張
    スタック制限チェック スタック制限チェック
    TrustZone TrustZone
MPU (PMSAv7) MPU (PMSAv8) MPU (PMSAv8)
パイプライン 6段階の超スカラおよび分岐予測 4段階(主整数パイプライン用) 7段階スカラーパイプラインおよび9~10段階ベクトルおよび浮動小数点パイプライン
Helium (MVE) サポートされていない サポートされている サポートされている
FPU fp32, fp64
FPv5
fp16, fp32, fp64
FPv5
fp16, fp32, fp64
FPv5
MACs per cycle 1 32bx32b 8 8bx8b
4 16bx16b
2 32bx32b
8 8bx8b
4 16bx16b
2 32bx32b
CoreMarks/MHz 5.29 4.4 6.28
DMIPS/MHz 2.31/3.23/6.78 1.69/2.16/5.32 3.13/4.52/8.76

ベンチマーク

Cortex-M85は、他のCortex-Mコアと比較して性能が向上しています。AI/ML性能で比較するとCortex-M7と比べ4倍、Cortex-M55と比べ20%上回っています。

画像

図1. CM85 vs CM7およびCM55の性能向上 [データソース:Arm]

実証データによると、ヘリウム技術は、一部のMLカーネルの性能を最大787%向上させ、浮動小数点データタイプに対する高速フーリエ変換および有限インパルス応答では、それぞれ最大57%および64%向上しています。さらに、ヘリウムは複数のデータタイプをサポートできるため、さらなる性能向上が期待できます。これについては次回第2部でご紹介いたします。

画像

図2. MVE対応デバイスと非MVE対応デバイスのベンチマーク性能比較。
(a) ARMコンパイラAC6.15を使用したCMSIS-NNの全結合層に対する平均結果性能
(b) ARMコンパイラAC6.16を使用した浮動小数点に対するCMSIS-FFT&FIR(正規化された性能)
[データソース:Arm]

まとめです。ヘリウムを搭載したCortex-M85は、AI/MLおよびDSPの性能を大幅に向上させるだけでなく、スカラ性能でも他のCortex-Mコアを凌ぐことができます。これにより、より複雑な処理タスクに対して理想的な選択肢となります。 次回、第2部では、ルネサスエレクトロニクスがEmbedded World 2023で披露したAIデモの紹介し、Cortex-M85が実際のアプリケーションでどのように機能するかについて説明します。お楽しみに!

この記事をシェアする