災害救助、セキュリティ、ヘルスケアなどの分野では、助けを求める人間の悲鳴を検知することが非常に重要です。 エレベーターに閉じ込められ、通常のコミュニケーション手段が使えなくなったときを想像してみてください。 緊急時の叫び声検知システムは、危険を知らせるシグナルを認識し、警備員への通知や警報の作動などの緊急プロトコルを即座に起動させることで、迅速な救助につなげ、命を守ることができます。
RenesasのReality AI Emergency Scream Detectionは、人の悲鳴を識別するために設計された機械学習(ML)モデルです。 このモデルは、単に大きな音を検出するだけではありません。背景音と区別しながら、「悲鳴」という特有の助けを求める音を精密に識別できるよう高度にチューニングされています。 このシステムにより、特に安全性が重要となる密閉空間や隔離された環境において、助けを求める状況を即座に検知し、迅速な救援派遣が可能になります。
緊急叫び検知はどのように機能するのか?
緊急時の悲鳴検知システムは、収集されたデータに基づいてさまざまな音声を分類するように学習されています。 この機械学習モデルの開発する際の手順は、次のとおりです。
- データ収集とトレーニング:モデルの学習は、まず包括的なデータ収集から始まります。 さまざまな音声サンプルを含む公開データセット* を使用します。 「Scream」クラスには、強い非言語的な悲鳴音や言葉を伴う悲鳴が含まれており、これらが緊急時の悲鳴検知システムの学習に使用されます。 モデルが「悲鳴ではない音」を正しく区別できるようにするため、同じデータセットから風の音、環境雑音、通常の会話、歌声、音楽、拍手など、幅広い種類の音も使用します。
- 特徴抽出: 次のステップでは、さまざまな雑音の中から悲鳴特有のパターンを認識できるよう、音声ファイルから有用な特徴量を抽出します。
- モデル学習: 最適な特徴を選択した後、機械学習の分類器を用いて「悲鳴」と「非悲鳴」の音を判別できるようにモデルを学習させます。 学習プロセスでは、誤差を最小限に抑え、モデルの性能を向上させるためにパラメーターを調整していきます。
これらの手法を組み合わせることで、緊急時の悲鳴検知システムを構築し、迅速な対応を可能にすることで、さまざまな環境において重要な安全対策を実現できます。
アプリケーション例
Renesas VOICE-RA6E1 音声ユーザーデモンストレーションキットを使って、実際の環境から音声信号を収集します。 これらの音声信号は、Renesas の Reality AI により学習された分類器モデルで処理され、「悲鳴」と「非悲鳴」の音を判別するために活用されます。
Renesas の緊急悲鳴検知モデルを用いた実機テストでは、テストボードから最大 2 メートル離れた場所で発せられた悲鳴に対して、90%以上の精度が確認されています。 テストでは、風の音、エレベーターの音楽、人の会話、赤ちゃんの泣き声、着信音などの背景音も含め、精度を維持しながら危険を知らせる悲鳴を識別できるかどうかが検証されました。

アプリケーション例を簡単にビルドしましょう
ユーザーはルネサスの e² studio IDE を使って音声信号を収集し、ルネサスの Reality AIソフトウェアで生成された任意のAIモデルを統合できます。 公開データセット*からデータを収集した後、Reality AI ソフトウェアのツールを用いて特徴抽出、モデル学習を実施し、最終的にモデルを C コードとしてデプロイします。
デプロイされたモデルは、e² studio IDE を使用してライブテストに統合できます。 統合後は、VOICE‑RA6E1 ボードを使用してライブ環境でモデルを詳細にテストでき、AI ライブモニターを使ってその結果を可視化することが可能です。

RenesasのReality AI ソフトウェアと e² studio IDE を活用することで、アプリケーションのモデル学習・デプロイ・テストをシームレスかつ迅速に統合できる、その高い利便性を体験できます。
まとめ
Reality AI を用いた緊急叫び声検知アプリケーションは、さまざまな環境における安全対策を強化するうえで、機械学習が持つ大きな可能性を示しています。また、Renesas のテクノロジーを活用することで、高度な特徴抽出、モデル学習、デプロイメントを、リアルタイムの応答機能と組み合わせて実装できることを実証しています。 スケーラブルなReality AIツールは、幅広いRenesasのMCUおよびMPUデバイス向けにMLモデルを生成できます。
デモプロジェクトファイルをダウンロード して評価を始めてみましょう。 または今すぐ Reality AI のトライアル版を始めましょう。
*公開データセット – GoogleのAudioSet Database



