pdf-icon

StackFlow AI プラットフォーム

Silero-vad

紹介

Silero VAD(音声活動検出、Voice Activity Detection)は、オーディオストリーム中の音声の存在を検出するように設計されたモデルです。このモデルは、音声アシスタント、文字起こしサービス、オーディオ処理タスクなど、音声セグメントと非音声セグメントを区別する必要があるアプリケーションに役立ちます。

利用可能な CPU モデル

llm-model-silero-vad

サポートプラットフォーム: LLM630 Compute Kit、Module LLM、Module LLM Kit

  • このモデルは多言語の音声検出をサポートしており、英語、中国語、日本語が含まれます。

インストール

apt install llm-model-silero-vad
On This Page