pdf-icon

StackFlow AI プラットフォーム

音声認識

紹介

自動音声認識(ASR、Automatic Speech Recognition)モデルは、話された言語をテキストに変換するように設計されています。これらのモデルは、文字起こしサービス、音声制御システム、アクセシビリティツールなど、さまざまなアプリケーションで役立ちます。

利用可能な CPU モデル

llm-model-sherpa-ncnn-streaming-zipformer-20m-2023-02-17

サポートプラットフォーム: LLM630 Compute Kit、Module LLM、Module LLM Kit

  • このモデルは、Zipformer アーキテクチャに基づくストリーミング ASR モデルであり、大規模データセットで学習されて高い精度の音声認識機能を提供します。

  • このモデルは英語のみをサポートしています。

インストール

apt install llm-model-sherpa-ncnn-streaming-zipformer-20m-2023-02-17

llm-model-sherpa-ncnn-streaming-zipformer-zh-14m-2023-02-23

サポートプラットフォーム: LLM630 Compute Kit、Module LLM、Module LLM Kit

  • このモデルは、Zipformer アーキテクチャに基づくストリーミング ASR モデルであり、大規模データセットで学習されて高い精度の音声認識機能を提供します。

  • このモデルは中国語のみをサポートしています。

インストール

apt install llm-model-sherpa-ncnn-streaming-zipformer-zh-14m-2023-02-23
On This Page