pdf-icon

StackFlow AI プラットフォーム

Whisper-base

紹介

Whisper は、自動音声認識(ASR)と音声翻訳のための事前学習モデルです。68 万時間のラベル付きデータで学習された Whisper モデルは、微調整を必要とせずに多くのデータセットやドメインに汎化する強力な能力を示しています。

使用可能な NPU モデル

whisper-base

サポートプラットフォーム: LLM630 Compute Kit、Module LLM、Module LLM Kit

  • このモデルは多言語の音声認識と翻訳をサポートしています。

  • エンコード 660.31ms

  • 平均デコード 51.11ms

インストール

apt install llm-model-whisper-base
On This Page