紹介
Qwen3 は Qwen シリーズの最新大規模言語モデルで、デンス型と Mixture-of-Experts(MoE)型の両方のアーキテクチャを提供しています。その主な特徴は、思考モードと非思考モードのシームレスな切り替え、強化された推論能力と命令追従性、対話を魅力的にする優れた人間の嗜好アライメント、ツール統合のための強力なエージェント機能、100 以上の言語をサポートする優れた多言語性能を備えていることです。
- タイプ:因果言語モデル
- 学習段階:事前学習及び事後学習
- パラメータ数:6 億(うち非埋め込み層パラメータ 4.4 億)
- レイヤー数:28
- アテンションヘッド数(GQA):Q が 16、KV が 8
- コンテキスト長:32,768
使用可能な NPU モデル
基礎モデル
qwen3-0.6B-ax630c
- 128 の長さのコンテキストウィンドウを提供する
- 最大出力 1024 トークン
- 対応プラットフォーム:LLM630 計算ツールキット、Module LLM および Module LLM ツールキット
- 実行時間(ttft)約 361.81ms
- 平均生成速度約 10.28 トークン / 秒
インストール
apt install llm-model-qwen3-0.6b-ax630c