Llama-3.2-1B-Instruct

紹介

Llama 3.2 の多言語大規模言語モデル（LLM）コレクションは、1B と 3B のサイズ（テキスト入力 / テキスト出力）の事前学習モデルと命令微調整モデルのコレクションです。 Llama 3.2 の命令微調整されたテキスト専用モデルは、エージェント型の検索や要約タスクを含む多言語対話ユースケースに最適化されています。これらのモデルは、一般的な業界ベンチマークにおいて、利用可能な多くのオープンソースおよびクローズドチャットモデルを上回る性能を発揮します。

使用可能な NPU モデル

基本モデル

llama3.2-1B-prefill-ax630c

基本モデルは、128 のコンテキストウィンドウと最大 1,024 トークンの出力を提供します。

サポートプラットフォーム: LLM630 Compute Kit、Module LLM、Module LLM Kit

128 コンテキストウィンドウ
最大 1,024 トークン出力
ttft（最初のトークンまでの時間）891ms
平均トークン / 秒 4.48

インストール

apt install llm-model-llama3.2-1b-prefill-ax630c

llm-model-llama3.2-1b-prefill-ax630cをダウンロード

ロングコンテキストモデル

llama3.2-1B-p256-ax630c

ロングコンテキストモデルは、基本モデルと比較して拡張されたコンテキスト機能を提供し、256 のコンテキストウィンドウと最大 1,024 トークンの出力を実現しています。

サポートプラットフォーム: LLM630 Compute Kit、Module LLM、Module LLM Kit

256 コンテキストウィンドウ
最大 1,024 トークン出力
ttft（最初のトークンまでの時間）2601.11ms
平均トークン / 秒 4.49

インストール

apt install llm-model-llama3.2-1b-p256-ax630c

llm-model-llama3.2-1b-p256-ax630cをダウンロード

Next 概要

Page Tools

PDF

デバイスとクイックスタート

AI Pyramid

Module LLM

LLM630 Compute Kit

モデルの紹介

Qwen2.5

Qwen3

DeepSeek-R1

SmolVLM

MeloTTS

Whisper

Llama

AI Pyramid Applications

アプリケーション

Audio

CVビジョンアプリケーション

VLMマルチモーダル

大規模言語モデル (LLM)

音声アシスタント

OpenAI API

紹介

使用可能な NPU モデル

基本モデル

llama3.2-1B-prefill-ax630c

インストール

ロングコンテキストモデル

llama3.2-1B-p256-ax630c

インストール

On This Page