SKU:D062-M12




















AtomS3R-M12 火山引擎语音视觉套件 是一款将 M5Stack 硬件与火山引擎云端 AIGC 一站式解决方案深度融合的物联网视觉+语音开发套件,核心由两部分组成,高性能图像采集单元 AtomS3R‑M12 与 AI 智能语音处理底座 Atomic Echo Base。AtomS3R‑M12 提供 3MP 级别的广角视频采集与边缘计算能力,扩展接口适配多种传感。Atomic Echo Base 集成高保真音频解码,麦克风与扬声器驱动,支持全双工语音唤醒,识别与交互。火山引擎 RTC 与 M5Stack 合作内置一站式解决方案,通过在芯片侧集成音频处理(包括自动唤醒功能、音频 3A 等),在云侧深度整合大模型,语音识别,语音合成,Function calling,知识库等技术,快速实现用户与硬件之间流畅,自然,真人感觉的实时通话功能,适用于智能安防,远程教育,智能家居和工业监测,AI 机器人等领域。
| 规格 | 参数 |
|---|---|
| SoC | ESP32‑S3‑PICO‑1‑N8R8,双核 Xtensa LX7 @240 MHz,USB‑OTG |
| 存储 | 8 MB Flash + 8 MB PSRAM |
| 无线 | Wi‑Fi 2.4 GHz |
| 云端流处理 | Volcengine Stream 实时流接入 |
| 云端识别能力 | 人脸检测,目标跟踪,OCR 文本识别,ASR 语音转文字 |
| 摄像头 | OV3660,3 MP,F2.4,120° FOV,30 FPS |
| 红外 IR | 180° 发射角,无遮挡最远 12.46 m |
| 传感系统 | 九轴 (BMI270 + BMM150) |
| 接口 | USB‑C (供电),HY2.0‑4P 扩展 |
| 音频编解码 | ES8311,24‑bit I2S,16 kHz–64 kHz |
| 麦克风 | MEMS 数字麦克风,SNR ≥ 65 dB |
| 功放 | NS4150B D 类功放,最大输出功率 3W |
| 扬声器 | 1 W @ 8 Ω ,接口规格 JST 1.25-2P |
| 通信模式 | I2S 全双工 |
| 工作温度 | 0 ~ 40 °C |
| 产品尺寸 | AtomS3R-M12: 26.4 x 24.0 x 22.5mm Atomic Echo Base: 24.0 x 24.0 x 14.1mm |
| 产品重量 | AtomS3R-M12: 10.8g Atomic Echo Base: 6.3g |
| 包装尺寸 | 138.0 x 93.0 X 44.0mm |
如需烧录固件,请长按复位按键(大约 2 秒)直到内部绿色 LED 灯亮起,便可松开,此时设备已进入下载模式,等待烧录。






| ESP32-S3-PICO-1-N8R8 | G0 | G45 | G47 |
|---|---|---|---|
| BMI270 | SYS_SCL | SYS_SDA | |
| IR | IR_LED_DRV |
| BMI270 | BMI270_ASDx | BMI270_ASCx |
|---|---|---|
| BMM150 | A_SDA | A_SCL |
| OV3360(M12) | ESP32-S3-PICO-1-N8R8 |
|---|---|
| CAM_SDA | G12 |
| CAM_SCL | G9 |
| VSYNC | G10 |
| HREF | G14 |
| Y9 | G13 |
| XCLK | G21 |
| Y8 | G11 |
| Y7 | G17 |
| PCLK | G40 |
| Y6 | G4 |
| Y2 | G3 |
| Y5 | G48 |
| Y3 | G42 |
| Y4 | G46 |
| POWER_N | G18 |
| Atomic Echo Base | SCL | SDA | SD/DSDIN | WS/LRCK | ASDOUT | SCK/SCLK |
|---|---|---|---|---|---|---|
| AtomS3R M12 | G39 | G38 | G5 | G6 | G7 | G8 |
| HY2.0-4P | Black | Red | Yellow | White |
|---|---|---|---|---|
| PORT.CUSTOM | GND | 5V | G2 | G1 |



