xiaozhi-esp32 是一个基于 ESP32 S3 芯片的开源 AI 硬件项目。它通过创新的 MCP (Model Context Protocol) 协议,实现了低成本硬件与强大云端大模型(如 ChatGPT, DeepSeek)的无缝连接。核心板成本低于 50 元,是打造个人 AI 助手的最佳入门选择。
描述
项目简介
xiaozhi-esp32 面向个人开发者和硬件爱好者,提供一套低成本的语音 AI 终端方案。通过 ESP32-S3 与云端大模型组合,完成语音采集、唤醒、对话等完整链路。
项目功能
- 本地语音唤醒与语音指令发送
- 通过 MCP 协议接入 ChatGPT / DeepSeek 等模型
- 支持文本回复播报与多轮对话
- 通过 GPIO / I2C 扩展外设控制
硬件参数
主控芯片
ESP32-S3-WROOM-1
存储配置
16MB Flash / 8MB PSRAM
音频输入
INMP441 I2S Mic
音频输出
MAX98357A 3W
软件参数 / 开发文档
- 推荐环境:ESP-IDF / PlatformIO
- 通信协议:WebSocket + MCP
- 参考后端:Docker 一键部署服务
- 查看在线开发文档
设计图
BOM 物料清单
| 序号 | 名称 | 规格 | 数量 |
|---|---|---|---|
| 1 | ESP32-S3 模组 | ESP32-S3-WROOM-1 | 1 |
| 2 | 数字麦克风 | INMP441 | 1 |
| 3 | 功放芯片 | MAX98357A | 1 |
3D 模型
附件
项目成员
Alice
发起人 / 硬件设计
负责原理图设计与 PCB Layout。
Bob
固件开发
负责 ESP32 固件与 MCP 协议对接。
Carol
云端服务
维护后端推理服务与部署脚本。
评论
dev_hobbyist
已经按文档打样成功,固件烧录比较顺利。
maker_zh
建议增加一个简化版 BOM,方便学生党入门。