logo
MiniCPM5-1B logo

MiniCPM5-1B小体积大能量,让AI真正跑在你的设备上

MiniCPM5-1B是1B参数端侧开源大模型,支持131K超长上下文、思维/非思维双模式、工具调用及GGUF/MLX格式,适配主流推理框架,可离线运行桌面AI助手。

MiniCPM5-1B screenshot

更多关于 MiniCPM5-1B 的信息

MiniCPM5-1B

MiniCPM5-1B 是 MiniCPM5 系列的首个模型,专为端侧部署和资源受限场景设计的 10 亿参数稠密 Transformer 模型。作为同级别开源模型的性能标杆,它在保持极小部署体积的同时,实现了本地助手、编程代理和推理任务所需的强大能力,让用户无需依赖云端即可享受高质量 AI 服务。

产品亮点

  • 1B 级开源 SOTA 性能:在智能体工具调用、代码生成和复杂推理方面领先同级别开源模型
  • 混合推理模式:通过 enable_thinking 参数在同一模型中切换快速响应与深度思考模式
  • 超长上下文窗口:原生支持 131,072 token 上下文,轻松处理长文档和多轮对话
  • 全场景部署格式:提供 BF16、GGUF、MLX、SFT 等多种格式,覆盖从边缘设备到苹果芯片的各类平台
  • 标准架构零门槛:采用标准 LlamaForCausalLM 架构,无需自定义内核或代码分支即可直接部署

应用场景

  • 本地编程助手:在设备端运行智能代码补全和生成工具,保护代码隐私的同时提升开发效率
  • 智能体工作流:构建能够调用外部工具和 API 的自主代理系统,支持 XML 风格函数调用
  • 端侧 AI 助手:为智能手机、笔记本和嵌入式系统部署完全离线、隐私安全的对话式 AI
  • 桌面宠物应用:基于 MiniCPM-Desk-Pet 参考实现,打造个性化交互式 AI 伴侣
  • 边缘设备部署:为物联网设备和工业控制系统提供低硬件要求的 AI 能力

目标用户

MiniCPM5-1B 特别适合注重隐私保护、低延迟响应或离线运行的开发者、研究人员和企业团队。无论是构建编程代理、本地助手还是边缘 AI 解决方案,该模型都能在保证数据安全的前提下提供媲美云端的智能体验。