核心特性
• 高级推理能力
-1. 专为数学运算、编程及多步骤问题解决优化
-2. 采用强化学习(RL)实现逐步逻辑推演
-3. 在基准测试中与DeepSeek-R1和o1-mini性能相当
• 高效架构设计
-1. 320亿参数密集架构,提供卓越性能
-2. 支持消费级GPU本地运行(如24GB显存配置)
• 超长上下文支持
-1. 131,072 tokens上下文窗口处理长文本输入
-2. 可解析长达300页文本或复杂代码库
• 性能表现
-1. AIME24数学测试79.5%得分,LiveCodeBench编程测试63.4%得分
-2. 函数调用能力超越o1-mini(BFCL测试66.4%得分)
• 开发者友好
-1. Hugging Face平台Apache 2.0协议开源
-2. 支持工具调用、结构化输出及Groq等API
• 易用性
-1. 通过Qwen Chat免费使用或本地部署
-2. 提供量化版本(如4-bit AWQ)降低资源占用