Grok 3

• 高级推理能力

-1. 专为分步推理和复杂问题解决优化

-2. 数学（AIME：78%）、编程及求真任务表现超越Grok 2

-3. 在推理基准测试中与GPT-4o和Claude 3.5 Sonnet旗鼓相当

• 求真设计

-1. 训练中优先考虑事实准确性并避免教条主义

-2. 增强质疑精神，提供可靠且基于事实的答案

-3. 整合实时X平台数据获取最新洞见

• 扩展上下文

-1. 128,000 token上下文窗口，支持长文本输入与对话

-2. 可处理大型文档、代码库或多轮对话

• 性能亮点

-1. MMLU（知识测试）得分81%，HumanEval（编程测试）得分70%

-2. 推理速度较Grok 2更快，响应质量更优

• 开发者友好

-1. 支持函数调用、JSON输出及工具集成

-2. 可通过xAI API用于定制化应用

• 实际应用

-1. 驱动对话代理、研究工具及企业解决方案

-2. 适合需要清晰、诚实且可执行答案的用户