首页icon聊天机器人icon

AI助手

icon

Qwen3 235B 2507 (Reasoning)

qwen3-235b-2507-reasoning-logo

Qwen3 235B 2507 (Reasoning)

📄详情

核心特性:
• 高级推理能力
-1. 在AIME 2025评测中获得92.3%分数,超越OpenAI的o4-mini(92.7%)和Gemini 2.5 Pro(88%) 
-2. 在开源思维模型中实现逻辑推理、数学、科学与编程任务的最先进水平 
-3. 采用deepseek_r1推理解析器增强逐步逻辑推演能力 

• 混合专家(MoE)架构
-1. 总参数量2350亿,单次前向计算激活220亿参数确保高效 
-2. FP8量化版本显存占用降至约30GB,相较BF16格式的88GB大幅降低 
-3. 针对复杂任务优化,支持更长思维链推演 

• 超长上下文支持
-1. 原生支持262,144 tokens上下文窗口,适合长文本推理与大型代码库分析 
-2. 通过特定配置(如vLLM/SGLang)可扩展至100万tokens 
-3. 可处理约800页文本或复杂多步骤工作流

• 卓越性能表现
-1. 在推理基准测试中超越DeepSeek-R1-0528、o3和Claude Opus 4 
-2. 编程(LiveCodeBench)与学术任务(MMLU-Redux)表现优异 
-3. 推荐参数优化延迟:temperature=0.6, top_p=0.95, top_k=20 

• 成本与可用性
-1. 定价为输入tokens每百万0.7美元,输出tokens每百万8.4美元,低于行业平均水平(综合2.63美元) 
-2. Apache 2.0开源协议,可通过Hugging Face与ModelScope获取 
-3. 支持Ollama/LMStudio/llama.cpp/KTransformers本地部署 

• 开发者友好功能
-1. 通过Qwen-Agent支持工具调用,简化智能体工作流 
-2. 兼容vLLM和SGLang实现高性能推理 
-3. 支持Unsloth微调,显存需求降低70% 

• 实际应用场景
-1. 适用于科研、编程与企业级AI复杂推理任务 
-2. 学术基准测试、多语言任务与长文本分析的理想选择

detail-image

🗃️类似产品