核心特性
• 多模态智能
-1. 原生支持文本与图像处理(视频支持计划中) -2. 采用早期融合技术实现无缝图文理解,优于后期拼接方案 -3. 支持12种语言:阿拉伯语、英语、法语、德语、印地语、印尼语、意大利语、葡萄牙语、西班牙语、他加禄语、泰语、越南语
• 混合专家架构 (MoE)
-1. 每项任务仅激活1090亿参数(Scout版)或4000亿参数(Maverick版)中的170亿参数 -2. Scout版经Int4量化可部署于单块H100 GPU;Maverick版可运行于单台H100主机 -3. 巨兽版(总参数量2万亿,激活2880亿)在STEM基准测试中超越GPT-4.5、Claude Sonnet 3.7和Gemini 2.0 Pro
• 超大上下文窗口
-1. Scout版:1000万token上下文,支持多文档摘要与代码分析 -2. Maverick版:100万token上下文,适合长文本任务 -3. 单次可处理7500页(Scout)或750页(Maverick)文本
• 卓越性能
-1. Maverick版在编程、推理和图像基准测试中媲美GPT-4o与Gemini 2.0 -2. Scout版全面超越Gemma 3、Gemini 2.0 Flash-Lite和Mistral 3.1 -3. 巨兽版在LMArena AI基准测试(实验版)中得分高于GPT-4o
• 成本与可用性
-1. 采用Llama 4社区许可开源,支持研究与商业用途(月活用户≤7亿) -2. 可通过Hugging Face、AWS Bedrock、Azure AI Foundry和Google Cloud Vertex AI获取 -3. API无公开定价,费用取决于所选平台(如AWS、Azure)
• 开发者友好功能
-1. 支持函数调用、对话专用指令调优模型及图像推理等视觉任务 -2. 提供BF16/FP8/Int4量化模型实现灵活部署 -3. 支持合成数据生成与模型蒸馏
• 实际应用
-1. 驱动聊天机器人、内容摘要、代码生成及研究平台 -2. 适合企业、开发者和学术界构建多模态AI解决方案










