GPT-4.1——OpenAI发布支持百万级上下文的新一代语言模型
AI产品观察

GPT-4.1——OpenAI发布支持百万级上下文的新一代语言模型

  • GPT-4.1
  • 下一代语言模型
  • 人工智能技术
  • 代码生成
  • 多模态能力
Tina

By Tina

April 16, 2025

GPT-4.1是什么?

GPT-4.1是OpenAI最新一代语言模型,提供三个版本:

  • GPT-4.1(标准版)
  • GPT-4.1 mini(轻量版)
  • GPT-4.1 nano(超轻量版)

该系列在代码生成、指令遵循和长文本处理方面显著提升,支持高达100万token的上下文窗口。基准测试中GPT-4.1表现卓越,例如:

  • SWE-bench编码测试准确率54.6%,较GPT-4o提升21.4%
  • 更低成本:目前OpenAI最快且最经济的模型

GPT-4.1系列仅通过API提供,现已向所有开发者开放。

GPT-4.1核心特性

1. 超长文本处理

  • 支持100万token(GPT-4o容量的8倍)
  • 可处理整本书籍、大型代码库或数百页文档

2. 多模态能力

  • 图像理解:采用交叉注意力机制的独立视觉/文本编码器
  • 视频理解:在30-60分钟无字幕视频的Video-MME测试中达到72%准确率(当前最优)

3. 代码生成与优化

  • SWE-bench测试准确率54.6%(较GPT-4o提升21.4%)
  • 多语言编码能力提升2倍

4. 高效工具调用

  • Windsurf内部测试得分较GPT-4o高60%,工具调用速度快30%

5. 复杂指令处理

  • Scale MultiChallenge测试得分较GPT-4o高10.5%
  • 复杂指令遵循能力显著提升(OpenAI内部评估)

6. 低延迟与高性价比

  • GPT-4.1 mini:延迟降低50%,成本下降83%
  • GPT-4.1 nano:OpenAI最快且最便宜的模型

GPT-4.1技术架构

1. 优化的Transformer架构

  • 增强注意力机制以提升长文本理解能力

2. 专家混合系统(MoE)

  • 16个独立专家模型,每个1110亿参数
  • 每次推理仅激活2个专家以保证效率

3. 训练数据

  • 基于13万亿token进行训练

4. 推理优化

  • 采用动态批处理等技术降低延迟与成本

性能对比

模型 编码(SWE-bench) 多模态(Video-MME) 延迟 成本(输入/100万token)
GPT-4.1 54.6%(+21.4%) 72.0%(+6.7%) 标准 2/2/8(输出)
GPT-4.1 mini ≈GPT-4o水平 优于GPT-4o ↓50% 0.4/0.4/1.6(输出)
GPT-4.1 nano 80.1%(MMLU) - 最快 0.1/0.1/0.4(输出)

定价

模型 输入(每100万token) 输出(每100万token)
GPT-4.1 2美元 8美元
GPT-4.1 mini 0.4美元 1.6美元
GPT-4.1 nano 0.1美元 0.4美元

应用场景

  • 法律:文档审阅准确率较GPT-4o提升17%
  • 金融:高效分析大型报告与市场数据
  • 编程:生成更优质的前端代码(人类偏好度80%+)




相关文章

首页iconAI产品观察icon

GPT-4.1——OpenAI发布支持百万级上下文的新一代语言模型

© Copyright 2025 All Rights Reserved By Neurokit AI.