Avat3r – 由TUM与Meta联合研发的3D高斯化身生成模型
AI产品观察

Avat3r – 由TUM与Meta联合研发的3D高斯化身生成模型

  • 头像
  • 高保真3D虚拟形象
  • 高效生成
  • 动画功能
  • 多源输入支持
  • 高斯泼溅技术
  • 面部动画
Tina

By Tina

March 27, 2025

什么是Avat3r?

Avat3r是由慕尼黑工业大学(TUM)与Meta Reality Labs联合开发的高保真3D头部虚拟形象生成模型。该模型采用大规模可动画化的高斯重建技术,仅需少量输入图像即可生成高质量、完全可动画的3D头部虚拟形象,同时显著降低计算资源需求。

通过从多角度视频数据集中学习,Avat3r构建了强大的3D人头先验知识。它整合了DUSt3R的位置映射与Sapiens的特征映射,从而提升重建质量。

Avat3r的核心创新之一是其表情动画能力,通过简单的交叉注意力机制实现。这使得它能够从非一致性输入(如智能手机拍摄图像或单目视频帧)中重建3D头部虚拟形象。

Avat3r核心特性

高效生成——仅需少量输入图像即可快速生成高质量3D头部虚拟形象,较传统方法显著降低计算成本。

动画能力——采用交叉注意力机制为生成的3D虚拟形象添加实时面部动画。

输入容错性——通过多样化表情图像训练,可有效处理模糊手机照片或单目视频帧等非一致性输入。

多源输入支持——支持从智能手机图像、单张照片乃至古董半身像等多种来源生成3D头部虚拟形象。

Avat3r技术基础

3D高斯泼溅技术——使用3D高斯分布表示空间点,每个分布编码空间位置、颜色、法向量等属性,实现复杂头部模型的高效3D重建与渲染。

多视角数据学习——基于多角度视频数据集训练,学习强3D人头先验,能从有限输入图像生成高质量3D虚拟形象,并处理模糊手机照片等非一致性输入。

交叉注意力面部动画——通过简单交叉注意力机制实现表情动画,经不同表情图像训练后,可适应动态表情变化并驱动生成3D虚拟形象的实时动画。

先验模型整合——融合DUSt3R位置映射与Sapiens通用特征映射,为3D几何与纹理提供额外约束,增强真实感与细节表现。

高效性与泛化能力——在低数据量与单输入场景表现优异,仅需数张图像即可在数分钟内生成高质量3D虚拟形象,对智能手机照片等不同输入源具有良好泛化性。

项目链接

官方网站:https://tobias-kirschstein.github.io/avat3r/

arXiv研究论文:https://arxiv.org/pdf/2502.20220

应用场景

虚拟现实(VR)与增强现实(AR)——为VR/AR应用生成高质量可动画3D头部虚拟形象。

影视制作与视觉特效(VFX)——通过少量图像创建高质量3D头部虚拟形象,适用于影视角色建模与动画制作。

游戏开发——快速生成支持实时动画的3D游戏角色,增强玩家沉浸感。

数字人与虚拟助手——生成可与语音合成及自然语言处理技术结合的拟真3D虚拟形象,实现自然个性化人机交互。



相关文章

首页iconAI产品观察icon

Avat3r – 由TUM与Meta联合研发的3D高斯化身生成模型

© Copyright 2025 All Rights Reserved By Neurokit AI.