Heygem是什么?
Heygem是硅基智能推出的开源数字人模型,专为Windows系统设计。依托先进AI技术,Heygem仅需1秒视频或单张照片即可在30秒内克隆数字人形象与声音,60秒内合成4K超高清视频。支持多语种输出、多表情多动作,实现100%唇形匹配精度,在复杂光照或遮挡场景下仍保持高度真实效果。全程离线运行保障用户隐私,支持低配置硬件部署,大幅降低使用门槛,为内容创作、直播带货、教育培训等领域提供高效经济的数字人解决方案。
核心功能
极速克隆:仅需1秒视频或单张照片即可克隆数字人形象与声音,30秒完成克隆,60秒合成4K超高清视频
高效推理:实现1:0.5的推理速度比和1:2的视频渲染速度
超清画质:支持32帧/秒的4K超高清视频输出,超越好莱坞24帧标准
多语种支持:克隆数字人支持8种语言输出,满足全球市场需求
无限克隆:支持数字人形象与声音的无限克隆,以及视频的无限合成
100%唇形匹配:在复杂光照、遮挡或侧角度场景下仍可实现高度真实的唇形匹配
低硬件要求:支持Docker一键部署,最低可在NVIDIA 1080Ti显卡硬件运行
技术原理
声音克隆技术:基于先进AI生成与样本相似或相同的声音,捕捉语境、语调和语速
自动语音识别(ASR):将人类语音转换为计算机可读输入,使计算机能"理解"口语
计算机视觉技术:用于视频合成中的视觉处理,包括面部识别和唇形分析,确保虚拟角色口型与音频文本内容匹配
项目仓库
GitHub仓库:https://github.com/GuijiAI/HeyGem.ai
使用指南
安装要求:
系统要求:Windows 10版本19042.1526或更高
推荐配置:
CPU:第13代英特尔酷睿i5-13400F
内存:32GB
显卡:RTX 4070
存储空间:
D盘:用于存储数字人及项目数据,需30GB以上空间
C盘:用于存储服务镜像文件,需100GB以上空间
依赖项:
Node.js 18
Docker镜像:
docker pull guiji2025/fun-asr:1.0.2
docker pull guiji2025/fish-speech-ziming:1.0.39
docker pull guiji2025/heygem.ai:0.0.7_sdk_slim
安装步骤:
安装Docker:检查是否已安装WSL(Windows子系统Linux版),未安装则运行wsl --install。更新WSL后下载安装Docker for Windows
安装服务端:使用Docker和docker-compose安装服务端,在/deploy目录运行docker-compose up -d
安装客户端:运行npm run build:win生成安装程序HeyGem-1.0.0-setup.exe,双击完成安装
应用场景
内容创作:快速生成动画、教学视频等,降低制作成本
在线教育:创建支持多语言教学的虚拟教师,提升教学趣味性
直播营销:用于虚拟直播带货和产品推介,降低人力成本
影视特效:生成虚拟角色或特效镜头,简化制作流程
AI客服:打造虚拟客服形象,提供自然的人机交互体验