Veo3 Veo 3 是 Google DeepMind 推出的新一代视频生成模型,专为电影制作人、故事讲述者和创意工作者设计,将视频与音频无缝结合,开启生成式 AI 的创作新篇章。 050 AI大模型# Veo3
Hallo Hallo 是一个由复旦大学(Fudan University)开发的开源项目,专注于音频驱动的视觉合成技术,特别是用于人像动画生成。 050 AI大模型# ai数字人# Hallo# 数字人
Seedance 字节跳动开发的AI视频生成模型,模型能够根据文本或图像生成高质量的视频内容,支持多镜头切换、稳定运动轨迹和风格化控制,适用于创意内容创作、广告制作和教育演示等场景。 020 AI大模型# Seedance
SadTalker SadTalker 是一个基于单张图像和音频生成说话人脸视频的模型,其核心功能是通过音频输入使静态图片中的图像动起来,并生成说话的虚拟人物。 040 AI大模型# SadTalker
MuseTalk MuseTalk 是一个实时高质量音频驱动唇形同步模型,旨在解决高分辨率、身份一致性和准确唇形同步的面部视觉配音挑战,尤其适用于实时应用如直播视频 。 050 AI大模型# MuseTalk
Qwen-Image Qwen-Image 是阿里通义千问团队于2025年8月5日开源的200亿参数图像生成基础模型,采用MMDiT架构,专为复杂文本渲染与高精度图像生成设计。 030 AI大模型# Qwen-Image# 通义千问
讯飞星辰MaaS平台 讯飞星辰MaaS平台是科大讯飞推出的一款一站式大模型定制精调平台,旨在为开发者和企业用户提供低门槛、全栈式的大模型应用开发服务。 050 AI大模型# 讯飞星辰# 讯飞星辰MaaS平台