【可灵AI3.0正式发布;谷歌正式开放Genie 3公测;开源音乐生成模型ACE-Step v1.5 正式发布丨AI速递】萍聚社区-德国热线-德国实用信息网人工智能

多客科技 发表于 2026-2-7 05:06

可灵AI3.0正式发布;谷歌正式开放Genie 3公测;开源音乐生成模型ACE-Step v1.5 正式发布丨AI速递

作者：微信文章

Hi,

FUTURE

AIGC周报

Weekly AI NewsExpress

数字未来事务所

DIGITAL FUTURE AGENCY

2026.01.31-2026.02.06

本周AI行业前沿速递

PART.01

谷歌正式开放Genie 3公测

一句话生成互动宇宙

DFA

谷歌正式开放Genie 3公测，用户只需一句话即可实时创造可探索的互动世界，集成Nano Banana Pro和Gemini实现世界草图绘制、探索与二创；模型具备物理碰撞理解和场景记忆能力，支持第一/第三人称视角切换，网友已用其复刻GTA、塞尔达、刺客信条等游戏世界.

PART.02

OpenAI推出Codex应用

开启多 AI 编程协作时代

DFA

OpenAI宣布推出Codex应用，该应用现已登陆macOS系统，Windows版本即将上线。借助Codex应用可实现：并行使用多个智能体，通过工作树隔离智能体的修改操作；创建并使用技能，将工具与规范打包为可复用的功能模块；搭建自动化流程，通过后台的定时工作流，将重复性工作交由Codex代劳。

PART.03

腾讯ima接入混元图像3.0，

支持多场景图生图创作

DFA

腾讯ima接入混元图像3.0图生图模型，支持上传照片生成旅游图、家装效果图、四格漫画等多场景创意内容；产品可用于娱乐玩梗、家庭写真定制、设计稿快速生成、医疗科普配图等工作生活场景；用户只需上传图片并输入指令，即可获得符合创意的生成图片，支持绘本故事定制和家装布置预览。

PART.04

可灵AI3.0正式发布，

15秒长视频开启AI导演时代

DFA

可灵 AI3.0 系列模型全球正式上线，目前向黑金会员开放、近期将全量上线，该版本含视频和图片 3.0 及 Omni 模型，拥有全球首创的 “图生视频 + 主体参考” 技术，解决行业主体崩坏痛点，支持最长 15 秒视频连续生成，搭配智能分镜、多语种方言音画同步等能力，覆盖影视级创作全链路，正式开启 AI 导演时代。

PART.05

开源音乐生成模型

ACE-Step v1.5 正式发布

DFA

开源音乐生成模型ACE-Step 1.5在ComfyUI获得首日支持，采用混合LM+DiT架构，在RTX 5090上生成4分钟完整歌曲仅需约1秒；模型支持50+种语言指令，仅需不到4GB显存即可运行，音乐连贯性评分达4.72超越多数商业模型；支持LoRA微调实现风格个性化，即将支持音乐重构Cover和片段修复Repaint功能，全程本地运行确保数据安全。

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

可灵AI3.0正式发布;谷歌正式开放Genie 3公测;开源音乐生成模型ACE-Step v1.5 正式发布丨AI速递