可灵AI3.0正式发布;谷歌正式开放Genie 3公测;开源音乐生成模型ACE-Step v1.5 正式发布丨AI速递
作者:微信文章Hi,
FUTURE
AIGC周报
Weekly AI NewsExpress
数字未来事务所
DIGITAL FUTURE AGENCY
2026.01.31-2026.02.06
本周AI行业前沿速递
PART.01
谷歌正式开放Genie 3公测
一句话生成互动宇宙
DFA
谷歌正式开放Genie 3公测,用户只需一句话即可实时创造可探索的互动世界,集成Nano Banana Pro和Gemini实现世界草图绘制、探索与二创;模型具备物理碰撞理解和场景记忆能力,支持第一/第三人称视角切换,网友已用其复刻GTA、塞尔达、刺客信条等游戏世界.
PART.02
OpenAI推出Codex应用
开启多 AI 编程协作时代
DFA
OpenAI宣布推出Codex应用,该应用现已登陆macOS系统,Windows版本即将上线。借助Codex应用可实现:并行使用多个智能体,通过工作树隔离智能体的修改操作;创建并使用技能,将工具与规范打包为可复用的功能模块;搭建自动化流程,通过后台的定时工作流,将重复性工作交由Codex代劳。
PART.03
腾讯ima接入混元图像3.0,
支持多场景图生图创作
DFA
腾讯ima接入混元图像3.0图生图模型,支持上传照片生成旅游图、家装效果图、四格漫画等多场景创意内容;产品可用于娱乐玩梗、家庭写真定制、设计稿快速生成、医疗科普配图等工作生活场景;用户只需上传图片并输入指令,即可获得符合创意的生成图片,支持绘本故事定制和家装布置预览。
PART.04
可灵AI3.0正式发布,
15秒长视频开启AI导演时代
DFA
可灵 AI3.0 系列模型全球正式上线,目前向黑金会员开放、近期将全量上线,该版本含视频和图片 3.0 及 Omni 模型,拥有全球首创的 “图生视频 + 主体参考” 技术,解决行业主体崩坏痛点,支持最长 15 秒视频连续生成,搭配智能分镜、多语种方言音画同步等能力,覆盖影视级创作全链路,正式开启 AI 导演时代。
PART.05
开源音乐生成模型
ACE-Step v1.5 正式发布
DFA
开源音乐生成模型ACE-Step 1.5在ComfyUI获得首日支持,采用混合LM+DiT架构,在RTX 5090上生成4分钟完整歌曲仅需约1秒;模型支持50+种语言指令,仅需不到4GB显存即可运行,音乐连贯性评分达4.72超越多数商业模型;支持LoRA微调实现风格个性化,即将支持音乐重构Cover和片段修复Repaint功能,全程本地运行确保数据安全。
页:
[1]