AI热点精选
作者:微信文章行业动态
01
阿里巴巴:发布AgentScope Java v1.0开源框架
12月9日,阿里巴巴正式发布了开源框架AgentScope Java v1.0,旨在为Java开发者提供构建企业级Agentic应用的能力。该框架采用ReAct(推理-行动)开发范式,支持高效工具调用与实时介入控制,并集成了安全沙箱、上下文工程、高效集成等企业级特性及完善的开发优化生态,全面覆盖了智能体从开发、部署到调优的全生命周期。未来,AgentScope Java将持续优化上下文工程,并计划支持全模态等更多前沿功能。
原文链接>> AgentScope Java v1.0 发布,让 Java 开发者轻松构建企业级 Agentic 应用
02
腾讯:发布语言模型Tencent HY 2.0
近日,腾讯发布了混元语言模型Tencent HY 2.0 Think和Tencent HY 2.0 Instruct。该系列模型采用总参数达406B、激活参数为32B的混合专家(MoE)架构,并支持256K的上下文窗口,在文本创作与复杂指令遵循等实用场景中表现突出。其中,HY 2.0 Think版本引入了精细的长度惩罚策略,用以平衡思维链的效率与效果,避免模型生成冗余内容,从而实现了计算资源的更有效分配。
原文链接>> 混元2.0上线:推理能力与效率业界领先,用户体验与实用性展现差异化优势
技术动态
01
OpenAI:发布circuit-sparsity模型和工具包
12月14日,OpenAI发布了名为circuit-sparsity的新型AI模型训练方法及配套工具包。该方法通过强制模型权重达到99.9%的极度稀疏化,使神经网络的计算过程变得像电路图一样可拆解与理解。其核心在于基于GPT-2架构,通过人为约束L0范数,促使模型形成解耦的“电路”模块。与此同时,circuit-sparsity工具包提供了一项“激活桥”技术,能够在稀疏模型与标准密集模型之间建立起有效的连接。
开源地址:
https://github.com/openai/circuit_sparsity
模型下载:
https://huggingface.co/openai/circuit-sparsity
原文链接>> OpenAI悄悄发布circuit-sparsity工具包,首次公开权重稀疏Transformer模型
02
智谱:开源四项视频生成核心技术
智谱GLM密集开源了其多模态模型家族,从“眼睛看得见”的视觉理解模型GLM‑4.6V,到“手能动起来”的AutoGLM,再到“语音听得懂”的GLM‑ASR与“话能说出口”的GLM‑TTS。紧接着在12月12日,智谱再次开源了SCAIL、RealVideo、Kaleido与SSVAE四项面向视频生成的核心技术,精准对准了当前视频生成领域的三大难点:精细化可控生成、复杂时空结构建模,以及大规模训练成本控制。
原文链接>> 智谱多模态开源周收官:四项视频生成核心技术开源
03
阿里通义实验室:推出图片生成工具Qwen-Image-i2L
12月10日,阿里通义实验室推出了图片生成工具Qwen-Image-i2L,该工具仅需单张样本即可训练LoRA,从而实现高效的个性化风格迁移。Qwen-Image-i2L提供了四款针对不同应用场景优化的模型变体:风格模式(2.4B)、粗粒度模式(7.9B)、精细模式(7.6B)和偏见模式(30M)。尽管模型已基于Apache2.0许可开源,但从单张2D图像中提炼3D逻辑仍存在一定局限。
模型地址:
https://modelscope.cn/models/DiffSynth-Studio/Qwen-Image-i2L
HuggingFace:
https://huggingface.co/DiffSynth-Studio/Qwen-Image-i2L
原文链接>> Qwen-Image-i2L开源:仅需单张样本即可训练LoRA,降低AI风格定制门槛
04
微软:开源轻量级实时 TTS模型VibeVoice-Realtime-0.5B
微软开源了一款参数仅为0.5B的轻量级实时TTS模型VibeVoice-Realtime-0.5B。该模型实现了多数巨型模型难以企及的实时发声能力,其首包延迟仅约300毫秒,支持边输入文本边朗读,长文本处理流畅无卡顿,并能实现多角色自然对话,真正推动AI语音迈向了实时流式对话形态。
GitHub:
https://github.com/microsoft/VibeVoice
项目官网:
https://microsoft.github.io/VibeVoice
原文链接>> 微软开源轻量级实时TTS模型!VibeVoice-Realtime-0.5B:实现多角色自然对话!
05
美团:发布图像生成模型LongCat-Image
12月8日,美团LongCat团队正式发布并开源了LongCat-Image模型。该模型采用文生图与图像编辑同源的架构设计,并结合渐进式学习策略,在仅6B的紧凑参数规模下,实现了指令遵循精准度、生图质量与文字渲染能力的高效协同提升,尤其在单图编辑的可控性和文字生成的汉字覆盖度方面独具优势。
HuggingFace:
https://huggingface.co/meituan-longcat/LongCat-Image
GitHub:
https://github.com/meituan-longcat/LongCat-Image
原文链接>> 美团发布 LongCat-Image 图像生成模型,编辑能力登顶开源SOTA
政策趋势
01
山东:印发《山东省人工智能产业高质量发展行动计划(2025-2027年)》
12月12日,山东省工业和信息化厅等八部门联合制定了《山东省人工智能产业高质量发展行动计划(2025-2027年)》。该计划聚焦“大算力”、大数据、大模型、智能体、智能软硬件、智能服务及智能安全等重点领域,将实施技术创新、要素扩容、产业集聚、场景赋能和生态培育“五大行动”,并设定目标:到2027年,全省人工智能核心产业规模力争突破2000亿元,带动相关产业规模超过万亿元。
原文链接>> 山东印发人工智能产业高质量发展行动计划
02
福建:印发《福建省有序推进算力基础设施发展若干措施》
福建省数据管理局、工业和信息化厅与通信管理局联合印发了《福建省有序推进算力基础设施发展若干措施》。该文件提出了十条具体工作措施,涵盖优化算力空间布局、规范数据中心建设、构建全省一体化算力服务体系、提升网络传输效率、推动云边端协同发展、强化数据存储保障、提升公共算力服务水平、深化行业应用场景、推进算力与绿色电力融合以及完善算网安全保障体系等多个方面。
原文链接>> 福建省数据管理局等三部门关于印发福建省有序推进算力基础设施发展若干措施的通知
声明:资料素材均来源官方媒体/网络,如有侵权,请联系删除。
END
页:
[1]