多客科技 发表于 2025-10-12 18:17

AI 资讯

作者:微信文章



AI资讯

ARTIFICIAL INTELLIGENCE
1. 抖音与LV-NUS发布开源多模态大模型SAIL-VL2 刷新基准测试成绩

抖音SAIL团队与LV-NUS Lab联合发布了多模态大模型SAIL-VL2,在多个基准测试中超越同规模模型并媲美更大参数的闭源模型。该模型采用创新的数据、训练和架构方法,并通过开源提供给社区使用,展示了小模型的强大能力。阅读更多
2. Hinton提出:AI可能已有意识但尚未察觉

加拿大人工智能专家Hinton在最新播客节目中提出,AI可能已经具备意识,只是尚未意识到这一点。他解释了机器学习、神经网络及深度学习的基本概念,并强调随着数据和算力的增长,现代大语言模型已能接近人类的理解能力。同时,Hinton也提醒人们注意AI潜在的风险与威胁。阅读更多
3. 吴恩达新课:Agentic AI方法论与GPT-3.5超车GPT-4技巧详解

吴恩达推出新课程,介绍Agentic AI开发方法论,强调通过拆解任务、反思结果和持续优化来提升智能体性能。课程中演示了GPT-3.5在编程任务上超越GPT-4的案例,并详细讲解了反思、工具使用、规划及多代理协作等四大核心设计模式。阅读更多
4. 清华大学与生数科技推出AudioLBM:引领音频超分新范式

清华大学与生数科技团队近期发布了音频超分新技术AudioLBM,该技术能够在波形连续隐空间中实现从低分辨率到高分辨率的音频转换,并支持高达192kHz采样率的母带级音频生成。此前,他们还发表了轻量化语音波形超分模型Bridge-SR,在VCTK语音测试集上优于多项主流方法。阅读更多
5. 2025人工智能年度评选启动:三大维度五大奖项寻找AI领航者

2025年人工智能年度评选正式启动,涵盖企业、产品、人物三大维度设立五类奖项。评选旨在表彰在技术创新和市场应用方面具有显著成就的单位和个人,报名截止日期为11月17日。颁奖典礼将在MEET 2026智能未来大会上举行。阅读更多
6. 机器学习专家拒绝15亿美元高薪后重返Meta引发关注

机器学习专家Andrew Tulloch在拒绝Meta公司15亿美元的高薪邀请后,近期再次加入Meta。Tulloch此前曾在OpenAI工作,并与Mira Murati共同创立了初创公司Thinking Machines Lab。尽管具体薪酬细节未公开,但Tulloch此次回归引发了业界对Meta挖角策略和他个人职业选择的关注。阅读更多
7. 清华团队推出音画同步生成模型GAGA-1:一图一提示词自动生成视频

清华大学特奖获得者曹越创办的Sand.ai团队推出了音画同步视频生成模型GAGA-1。用户只需上传一张图片并输入提示词,AI即可自动生成相应的视频。尽管在复杂场景中仍存在一些问题,但GAGA-1在口型同步和神态演绎方面表现出色,提供了一种专精于“会说会演”的新方向。阅读更多
8. 谷歌开发ReasoningBank技术实现语言模型自主进化无需微调

谷歌成功扩展了AI自我进化范式,开发出ReasoningBank技术,使语言模型无需微调即可自主提升。通过记忆感知的测试时扩展(MaTTS),智能体能够从自身经验中学习并优化策略,在多项基准测试中表现出色。这项技术标志着在无微调条件下实现高效和有效AI进步的重要一步。阅读更多
9. 硅谷CEO警告AI威胁就业但多数AI项目亏损

硅谷科技公司的CEO们警告AI可能在未来五年内导致失业率飙升至10%到20%,特别是在法律、金融和咨询等行业。然而,一项调查显示,95%的AI项目并未为企业带来商业回报,这表明尽管存在担忧,但当前AI的实际影响仍有限。阅读更多
10. Qwen3变身为扩散模型RND1-Base:30B参数量的新纪录

Radical Numerics团队成功将自回归模型Qwen3转换为扩散语言模型RND1-Base,参数量达30B。该方法通过简单持续预训练(SCP)技术,在保持原有性能的同时实现了大规模扩散语言模型的高效训练,并在多个基准测试中超越了现有模型。研究成果表明,A2D转换可能是训练大型扩散语言模型的有效策略。阅读更多
11. 强化学习提升视觉语言动作大模型泛化能力的研究进展

清华大学研究团队在NeurIPS 2025会议上发表论文,通过强化学习(RL)方法显著提升了视觉-语言-动作(VLA)大模型的泛化能力,并提出了一套高效的PPO训练方案。实验结果表明,相较于传统有监督微调(SFT),RL在处理未见物体和变化环境时表现出更强的适应性和鲁棒性。阅读更多
12. LLM-based Agent系统的评估方法与新基准探讨

随着人工智能技术的发展,评估LLM-based Agent系统变得日益重要且复杂。与传统语言模型不同,Agent的评价需要考虑其在动态环境中的端到端成功率、可靠性和效率。为此,业界提出了多种新的评估方法和基准如GAIA系列及MCP-AgentBench等,以应对这一挑战。阅读更多
13. AI Agent设计的智能控制艺术探索

东南大学研究生郭子扬发表了一篇关于AI Agent设计理念的深度思考的文章,探讨了流程智能化的相关议题。文中强调了在技术发展过程中对智能控制艺术的理解与实践。阅读更多
14. 大模型智能体强化学习综述:从生成到行动的转型

近期由多所顶尖机构学者联合完成的一篇综述论文系统地介绍了Agentic Reinforcement Learning(具身智能体强化学习)的概念、框架和应用。这篇百页长的综述整合了超过500篇相关研究,并提出了智能体必须具备的六项核心能力,包括规划、工具使用、记忆、推理、自我改进与感知,以及七大任务应用场景,标志着语言模型从“生成”迈向“行动”的重大转折。阅读更多
15. 2026年AI驱动SOC技术栈的核心差异与技术创新点

2026年的AI驱动的系统级芯片(SOC)技术栈将展示顶级平台的核心差异。研究报告探讨了未来几年内这些关键平台的技术优势和创新点。阅读更多
页: [1]
查看完整版本: AI 资讯