AI手机应用框架AutoGLM开源:打造属于你的智能手机助手;梁文锋入选《自然》年度十大人物,引领AI开源浪潮挑战美国科技霸权
作者:微信文章AI资讯
ARTIFICIAL INTELLIGENCE
1. 全球首个AI手机应用框架AutoGLM开源:打造属于你的智能手机助手
2024年10月25日,AutoGLM作为全球首个具备Phone Use能力的AI Agent发布,实现了AI在手机上自主完成复杂任务的功能。随后,其开源计划于2025年开始实施,旨在推动技术开放和隐私保护的同时,使更多人能够开发并使用自己的手机Agent。阅读更多
2. 揭秘“豆包手机”:全球首款AI智能手机背后的开源技术与GUIAgent布局
“豆包手机”作为字节研发的全球首款真正意义上的AI智能手机,在技术上采用了自研UI-TARS模型,并在系统级GUI Agent领域布局了近两年。尽管首批备货迅速售罄并在二手市场涨价,官方强调其核心技术已开源,并通过多项优化确保安全性和隐私保护,同时限制了一些敏感操作场景。阅读更多
3. 论文变漫画PPT!秘塔免费生成一键搞定,还有语音讲解相伴
国产AI平台秘塔近日推出了与Nano Banana 2相似的漫画式课件生成功能,并提供语音讲解服务。用户可以通过上传论文、报告或搜索关键词快速将复杂文本转化为图文并茂且易于理解的学习材料,操作完全免费无需申请。这一创新工具旨在大幅提高知识获取和学习效率。阅读更多
4. 稚晖君创业3年量产5000台机器人斩获数亿订单!
智元公司创始人彭志辉在仅创业三年后成功量产5000台通用具身机器人。其中远征A1/A2、灵犀X1/X2和精灵G1/G2系列分别下线1742台、1846台和1412台,应用于工业制造、家庭陪伴及文娱商演等场景,并已收获数亿元订单。阅读更多
5. 大模型视觉能力遇挑战:跨域场景中「失灵」率高
研究团队首次提出跨域第一视角视频问答基准EgoCross,通过评估大型多模态语言模型在手术、工业、极限运动和动物视角等专业领域的表现,揭示了现有模型的泛化瓶颈,并验证了几种改进方法的有效性。相关研究成果已入选AAAI 2026会议。阅读更多
6. Light-X:一键将单目视频升级为电影级4D视觉盛宴
近日,新加坡南洋理工大学等机构联合推出全球首个“镜头×光照”双控4D视频生成框架Light-X。该技术允许用户在普通单目视频中自由调整视角和光线效果,大幅提升电影级视觉体验的便捷性与多样性。实验表明,Light-X在图像质量和用户体验方面显著优于现有方法,并支持多模态光照条件下的灵活编辑。阅读更多
7. 地平线发布BPU「黎曼」架构:数学流形重构AI计算助力物理智能发展
地平线在2025技术生态大会上发布了BPU「黎曼」架构和HSD Together算法服务,并展示了征程7系列芯片的计划。新架构通过数学流形重构AI计算,旨在提高算力效率并降低开发成本,推动物理智能的发展。此外,地平线还宣布了开源具身智能模型,包括HoloMotion和HoloBrain,以支持机器人技术的进步。阅读更多
8. 没了遥控器怎么办?机器人要在野外自主生存了!
在第五届ATEC科技精英赛中,机器人在户外环境中的自主操作能力受限明显。尽管部分四足机器人完成全自主定向越野任务,但多数人形和双足机器人的表现不尽如人意,显示出当前技术仍需解决复杂场景下的感知与决策难题。专家认为机器人必须具备独立行走、操作及改造环境的能力才能真正融入人类生活,并强调低功耗高性能芯片和轻量化模型的重要性。阅读更多
9. LLaVA-UHD-v3:高效全图建模方案引领视觉语言新突破
清华大学和中科院的研究团队发布了新的LLaVA-UHD-v3模型,提出了一种高效的全图建模方案Progressive Visual Compression(PVC),在保持图像全局理解能力的同时显著提高推理效率。实验表明,LLaVA-UHD v3在多项视觉语言任务中表现出色,并且训练成本远低于现有商业模型。阅读更多
10. Snapchat推出Canvas-to-Image:一键生成复杂图像的新框架
Snapchat提出了一种新的图像生成框架Canvas-to-Image,它将身份参考图、姿态线稿和空间布局等信息整合在同一画布上,简化了图像创作过程。该技术通过统一的视觉符号让模型理解并执行复杂的组合指令,在保持单模态训练的同时具备多控制信号解析能力,并确保生成画面的一致性和连贯性。阅读更多
11. 清华超越谷歌夺NeurIPS第二!中国AI研究崛起全球半壁江山
在2025年的NeurIPS会议上,清华大学以4.73%的论文份额紧随谷歌之后,标志着中国AI研究力量的崛起。本届会议中,阿里千问团队获得最佳论文奖,展示了中国科技公司在基础研究领域的硬实力。中美科研生态差异显著,中国高校成为创新引擎,而美国则集中在大型科技公司手中。地缘政治因素导致部分学者无法前往主会场,大会在墨西哥城设立了平行卫星会场以适应这一变化。阅读更多
12. 科技巨头豪赌3万亿美元:AI将取代人类管理者?
硅谷科技巨头们正竞相预言AI将取代人类管理者,谷歌CEO皮查伊和OpenAI CEO奥特曼对此持激进观点,而微软CEO纳德拉则认为短期内AI仍需人类指导。据摩根士丹利估算,到2028年,科技公司在AI领域的投资将达到3万亿美元。阅读更多
13. OpenAI报告:精英用户效率狂飙16倍,普通人却被落下怎么办?
OpenAI最新报告显示,企业用户对OpenAI工具的使用量在过去一年猛增,尤其是在效率提升方面表现突出,但同时警告存在“贫富差距”,前5%深度用户在使用频率和深度上远超中位数用户。报告强调,谁能真正拿下企业市场将是未来竞争的关键。阅读更多
14. 摩尔线程新一代GPU架构下周揭晓,全面解锁国产GPU新势力!
摩尔线程将于2025年12月19日至20日在北京举办首届MUSA开发者大会,发布新一代GPU架构及全栈解决方案,并展示其在AI计算、图形渲染等领域的应用实践。会议旨在推动国产GPU技术的产业化发展与生态建设。阅读更多
15. 苹果AI大牛跳槽特斯拉,人形机器人2026量产冲刺!
苹果前核心华人AI科学家Yilun Chen加入特斯拉Optimus团队,投身于人形机器人的研发工作。特斯拉计划2026年大规模生产Optimus机器人,并面临前所未有的工作强度以实现激进目标。与此同时,相关领域的技术人才流动加剧,斯坦福的一家初创公司吸引了至少10名前特斯拉工程师加入。阅读更多
16. 天才少年联手谷歌,挑战英伟达芯片霸主地位!
前OpenAI研究员利奥波德·阿申布伦纳创立的新基金「Situational Awareness」正领投云服务商Fluidstack的7亿美元融资谈判,后者将成为谷歌TPU的重要分销渠道。这笔交易标志着谷歌在与英伟达芯片竞争中的重要一步,并助力Fluidstack成为行业独角兽。阅读更多
17. 梁文锋入选《自然》年度十大人物,引领AI开源浪潮挑战美国科技霸权
中国金融奇才梁文锋入选《自然》2025年度十大人物榜单,因其创立的DeepSeek公司发布的R1大语言模型在功能和价格上挑战了美国在人工智能领域的优势。R1以开放权重形式发布,为全球研究人员提供了宝贵资源,并推动了AI技术的开源趋势。阅读更多
18. 英伟达联手Lakera AI发布AI代理系统安全新标准
英伟达和Lakera AI近日共同推出了一项针对AI代理系统的安全统一框架。该框架旨在为开发人员提供一套全面的安全标准,以确保人工智能技术在各种应用场景中的可靠性和安全性。阅读更多
页:
[1]