中国AI模型一夜变天!
作者:微信文章今天早上起床一看新闻惊呆了,好家伙,整个AI圈就跟春晚一样!咱们之前还在担心跟不上OpenAI/Google的步伐,结果一夜之间,几大国产厂家甩出来的全是王炸。除了昨天的豆包手机助手,Deepseek发布3.2版本,快手发布可灵o1。大清早赶紧给家人们盘一盘昨晚发生的这几件大事!
昨晚直接推出了DeepSeek v3.2版本。我看了一下那个评测数据,真的让人头皮发麻。性能直接超越了GPT-5,跟谷歌最强的Gemini3 Pro打得不相上下!恐怖如斯。
而且这次的V3.2是支持思考模式+工具调用,是不是立马就想到了豆包手机助手?看来AIOS是大方向啊。
关键是又进一步降低了成本,V3.2用了之前发布的DSA注意力机制,计算复杂度直接下降一个数量级,尤其是长下文场景下tokens成本下降较多(例如token position 96k时候,prefill和decode环节各自下降超过70%和85%),但没有看到性能显著弱化的场景。
现在都都知道现在训练模型烧钱,美国那边达链不涨就是担心无法长期支撑巨额的capex。但DeepSeek硬是用H800把这事儿给办成了。在算力受限的情况下,还能练出这种级别的模型,而且推理成本极低。所以说卷成本还得是中国人。
另外快手推出的可灵O1也可圈可点,号称国产Nanobanana。
简单地说,比如视频编辑的很多功能,局部修改、换角色、加元素、删内容、转场、延续镜头、变风格等等,全部一句自然语言可以搞定。这全部都是多模态模型带来的优点,说明我们在多模态上也在快速追赶美国!
我也看了一下演示,确实效果蛮好的。
当然最牛逼的还是字节的豆包手机助手。很多拿到内测资格的博主已经第一时间上手了,虽然复杂任务成功率不高,但绝对体验超过很多人的预期!
昨天晚上就卖断货了。
这可能真的是AIOS的划时代产品。
除了昨天涨停的一堆端侧硬件,我补充两个还没有被市场太挖掘的,一个是字节眼镜独家代工的龙旗,一个是与字节火山合作的AIOS技术服务商中科创达(A股唯一)。
这个月AI肯定是绝对主线了,端侧肯定是核心板块,肯定也会扩散到国产大模型+国产算力上。
页:
[1]