AI大模型时代真的到来了?
作者:产城绿洲点击上方蓝字关注我们
2022年,ChatGPT横空出市,掀起了人工智能发展的新高潮,以大模型和人类反馈强化学习(RLHF)为核心的技术落地开启AI发展新范式。
近期,国内外各大玩家相继发布了大模型新版本。
11月7日,OpenAI在首届开发者大会上正式发布了GPT-4的升级版GPT4 Turbo,升级了在长文本、知识库、多模态、模型控制、模型微调、高速率六大功能。同时还发布了GPTs,预计月底将推应用商店GPTStore,开发者可上传自己创建的GPTs到GPTStore,进一步完善大模型应用生态。
10月31日,阿里在云栖大会上发布了千亿级参数大模型通义千问2.0,相比今年4月推出的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上有明显提升。基于通义大模型训练的8大行业模型同时发布。
10月17日,在百度世界大会2023上文心大模型4.0发布,在理解、生成、逻辑和记忆能力上都有着显著提升,并将百度所有产品全面融入生成式AI。
何为AI大模型?AI大模型是人工智能预训练大模型的简称,包含了“预训练”和“大模型”两层含义:“大模型”是指一个庞大复杂的神经网络,通常拥有数百万以上的参数规模,通过对海量数据进行“预训练”,能够进行复杂处理和任务处理,从而提高模型的表现能力。
AI大模型的出现,重构了人工智能开发范式。过去的人工智能开发模式是通过业务数据集形成专属模型,小模型不断迭代,开发人员用明确的代码去表达业务模型的逻辑。在大模型的加持下,逐渐形成围绕大模型结合人工反馈强化学习为核心的人工智能开发模式。对超大规模基模型进行模型微调,就可衍生出行业大模型,从而覆盖相对应的行业场景。通过提示工程,只需用示例向计算机表达预期目标,计算机将通过神经网络自行找出达到目标的方法。
图 从分布式人工智能到集中式人工智能
AI大模型应用根据模态划分为文字生成、代码生成、语音生成、图像生成、视频生成、跨模态生成、策略生成等。文字生成、语音生成、图像属性编辑等技术目前发展较为成熟,已经催生了众多商业化应用。跨模态生产、策略生成在自动驾驶、机器人控制等领域具有很好高的应用价值,随着技术不断成熟未来将成为高潜力的发展赛道。
图片来源:沙利文
过去几年,国内外的互联巨头、AI科技公司均在大模型领域有所布局,并集中在2020-2022三年期间相继发布了各自的大模型。AI大模型成为近两年科技创业的大风口。国内,涉足AI大模型赛道的玩家有以“BTA”等为代表的互联网大厂。百度最先于今年3月26日,推出中国版ChatGPT“文心一言”,随后,阿里、华为、腾讯、360等大模型陆续浮出水面。
以商汤科技、科大讯飞、云从科技等为代表的AI科技公司,以及大数据服务商浪潮、金融类企业同花顺、芯片类企业联发科等为代表的各行业公司也入局AI大模型。此外,大模型在学术界也很火热,早在今年2月,复旦大学就已发布国内首个类ChatGPT模型MOSS。紧随其后,清华、武大等高校和北京智源等人工智能实验室也发布了自己的大模型。
国内大模型商业应用大幕徐徐拉开,“训练基础设施-底层技术-基础应用-垂直应用”的大模型发展路线已然清晰:以训练基础设施及底层技术构成的技术底座为基点,在海量通用数据上进行预训练,集成多样化的AI核心技术,构建具有泛化能力的多模态基大模型以及领域大模型。领域大模型再结合垂直场景及应用行业需求进行模型微调和应用适配,结合ToC端用户交互数据或ToB/ToG端行业专业知识,为下游C端业务场景和B/G端商业生态进行技术赋能。MaaS(Model as a Service)将成为未来大模型的主流商业模式。
图片来源:沙利文
参考资料:
1.沙利文——AI 大模型市场研究报告(2023)
2.钛媒体——“卷”资金抢人才,一文看懂国产AI大模型竞争格局
作者:lithiumflor
图片:来源于网络,如有侵权请及时联系删除
重磅推荐纵览中国产业服务行业大势聚焦开发区、科技园区、特色小镇、小微企业园、科创廊道等重点及热点载体多维阐述产业服务在园区小镇运营的实践价值
深刻剖析浙江产业创新空间的运营服务模式
绿城科技产业集团&浙大中国科教战略研究院产业创新研究中心共同编撰
从“构建与创新”到“链接与赋能”
再到“融合与智治”
产业服务系列丛书已出版三册
目前均在京东、当当官网有售
购买请戳
-扫码关注我们-微信号:cclz_2020
页:
[1]