谷歌发布大模型，国内“百模大战”鏖战正酣

2023-12-08 19:46

趣解商业

关注

国产大模型亟待“安卓”出现。

作者 | 周佟

编辑 | 趣解商业

2022年底，OpenAI发布ChatGPT掀起了人工智能热浪，时隔一年后，谷歌终于“杀回”人工智能赛道。

当地时间，12月6日，谷歌正式发布了Gemini大模型。谷歌CEO桑达尔·皮查伊称，Gemini的发布，是谷歌新时代的开始；但人们最关注的问题还是Gemini和GPT-4相比水平谁更高。

谷歌公司高管称，三种不同版本的套件中的Gemini Pro，表现优于GPT-3.5，但暂未直接回应Gemini与GPT-4相比表现如何的问题。不过外界有测评认为，它们已经超过了GPT-4。

图片来源：微博截图

不管是否超过，作为大模型的“风向标”，由一年前推出的ChatGPT引发的“生成式人工智能”革命，仍在不断地改写着每个人的认知。

如今巨头谷歌已“上线”，过去一年，在ChatGPT的引领下，国内的大模型企业也从摸索和尝试，逐渐步入深水区。

01.“百模大战”，从震惊到追赶

ChatGPT的出现并非毫无征兆。

创造它的OpenAI早在2015年便已成立，并在2018年就推出了初代生成式预训练模型GPT-1，这也是ChatGPT最初的原型。

公开资料显示，在GPT-1之前，业内的NLP模型（Neuro logic level自然语言处理）主要是基于针对特定任务的大量标注数据进行训练，能力有限。

GPT是第一个结合Transformer（多层变换器）结构和自监督预训练目标的模型，在自然语言推理、问答任务和常识推理等方面取得了突破，为此它们也获得了微软10亿美元投资。随后，从GPT-1到GPT-2，到GPT-3，短短2年时间里GPT的能力不断提高。

图片来源：OpenAI官网截图

2022年11月27日，随着由GPT-3.5修改而来的人工智能对话聊天机器人ChatGPT的推出，这个一直在小圈子走红的研究成果，才第一次为大众所认识。能聊天、画画、写文案、编代码，强大的功能，使得ChatGPT一经发布迅速走红，5天时间注册用户数超过百万，两个月时间月活突破1亿，成为史上增长最快的消费者应用。

消息传至国内，一石激起千层浪。人工智能竟然已经发展到如此地步了？震惊之下，淘宝上售卖ChatGPT账号甚至都成了一门生意。与此同时，看到巨大商机的各界大佬们，也纷纷下场，表态要尽快推出自己的大模型。

率先落地的是百度。2023年3月16日，国内首个大语言模型“文心一言”问世，发布会上，百度CEO李彦宏直言，“生成式AI是任何企业都不应错过的大机会”。

而百度之所以能够拔得国内大语言模型的“头筹”，源自其过去10多年中，在AI研发上的坚持投入。按李彦宏的说法，文心大模型的第一个版本早在2019年就发布了，此后每年都有更新，文心一言的发布只是百度多年努力的“自然延续”。

图片来源：百度文心一言公众号

紧接着，3月29日，360集团发布人工智能战略及360智脑大模型1.0版本，创始人周鸿祎现场演示了大模型在搜索场景的应用。4月11日，阿里巴巴的“通义千问”大模型在阿里云峰会上揭晓，CEO张勇宣布未来阿里巴巴所有产品都将接入“通义千问”。5月6日，科大讯飞星火大模型发布，董事长刘庆峰表态要在10月24日实现中文超过ChatGPT，英文赶上ChatGPT。9月7日，腾讯混元大模型上线。

至此，国内传统的三大互联网巨头“BAT”全部下场。

此外，华为、京东、字节跳动、商汤科技、昆仑万维等等都陆续推出了大模型产品，甚至连移动、联通、电信三大运营商，长虹等家电生产企业，清华、复旦、中科院等科研院所和高校，都发布了各自的大模型。

图片来源：华为云AI公众号

5月底举行的中关村论坛上，有专家披露，中国10亿级参数规模以上大模型已发布了79个；在7月初的2023世界人工智能大会中有信息表明，中国已有130家研发大模型的公司。此时，ChatGPT引起的大模型研发热，已经带动国内形成“百模大战”的格局。

不过相比当初外卖界的“百团大战”，“百模大战”对资金的需求更为苛刻。

根据NVIDIA官方信息，在训练底层模型阶段，训练一次1750亿参数的GPT-3需要34天、使用1024张A100 GPU芯片，而为了维持日常推理，OpenAI至少需要3.24万张A100，以此推算，ChatGPT仅硬件成本就超过了8亿美元。

昆仑万维集团CEO方汉更是公开表示，“没有2000张A100的卡，实验都做不了”。为此，海天瑞声、因赛集团等“AI概念股”甚至接连发布定增预案，募集资金用于训练大模型。

此时，如何在缩小与ChatGPT差距的同时，尽快找到应用落地的方向，实现自我造血，成为了“百模大战”中，每一位参与者都要面对的问题。

02.人工智能+将所有行业做一遍？

从商业角度分析，大模型带来的机遇，可以概括为成本减少效率提升、原有市场需求再扩大、创造新的市场需求三大类。

在今年8月31日、11月4日，根据网信办《生成式人工智能服务管理办法（征求意见稿）》的要求，国内先后有两批涉及26家公司的AI大模型和151个深度合成服务算法通过备案，陆续向全社会开放服务，其中的商业化尝试，也基本是围绕这三类展开的。

图片来源：网信办截图

大模型超强的人机对话、图文及音视频生成能力，不但让其在传统客服场景中获得了广泛应用，对于游戏、影视制作等也产生了深远影响。

阿里、美团的在线智能客服算法，以及中国移动的“九天大模型”、中国电信的TeleChat大模型等，都属于此类产品，将应用场景直接锁定在了智能客服、智慧政务等方面。在今年的亚运会上，科大讯飞与中国移动联合推出了基于星火大模型的5G新通话，接完电话之后，申请服务，会即刻转成文字、生成纪要、生成待办事项。

游戏、影视制作方面，导演陆川曾在采访时表示，“用AI画电影海报，15秒出来的效果比专业海报公司做一个月的还要好。”光线传媒、华策影视等率先尝试将大模型应用在影视创作中的公司，股价在年中都收获了一波大涨。

原有市场需求再扩大，则体现在对于传统业务的升级上，这也是大模型应用最广泛的领域。以传统的搜索引擎为例，接入文心一言后，在百度搜索框里输入问题，给出的可以不再是链接，而是一个更准确的答案。

10月17日，文心一言4.0发布，根据李彦宏现场的演示，除了搜索外，百度地图、网盘、文库等十余款应用，都接入文心一言完成了重构。

旗下业务众多的腾讯，对腾讯云、腾讯广告、腾讯游戏、腾讯会议等多个业务和产品，也已完成了接入腾讯混元大模型的测试，并取得了初步效果。

图片来源：腾讯混元官网截图

此外，在传统的教育、医疗、汽车等领域，大模型也获得了广泛的应用。接入讯飞星火大模型后，科大讯飞的学习机实现了AI一对一辅助教学、中英文作文批改、口语陪练等功能；百度推出了产业级的医疗行业大模型“灵医”，有超过1000家企业级机构先行体验；华为云盘古大模型的赋能，则让问界新M7在智能驾驶领域“遥遥领先”，两个月大定突破10万台。

在创造新的市场需求方面，AI超级助理、AI机器人等需求也被不断创造出来。前者，包括文心一言、讯飞星火、360智脑、通义千问等在内的各家通用大模型都有相应产品提供，它们大都能理解用户的语言语义，并具备图像理解能力，可以通过调用软件API，使用各种各样的工具来帮助用户完成任务；而后者，在今年8月16日举行的2023世界机器人大会上，包括优必选、追觅、宇树在内的不少于 10 家机器人企业，展出了相关产品，赛道也正呈现井喷态势。

图片来源：通义官网截图

不过，在一片欣欣向荣背后，也存在隐忧。比照各家大模型的应用不难发现，不管是提高效率还是扩大需求，市场上绝大多数的应用，实现的功能都较为雷同。

以AI学习机为例，除了科大讯飞有相关产品外，接入子曰大模型的网易有道、接入MathGPT的好未来、接入银河大模型的作业帮，以及接入文心一言的百度、接入360智脑的360，都有类似的产品在售。功能方面，各自宣传的也都大同小异，AI一对一辅导、全科AI作业助手、虚拟人口语教练等，站在消费者的角度，几乎很难体会到其中的差别。

尽管各家都能拿出一堆的排名榜单来论证，自己的大模型得分更高、能力更强，但体现在实际应用中时，那百分之几甚至是千分之几的差别，还是让人不得不产生疑惑：我们真的需要这么多大模型吗？

03.AI原生应用至上，亟待“安卓”出现

对于大模型步入“深水区”将会遇到的挑战，百度创始人、董事长兼首席执行官李彦宏提出了自己的看法。

近期，在深圳2023西丽湖论坛开幕式上，李彦宏就直言，拥抱AI时代，是“一把手工程”。因为CTO、IT负责人更关注技术本身，认为自己做大模型是交作业，结果不仅资源浪费，而且用不起来，最后一地鸡毛；只有一把手才会真的关注，新技术如何提升自己业务的关键指标，一把手上阵，才能让新技术真正为企业所用。

不断地重复开发基础大模型是对社会资源的极大浪费。在李彦宏看来，国内如今的大模型实在是太多了。根据统计，截止10月份，国内已经发布的大模型达到了238个，比5月科技部统计时的79个，翻了三倍，但与此同时，市场上真正的AI原生应用却很难找出几个。一把手应该主导做AI原生应用，而不是大模型。

图片来源：微博截图

“人类进入AI时代的标志，不是产生很多的大模型，而是产生很多的AI原生应用。”李彦宏认为，大模型时代其实和PC时代、移动互联网时代极为类似。PC时代，主流的操作系统只有Windows一个，移动互联网时代，也基本只有安卓和iOS两家，然而围绕着它们，诞生了无数的应用软件。

大模型本身也属于基础底座，类似操作系统，最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。“AI原生时代，我们需要100万量级的AI原生应用，但是不需要100个大模型。”

这确实是国内的大模型玩家们不得不面对的难题。尽管市场上大模型产品有几百个，但细究起来都是在各玩各的，360智脑只为自家搜索赋能，讯飞星火此前主要是为科大讯飞的学习机产品服务。

相比大模型训练的高额花费，如果不能够有效扩大“朋友圈”，让自家的大模型为更多人所用，只是一味投入，显然难以为继。

上半年大涨的AI概念股们，下半年几乎集体熄火，与此不无关系。科大讯飞（002230.SZ）10月19日发布的三季报显示，前三季度实现营业收入126亿元，同比下滑0.27%，净利润9936万元，同比跌了76%。根据公告，其利润下滑的主要原因，就是源自对大模型的“坚定投入”。

图片来源：财报截图

三六零（601360.SH）的情况也没有好多少，上半年尽管新兴业务“360智脑”创造了近2000万元营收，但在9.1亿元的总收入中，占比不过2.1%。

在“百模大战”进入深水区后，如何围绕各自的大模型，“扩大朋友圈”创造生态，争取更多的开发者，成了国内通用大模型玩家们不约而同的选择。

在1024开发者节上，科大讯飞董事长刘庆峰透露，除了联合相关企业发布了包含金融、汽车、住建、法律等在内的12个行业大模型外，在讯飞星火上，已有1.5万助手开发者，开发了超过2.9万个助手应用。

图片来源：讯飞开放平台公众号

百度则先后推出了“百度智能云千帆大模型平台”、“灵境矩阵”，帮助企业开发自己的专属大模型，目前平台月活企业数已近万家。

阿里巴巴旗下的通义千问，从18亿、70亿、140亿到720亿参数规模，率先成为业界首个“全尺寸开源”的大模型，以吸引更多合作伙伴加入，共促通义千问生态建设。

去年11月，阿里巴巴发布AI开源社区“魔搭”，中国80%的大模型研发机构把魔搭作为模型开源的首发平台。短短一年时间，魔搭汇聚了280万开发者、2300多个优质模型，模型下载量超过1亿。

正如中国科学院院士、中国计算机学会（CCF）开源发展委员会主任王怀民所说，开源是AI发展的重要驱动力，AI开源社区不仅将有力推动AI迈向广泛的落地应用，还将助力中国从开源世界的参与者逐步成长为引领者。

大模型行业的未来，如智能手机系统的迭代。曾经，除了苹果的iOS外，手机操作系统中还有诺基亚的Symbian、微软的Windows Phone、黑莓的BlackBerry，但是最终它们无一例外都败给了“在2012年，就拥有10万开发者，超过40万活跃应用”的Android。

期待国产大模型们，早日跑出本赛道的“Android”。

原文标题 : 谷歌发布大模型，国内“百模大战”鏖战正酣

本地收藏打印推荐给朋友

声明： 本文由入驻维科号的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。

发表评论

共0条评论，0人参与

登录登录即可访问所有OFweek服务

用户名/邮箱/手机：
密码：
忘记密码？
用其他账号登录： QQ | 微信 | 新浪微博

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

图片新闻