文心一言背后，百度还是那个百度

2023-03-21 09:03

产业家

关注

对百度而言，文心一言不是一个结果，而仅仅是这家技术企业在过去多年投入的一个缩影和侧写。

作者|皮爷

出品|产业家

“第一枪”打响。

伴随着一身“工程师范”的李彦宏出现在台上，在市场备受期待的文心一言正式亮相。在发布会现场，作为百度的掌门人，他依次演示了文心一言的各项功能板块，并基于文心一言的特殊性和未来百度智能云的联动进行了阐述。

功能必然是值得且应该被核心关心的，包括文心一言的回答精准度，包括文心大模型背后的中文数据训练量，以及其能支持多模态的能力。

但在功能背后，一个更应该被思考的视角是，文心一言发布的价值是什么？

对于中国科技的发展，市面上往往有“跟随”和缺乏创新的论调，这种论调在PC互联网以及移动互联网都被一部分人诟病。但在如今的大模型时期，文心一言的出现似乎在向市场证明，中国在科技的创新能力，已经具备了和海外同台竞技的能力。

诚如李彦宏所说，文心一言是如今全世界唯一一个由大厂推出的生成式AI应用。在过去的一段时间里，尽管各家磨刀霍霍，但真正由大厂开发的生成式AI并没有出现。比如微软仅是调用OpenAI的能力，将其集成进自己的产品，而其他厂商如谷歌、Facebook等都没有成型产品的发布。

在当下的节点，文心一言更像一个特殊的“有勇气”的领头人。

关于百度，一个公认的点是百度一直是中国技术的代表企业，不论是被无数人推崇的“工程师文化”，还是百度对于AI长期以往真刀真枪的投入，这些在中国一众互联网大厂中都独具一格。

或者也更可以说，纵观中国科技行业，能够打响，并且能够打好大模型第一枪的，也只能是百度。

一、文心一言，打响中文大模型“第一枪”

第一枪。这是文心一言发出后，不少业内人士对它的评价。

文心一言到底如何？整体来看，中国大模型的第一枪，百度没有令人失望。

首先来看功能层面。从目前发布会介绍的功能来看，文心一言目前在公开场合演示的有文学创作、商业文案创作、数理推算、中文理解和多模态生成能力。其中，文学创作可以说是基于独特的中文大模型生成的，后续四个能力也都在现场做了不错的演示。

而在发布会之后，各方人士也纷纷对文心一言进行了测试。根据文心一言在市场反馈的程度来看，它的回答符合人们对其的预期，尤其是在中文语义的问题表达上，文心一言的表现甚至要高于市场预期，明显优于chatGPT。

一个背景信息是，文心一言背靠的是文心大模型。而文心大模型的定位是基于中文语义的知识增强大模型。从背后训练的数据来看，其训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据，以及5500亿事实的知识图谱等，这使得文心一言在中文语言的问题处理上具备天然优势。

或者也可以说，从使用体验来说，相较于chatGPT，文心一言更符合中国人的使用习惯。

在单纯的创作之外，一个市面上普遍的反馈是，文心一言在推理能力上也有不错的表现。除了李彦宏在现场演示的“比较”的问题，比如对某些计算相关的问题，文心一言也都有不错的回答，其答案的准确性、逻辑性、流畅性也都基本符合预期。

尽管文心一言后续的强预测和推理能力仍需要更多的测试，但人们的正向预期在发布后的几个小时内，就有了充分的良性反馈。

根据数据显示，截至3月16日晚间，百度智能云已经与5家企业完成首批签约合作，并与650家企业启动签约，申请文心一言的API调用服务测试的企业突破6.5万。而在3月17日港股开盘后，百度股价上涨超过10%。

二、“欢迎迈进大模型时代”

那么，为什么在当下产业数字化的节点，各个大厂对生成式AI，以及其背后的大模型有这么高的热情？或者也更可以说，为什么百度要在海外chatGPT推出的很短时间内，迅速推出自己的大模型？

关于大模型，一个通俗的定义是相较于之前的模型训练，其采用的数据更为原始和无秩序，模型框架可以基于深度学习的方式进行自监督学习，基于海量数据进行特殊的智能表达和推理运算。

如果对其做一个更精确的定义是，大模型或将是未来产业数字化的终极方式。

“未来会是大模型+行业模型的时代。”在百度阳泉智算中心的现场，百度智能云云计算产品解决方案和运营部总经理宋飞告诉我们，“在过去的几年时间里，百度已经帮不少企业落地了行业模型的模式。”

类似的形式不罕见。不单纯在国内的部分产业侧，在国外，微软推动的“通用行业模型+行业模型”也在成为各个行业数字化转型的依托。这样做的好处在于，企业可以基于自身的大模型进行内部不同环节的产业表达，比如营销、智能客服等等，帮助企业实现一定程度地智能，进而减少人员成本。

而除了企业内部自行测试之外，在模型被正式推出后，其可以利用外部输入的数据进行深度学习。换言之，伴随着模型被使用次数的越来越多，其智能化程度将会越来越高，模型本身也将越来越成熟。OpenAI推出的GPT大模型就是一个鲜明的例子。

除此之外，尽管当下不论谷歌还是微软，抑或是百度推出的通用大模型更大的预训练模式都集中在C端板块，但未来其将可以与其前端的SaaS应用，以及公有云和私有云产品进行深度耦合，进而提供一个具有实际生产力的工具。

对数字服务厂商而言，这是一个先发战。谁能率先跑出第一步，就能占据先发优势。

但这并不是一件容易的事情。以国外的预训练语言大模型为例，根据国盛证券报告《ChatGPT 需要多少算力》现实，GPT-3 训练一次的成本约为 140 万美元，对于一些更大的 LLM（大型语言模型），训练成本介于 200 万美元至 1200 万美元之间。以 ChatGPT 在 1 月的独立访客平均数 1300 万计算，其对应芯片需求为 3 万多片英伟达 A100 GPU，初始投入成本约为 8 亿美元，每日电费在 5 万美元左右。

这并不是一笔任何企业都能够且愿意投入的费用。那么，为什么在今天，百度会优先选择站在舞台之上？答案同样是业务本身。

从当下百度的业务模式来看，其上到百度智能云业务、无人驾驶，下到小度等智能终端，以及百度固有的基本盘搜索，本质都可以与文心一言以及文心大模型有足够强的连接力和协同力，且有强加持。

此外，从实际投入来看，早在2019年，百度就已经推出了文心大模型ERNIE 1.0。在2021年，百度又基于ERNIE发布了全球首个百亿参数的对话大模型PLATO-XL。

截止目前，百度最新发布的ERNIE 3.0 Zeus，已经拥有千亿级参数，并具备智能创作等各类自然语言理解和生成任务。与业界其他模型相比，其在公开数据集上的小样本学习、理解和生成任务效果也已经处于非常领先的水平。

换言之，在当下大模型时代即将来临的当下，百度需要并且有能力构建自己的生成式AI产品，以此更好地满足市场需求。此外，通过此，也更能展现中国企业在过去十年里基于技术上的投入和科技厚度。

一个形象的比喻是，如果说OpenAI打开的是AI发展的一道门，那么百度本身已经在这个AI的门内腾挪。

三、我们应该如何理解文心一言？

再说回文心一言产品本身。在打响中国生成式AI产品第一枪背后，我们应该对文心一言有一个怎样客观评价和感知？

综合来看，目前文心一言的表现有惊喜，也有不足。但在chatGPT成为大模型时代的唯一代表的当下，不可否认的是，文心一言正在成为一个中国大模型的新代表。

这种代表不单纯在产品本身，也更在其背后文心大模型代表的中国企业的新侧写。比如百度是如今全球为数不进行全栈布局的人工智能公司，这次文心一言背后的技术栈，从高端芯片昆仑芯，到飞桨深度学习框架，再到文心预训练大模型，各个层面都有领先业界的关键自研技术，并且几乎全部是自研产品。

再比如，百度拥有强大的算力基础，其目前拥有阳泉、徐水、定兴三个云计算中心，仅阳泉一个智算中心，就承载着24万台服务器，为大模型的研发提供着强大的底层支持。

同样因为这次文心一言，还被人知道的是百度一直保持的压强式、马拉松式的研发投入。比如在2022 年百度核心研发费用 214.16 亿元，占百度核心收入比例达到 22.4%。