大模型的核心价值,不是聊天,而是生产力。大模型的技术关键,不是作诗,而是思维链。
文|周享玥
编|赵艳秋
靠着颠覆式的“Chat”能力从2023年Q1火到Q2后,大模型的生产力工具属性正在加速被重视和加强。
4月26日下午,人工智能企业第四范式展示其大模型产品“式说3.0”。一同被公布的还有这家公司最新提出的AIGS战略(AI-Generated Software):以生成式AI重构企业软件。
“从我的视角看,无论中美,并不缺任何一个基于GPT的聊天平台,如果有,很好;如果没有,也无所谓。但生产力的平台是决不能错过的。”第四范式创始人兼CEO戴文渊说出了他对大模型关键性的思考,在他看来,AI大模型是一个生产力级别的事物,能带来全社会效率的提升。
此前,国内外大厂已开始探索AIGC大模型对生产力的改造。
其中备受关注的是微软。从去年开始,微软宣布了一系列Copilot(副驾驶)产品,将AIGC布局到代码生成、Office办公软件、CRM企业软件以及安全等领域。此后,亚马逊、Salesforce、华为、阿里、字节跳动也有相关动作。
第四范式选择的切入口是尝试改造B端企业级软件,也叫AIGS。戴文渊提到,AIGS的想法源于一个很多人都比较直观的认知——相比已经逼近用户体验和效率上限的C端产品,B端的企业级软件还处于交互体验极为复杂、开发效率极低的阶段,这些恰恰为生成式AI留下了足够大的重构和改造空间。
业界人士将大模型类比于当年第一台蒸汽机,在新的AIGC时代,“蒸汽机”正在带来对各行各业生产效率的提升。
01
大模型的高段位不是聊天,而是思维链
第四范式的大模型名为“式说”。与此前公布的多个AI大模型一样,式说具有多轮对话、图片理解、写小说、画图、知识库等多模态基础能力。比如,在现场演示中,式说完成了画“狮子头”和“红烧狮子头”、编写了《流浪地球3》的剧本,完成“用Python编写求斐波那契数列前30项的程序”、“编写一个随机数的游戏程序”等代码生成。
“式说”装配集装箱
数智前线观察,式说将上述功能归为“基础能力”。而把能力重心更多放在Copilot(副驾舱)和思维链CoT(chain of thoughts,多步推理)上,二者也是实现AIGS的关键能力。
比如,式说要完成一个更为复杂的物流运输行业的“装箱”操作——将货物放入集装箱,如何最大化装箱效率。现场,戴文渊下达“帮我执行一个装箱任务”的指令后,式说便会推理出接下来一步步要执行的子任务:
- 它先确认“这是一个装箱任务”,并自动设定了“任务目标”:分析集装箱及小箱子的尺寸,设计装箱方案。
- 之后,又把目标拆分成三个具体步骤:主动要求戴文渊分步骤输入集装箱尺寸、待装箱货物尺寸和数量,以及其他约束条件。
- 然后,对不同类型的箱子进行堆叠组合,经过多轮尝试,耗时几十秒之后,输出了自己通过思考后在65种装箱方案中找出的最优装箱结果。
- 最后,在交互界面中完整展示出了自己的“思考”过程。
“式说”装配集装箱
“它干这个事比我厉害,我没半个小时做不出来。”戴文渊表示,这背后正是思维链的能力起了作用。简单来说,就是在解决多步骤推理问题时,模型可以模仿人类思维过程,将复杂任务拆分,逐步推理并执行。
一位互联网大厂资深人士告诉数智前线,业界现在其实还存在一种意识误区,“很多人都在强调Chat,看到大模型热热闹闹地写了个作文、作了一首诗,却很少注重思维链,而实际上,思维链才是大模型背后真正最核心的东西。”
他举例称,最近国内某大型金融企业就推出了一个AI大模型产品,但从命名来看,其去掉了ChatGPT中最重要的GPT,反而保留了相对不那么重要的Chat。
为什么思维链远比Chat重要?这就好像是如果没有理解和推理能力,就相当于在沙漠中盖高楼。
戴文渊也强调:“因为思维链的能力就是只有当它聪明到一定程度,干别的事也可以。”这正是通用大模型的本质。
以企业软件为例,在学习企业软件大量的数据和“套路”后,AI能形成中间的逻辑推理步骤,从而更好地配合人在软件上执行复杂的工作。
“就像是PS一张照片,机器可以做到把图片调亮20%、调一下阴影等单点步骤,但你最终的诉求并不是这些步骤本身,而是把人像修的好看。进化至’把图P好看’就需要用到思维链。思维链的能力就像是一个人一直看着别人用PhotoShop,看了几百遍他就学会了。”
这也是为什么要将思维链作为实现AIGS的关键能力的原因。
关于怎么提高思维链的问题,上述大厂资深人士告诉数智前线,目前大家都在采取各种不同的方式来探索提升思维链,比如一些企业喂给大模型更有逻辑性的语料,以及用到程序、提示学习等方式。
戴文渊称,对于企业软件合作伙伴来说,可以基于范式的大模型能力,在一个个领域里面钻得足够深,学习到足够多的数据和攻略,最终形成所在领域的思维链,发展成“领域”大模型。而当思维链复杂度到一定程度以后,它的软件就能够自动执行越来越复杂的功能,最终形成壁垒。
02
如何用生成式AI重构企业软件?
作为一家人工智能公司,第四范式此前一直与软件公司互为生态,“范式做软件里面的AI决策,软件公司做功能和流程的实现”。但此前他们经常遇到一个问题,比如用AI改造供应链场景时,模型相关的工作两周就能搞定,但整个智慧供应链却往往因为软件的开发周期需要做一年,大大拖慢了AI整体的落地速度。
这背后代表的是B端软件在体验和开发效率上的巨大改造空间。戴文渊曾在与合作伙伴交流时发现,对方给他展示行业内所使用的软件,下拉菜单甚至已经超过电脑屏幕的大小。实际上,即便是C端的Office软件,用户要真正用好也是有难度的,更何况是CAD、ERP、CRM等面向功能导向、使用门槛更高的B端企业软件。
生成式AI的出现,带来了改变这种困境的机会,AI对软件和产业的改造从原来的决策部分,进一步扩展至了前端交互。一个AIGS软件(大概率是一个对话框的形式),有机会创造一个体验优秀、界面极简、自我迭代的新型软件工作流。
“之前B端企业软件基于菜单式的开发,每次一个功能升级,又要周而复始的经历原型图、设计、开发等,至少是月级别的开发时间。”戴文渊称,但随着大模型带来的“对话框”式固定界面出现,现在功能和逻辑只需在数据、API和内容层面下功夫即可,可以提速到以天为级别的开发效率。
一家国内航空制造企业当日演示了与第四范式在CAD工业软件上的共创情况。这也是一个功能菜单远超屏幕大小的软件,在软件库中,自研零部件几十万,型号上百万,更别说外采零部件的信息(描述、标签、属性、参数)等,一般来说,厂商会投入大量时间和精力在“三维数模”的搜索、聚类、生成等设计过程中。
在探索引入大模型后,该企业相关负责人现场直接用语音提问,「帮我找类似的零件」,「给出这两个零件的装配方案」,这样的自然语言,就能在 CAD 系统的庞大工程中,找到所有与之类似的三维数模零件,给出多种数模组装方案。
“AIGS 的一小步,对我们来说已经是迈出了一大步。这些功能对于动辄需要几百万个零部件的飞机制造来说,将带来巨大的生产力提升。”相关负责人表示。
“式说”查询与组装三维数模
实际上,这样的创新符合国内制造龙头在工业软件上的创新趋势。数智前线此前了解到诸如造船业要涉及几乎80%的工业门类,使用几十种工业软件,这些软件主要来自国外不同供应商,他们都是封闭的,导致数据在设计、制造、采购、维修等流程中无法流转。国内已有龙头企业对工业软件从底座上进行改变,以提升效率。而AIGS对数据流转和传统软件开发应用将带来巨大变革。
03
AIGS在行业中的共创
在提出AIGS理念并迭代相关技术的同时,第四范式已将其带入行业,在场景中与行业龙头进行联合创新。
4月26日当天,一批来自金融、医疗、航空制造等领域的企业,也在现场分享了他们有关大模型的思考和实践。
一家医疗企业已经开始探索将式说大模型引入到患者关怀、医生提效、业务助力等关键场景中。比如基于专业知识,用生成式AI为患者提供更加专业、真实、符合个人情况的关怀。比如帮助医生提醒没有按时随访、且指标有可能存在异常的患者。比如通过模型思维链能力,赋能医药代表如何一步步解答医生疑虑,更好地完成业务目标。
不过,通过生成式大模型改造生产力的过程并非一蹴而就,戴文渊总结为三个阶段:
- 1.0阶段是以Copilot将企业软件改造成自然语言的交互形式,背后是企业内部应用库、私有数据之间的“联网”;
- 2.0则在这个基础上,基于Copilot不停地丰富对话框的能力,并且积累企业用户的行为数据来形成基于企业规则的“知识库”,这个“知识库”可以作为AI一次次执行复杂工作的“攻略”;
- 最终的3.0,具有推理能力的大模型会自己形成中间步骤,从而替人来拆分并执行复杂工作。
但这个跨越需要建立在大量数据以及行为数据的积累之上。“通常绝大多数企业会直接从AIGS的1.0阶段快速进入到2.0,而3.0是需要一定的时间去进行数据积累的。”戴文渊说。但他也表示,随着大模型能力的加强,3.0并不像以前那样需要积累几百万、上千万的样本才能做。
第四范式主任科学家涂威威介绍,目前已搭建了一个在AIGS领域的四层布局,分别是底层的式说大模型,能力层的思维链CoT、Copilot、知识库,平台层的开发平台,以及基于上面这三层,在金融、零售、医疗、制造、能源、交运领域开发的企业级应用。
一家金融企业的人士现场表示,他们在感受到ChatGPT带来的冲击后,就第一时间联系了国内能做这方面能力的企业咨询相关事宜。“这是我们必须面对的挑战和做出的变化,不能逃避。”该人士表示。最终,他们选择了第四范式,因为它是第一家向他们承诺能私有化部署的企业。
大模型的私有化部署的确已经成为一些国内企业的迫切需求。"像金融行业相对是比较敏感的,当然也有些行业其实不那么敏感。”戴文渊表示。
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论