全球首个粤语大模型来了，商汤SenseChat用AI打破语言障碍

2024-05-30 17:25

本地化是SenseChat 5.0粤语版的最大优势。

在 2024 世界政府峰会上，英伟达 CEO 黄仁勋表示「每个国家都需要拥有自己的人工智能基础设施，以便在保护自己文化的同时利用经济潜力……它（AI）记录了你的国家文化、社会智慧、常识、历史——你拥有你自己的数据」。从某种意义上讲，经过大规模训练的 AI 模型，本身就是一种文化缩影。

但对中国用户来说，选择一个可以「代表自己」的 AI 大模型，事情就有些复杂：中国在普通话的基础上，还保留着璀璨的方言文化。时至今日，国内依然有不少长辈只能用方言交流。以国内最多用户使用的方言——粤语为例，在经济、文化、社群效应的影响下，粤语早就不仅仅是一门「南方方言」那么简单：

根据 Ethnologue 的数据，粤语的母语使用者大约有 8600 万人，在南方、东南亚甚至全球各地的华人社区中也广泛使用。这使得粤语在全球范围内有着重要的影响力，并成为全球第 19 大最广泛使用的语言。

尽管粤语用户不少，但由于粤语有自己独特的文字、读音和书写习惯，这种书面语-口语分离（Diglossia）的情况为粤语 AI 大模型的研发带来了相当大的挑战。即使是前段时间发布的、代表 AI 行业「顶尖水平」的 ChatGPT 4.0，在粤语领域的表现也一塌糊涂：

不仅不理解广东话语境下的常用口语，连语音合成的效果都支离破碎——除了口音听起来像讲不同粤语的外国人，在遇到无法合成的读音时，甚至会自顾自讲普通话。以至于在很长一段时间里，被戏称为「人工智障」的 Siri，反而是粤语体系中效果最好的 AI 助手。

图片来源：雷科技

但很快，广大粤语用户将迎来更好用的粤语 AI 大模型：2024 年 5 月 29 日，在香港扎根多年的本土 AI 企业商汤科技，在商汤科技十周年这个时间节点，正式发布了基于 SenseNova 5.0（日日新 5.0）的「粤语分支」——SenseChat 粤语版。此外，商汤科技也宣布了未来在国内 AI 领域的最新动向。

真正懂粤语的大模型产品

根据商汤科技的介绍，SenseChat 粤语版是基于 SenseNova 5.0 的一个分支。尽管粤语的语言习惯非常复杂，但得益于 SenseNova 5.0 的通用性，和商汤科技长期扎根香港换来的对粤语的理解，商汤只用了三四个月就交出了 SenseChat 粤语版这份答卷。

首先在粤语内容的训练上，商汤科技为 SenseChat 粤语版准备了大量的训练内容，不仅让 SenseChat 粤语版可以听懂复杂的粤语发音，还可以理解粤语地区的口语、俚语，比如「白车（救护车）」「磅水（给钱）」，甚至连「红 Van」「填 From」这种香港本地独有的「粤英混合」语句都能应对自如。

图片来源：雷科技

商汤科技也强调，由于商汤科技是本地企业，和海外竞品相比，SenseChat 粤语版无论是知识库的时效性，还是语音合成的准确度上，表现都更加优秀。发布会上，商汤科技更是直接用 SenseChat 粤语版和最新的 ChatGPT 4.0 做对比，表现可以说全面领先。

因 SenseNova 5.0 是一个多模态模型，所以 SenseChat 粤语版同样沿袭了 SenseChat 通用版的多模态能力：除了最基本的语言交互外，SenseChat 粤语版同样支持图片、文档等形式的内容交互。更重要的是，因针对粤语的习惯进行了专门的学习，SenseChat 粤语版可以真正理解照片、文档中的内容。

图片来源：雷科技

在发布会上，商汤科技就演示了用 SenseChat 粤语版看菜单，根据用户的具体需求推荐对应餐品的场景，对广大「点菜选择困难症患者」来说相当实用。

至于我们什么时候才能用上 SenseChat 粤语版，商汤科技也给出了明确的答案：「商量粤语版」 AI 大模型会提供 Web、App 两种不同形式的服务，将在很快正式向粤语区用户开放。功能上 Web 版和 App 版基本一致，但当前的测试版中，语音交互功能仅在手机 App 中提供。考虑到这一服务对全球粤语用户的重要性，商量粤语版Web 版和 App 版也将永久免费，粤语区用户在注册后也能免费使用。

图片来源：雷科技

用通用性为行业赋能

面向一般公众的商量粤语版宣布永久免费，而 API 方面，商量 5.0 粤语输入、输出的定价均为 30 港币每百万 Tokens。如果和国内高度内卷的 AI 服务定价相比，商量 5.0 粤语版的定价看似竞争力有限。但对于这个定价，商汤科技也有自己的看法：

图片来源：雷科技

目前商量 5.0 粤语版是首个支持粤语俚语理解的大模型，也是一个多模态的通用模型。从简单的粤语电话客服，到对时效性、准确度有极高要求的金融科技（FinTech）、法律、医疗领域，我们都有可能看到商量 5.0 粤语版的身影。而这种高时效性、高精准度的 AI 运算，对背后的算力资源有极高的要求，而在算力资源总量不变的情况下，更高的算力需求也意味着更高的定价。

商汤科技也在想办法为自己的算力扩容。目前商汤科技在上海临港产业区已经有了自己的算力中心，目前算力已达到 8400 PFLOPS，强大算力可支撑超过 20 个千亿超大模型同时训练，并支持万亿参数大模型的全生命周期生成。前段时间，前海深港人工智能算力中心也正式启动，一期算力已经达到 500 PFLOPS。商汤科技也会与深港两地合作，在深港自贸区部署更多的算力资源。

未来，商汤科技也将实现港深沪闽自贸区算力协同，在保证数据合规的前提下实现算力融合，让更多用户可以享受到更高效的服务。

算力是 AI 发展的基石

其实从商汤科技对算力的持续投入上，我们不难得出一个结论：在未来，算力的提升将是 AI 行业的首要任务。

随着模型不断迭代，AI 模型的规模和复杂度正在迅速增长，例如 OpenAI 的 GPT 系列参数量从最初的数百万增加到现在的数千亿，训练时间和计算资源的需求也随之大幅提升。不仅仅是语言模型，计算机视觉、语音识别和自动驾驶等领域的 AI 应用也在不断提高对算力的要求。更高的分辨率、更复杂的场景和更实时的反应都需要更强大的计算能力来支撑，因此，提升算力成为 AI 发展的核心任务。

但算力的发展背后意味着高昂的投入，为了应对日益增长的算力需求，高效利用现有算力资源也将至关重要，而边缘计算的结合成为解决这一问题的重要途径。边缘计算将计算能力下沉到设备端，减少数据传输的延迟，提升实时处理能力。分布式计算技术的发展也为算力资源的高效利用提供了新的可能，通过分布式训练和推理，AI 模型可以在多个计算节点上并行处理，大幅提升计算效率。