侵权投诉
搜索
更多>> 热门搜索:
订阅
纠错
加入自媒体

ChatDB提升LLM的复杂推理能力

2023-06-30 11:47
根新未来
关注

文/陈根

自去年11月份,ChatGPT面世以来,大语言模型(Large Language Models,即LLM)疯狂升级,不断爆火。而如何让大语言模型更好的应对有很长的上下文信息(超出其最大处理长度)的场景,并利用相关历史信息做复杂的推理,也就成了各国科学家们竞相攻坚的热点研究话题。

日前,清华大学和北京智源人工智能研究院的研究者们提出了一种新型的符号性(symbolic)记忆模块,即用数据库作为符号性记忆模块来增强大语言模型。该符号性记忆框架由一个大语言模型和一个数据库组成,称为 ChatDB,其框架包含三个主要阶段:输入处理、记忆链和总结回复。其中,记忆链是一个新提出的方法,以更有效地操作符号性记忆模块,从而进一步增强 LLMs 的推理能力。  

在 ChatDB 中,大语言模型通过生成 SQL 指令来操纵数据库,从而实现对记忆模块中历史信息精确的增删改查,并在需要时为大语言模型提供信息,以帮助其回应用户的输入。这样可以让大语言模型胜任需要对历史信息进行长期且精确的记录、处理和分析的场景,例如各种管理和分析系统,以后甚至有望替代管理者,直接让大语言模型根据精确的历史数据做分析和决策。

相比较于ChatDB,之前的记忆模块设计,要么需要依靠文本的 vector embedding 之间的相似度,要么将历史信息隐式地存储在神经网络的权重中,都涉及神经性的操作,无法像符号性操作那样精确操纵记忆模块中的历史信息。所以,这些设计存在着没有以结构化的形式存储历史信息和对存储在记忆模块中的信息的操作不够精确的问题。

ChatDB 则是利用支持 SQL 指令的数据库作为符号性记忆模块,来支持对历史信息抽象的、可拓展的和精确的操作。而且,符号性记忆模块还可以跟之前的记忆模块同时使用,起到相辅相成的作用,这无疑是极具优势的。

       原文标题 : 陈根:ChatDB提升LLM的复杂推理能力

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    通信 猎头职位 更多
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号