张钹院士多维度探讨大模型时代的企业AI发展趋势

在当今技术迅速发展的时代，生成式人工智能与大模型正成为推动产业变革的重要力量。随着AI技术的不断成熟与普及，它的应用已从个人领域扩展至企业层面，广泛覆盖各行各业。

近日，在用友主办的“2024全球商业创新大会”上，中国科学院院士、清华大学人工智能研究院名誉院长张钹发表了主题为《生成式人工智能时代的产业》的演讲。

会上，张钹院士从能力、应用、架构、趋势等几个维度，详尽阐述了学术界关于大模型的洞察与思考，全面剖析了大模型的演进路径，就该技术的应用前景、挑战及其在不同领域的实际应用展开了深入探讨。

大语言模型“三大能力”与“一大缺陷”不容忽视

张钹院士进一步探讨了生成式人工智能的核心优势及其可能带来的挑战。目前，在大模型发展的进程中，已呈现出“三大能力”和“一大缺陷”。

其中，生成式人工智能具备的三大核心能力为：

强大的语言生成能力，即在开放领域生成多样性的、语义连贯的、类似人类的文本，这是大语言模型区别于其他计算机生成语言的灵魂和优势所在；

强大的自然语言对话能力，即在开放领域实现人机自然语言对话；

强大的迁移能力，即在代理任务上训练一个模型，只需要少量数据和微调，就可以适配到下游任务中，从而凸显出大模型可举一反三的能力。

除了上述优势外，大模型也呈现了一大缺陷，那就是大模型的幻觉。换句话说，在多样性输出的过程中，大模型也会犯错，这与它的创造性同时产生。

这种幻觉是在外部信息驱动下产生的，因为大模型与人类生成的语言只是行为上相似，而内在机制完全不同。更深一步讲，这也揭示出了基础模型的局限性。一方面，它输出的结果不一定正确，且质量不可控；另一方面，大模型不可信任；还有一方面，大模型对提示词的依赖性强。

“正因具备上述优势与缺陷，产业在落地大模型应用时必须格外重视这些因素。”

基础模型的三种落地方向

目前，在生成式AI的众多应用场景中，高阶应用如设计、规划，低阶应用如服务、营销是相对容易实现的。例如，券商可依托大模型打造新一代AI中台大脑，帮助企业实现智能化的开户、客服、AI选股等服务场景。

与之相反，涉及企业关键业务领域的大模型应用场景则是较难实现的，如自动驾驶或制造行业的定制化生产、质量控制等。因为这些核心业务对于技术的容错率较低，而可靠性、准确性要求更高。

为解决大模型的应用场景落地核心业务领域的问题，张钹院士提出了落地通用基础模型的三种方向：

第一，面向各个行业的垂类大模型；第二，在大模型的基础上打造产业应用；第三，让大模型与其他技术、工具相结合，创造产业应用。

大模型的六种架构模式

让大模型真正落地，同时还能使其用起来安全、可信、可控，是产业和企业普遍关注的话题。为此，张钹院士提出了基于大模型的六种架构模式。

第一，在很多大模型设计的过程中，都会增加提示工程这一至关重要的中间环节。它可以提高模型的理解和响应能力，从而输出更令人满意的结果。

第二，检索增强生成（RAG）对于事实性的问题，为了提高生成内容的确定性，生成式人工智能需要结合检索功能，通过触发外部知识库检索机制，辅助大模型生成更加准确、详尽且具有针对性的答案。

第三，加入领域知识和私有数，可以显著提高生成式人工智能的输出质量，使其更符合特定领域的需求。

第四，知识图谱与向量数据库将知识图谱与向量数据库结合使用，能够帮助生成式人工智能更好地理解和处理文本中的语义信息，可解决模型缺乏事实知识、幻觉和可解释性等诸多问题。在企业部署大模型时，通过建立向量数据库，并让它与文档数据库协同工作，从而提高生成结果的准确性。

第五，内部监测与控制在加以人类控制后，大模型可检测出数据偏差和漂移，也可处理异常情况。此外，引入智能体强化学习可以让大模型自我反应，帮助它完成感知、动作、学习的一体化，从而减少错误的发生。