首页 > 正文

中国科学院院士张钹:大语言模型“三大能力”与“一大缺陷”不容忽视

2024年08月15日 21:22
作者:张露
来源: 广州日报
编辑:东方财富网

手机上阅读文章

  • 提示:
  • 微信扫一扫
  • 分享到您的
  • 朋友圈

  在当今技术迅速发展的时代,生成式人工智能与大模型正成为推动产业变革的重要力量。随着AI技术的不断成熟与普及,它的应用已从个人领域扩展至企业层面,广泛覆盖各行各业。

  那么,新技术究竟会给产业带来哪些积极影响?它又将如何平稳落地到场景?近日,在用友主办的“2024全球商业创新大会”上,中国科学院院士、清华大学人工智能研究院名誉院长张钹发表了主题为《生成式人工智能时代的产业》的演讲。

  会上,张钹院士从能力、应用、架构、趋势等几个维度,详尽阐述了学术界关于大模型的洞察与思考,全面剖析了大模型的演进路径,就该技术的应用前景、挑战及其在不同领域的实际应用展开了深入探讨。

  大语言模型“三大能力”与“一大缺陷”不容忽视

  会上,张钹院士探讨了生成式人工智能的核心优势及其可能带来的挑战。目前,在大模型发展的进程中,已呈现出“三大能力”和“一大缺陷”。

  其中,生成式人工智能具备三大核心能力为:

  第一、强大的语言生成能力,即在开领域生成多样性的、语义连贯的、类似人类的文本。这是大语言模型区别于其他计算机生成语言的灵魂和优势所在;

  第二、强大的自然语言对话能力,即在开领域实现人机自然语言对话;

  第三、强大的迁移能力,即在代理任务上训练一个模型,只需要少量数据和微调,就可以适配到下游任务中,从而凸显出大模型可举一反三的能力。

  除了上述优势外,大模型也呈现了一大缺陷,那就是大模型的幻觉。换句话说,在多样性输出的过程中,大模型也会犯错,这与它的创造性同时产生。事实上,这种幻觉是外部信息驱动下产生的,因为大模型与人类生成的语言只是行为上相似,而内在机制完全不同。更深一步讲,这也揭示出了基础模型的局限性。一方面,它输出的结果不一定正确,且质量不可控;另一方面,大模型不可信任;还有一方面,大模型对提示词的依赖性强,鲁棒性较差。张钹院士表示,正因具备上述优势与缺陷,产业在落地大模型应用时必须格外重视这些因素。

  第三代人工智能技术的发展关键点仍在于如何让它落地

  随着生成式人工智能的快速发展,业界也对其未来前景提出了质疑。针对这一业界普遍关注的问题,张钹院士解释道,生成式AI是人类发展史上的一次重大技术突破。为此,人类花费了几十年时间解决了人工智能领域中的三个关键技术问题——文本的语义向量表示、生成式预训练转换器、自监督学习。

  其中,最关键的技术创新就在于文本的语义向量表示,它实现了从信息形式的处理到信息内容处理的跨越。张钹院士表示,这项技术真正意义在于它将语言问题转变为一个数学问题。原来,文本仅代表了一个个符号,符号是存在于离散空间的,这些很难用数学工具去解析。而现在,语言被翻译为向量,计算机根据向量就可以解析成语义,对信息的内容加以处理,从而帮助人类真正进入到人工智能时代。

  基于对大模型原理的深入理解,张钹院士对第三代人工智能技术的发展抱有十足的信心。就目前来看,问题的关键点仍在于如何让它落地。

  张钹院士认为,第三代人工智能的发展方向重点在于:第一,构建具备可解释与鲁棒(稳健)的AI理论与方法,消除人们心里产生的恐慌。其次,开发安全、可控、可信、可靠且可扩展的技术,从而驱动人工智能产业的繁荣发展。第三,推动AI的创新应用与产业化。这表明,AI技术的研究与开发不仅仅是学术上的突破,还需要与产业需求紧密结合,将技术创新转化为现实应用,从而带来经济效益和社会进步。

  同时,他还提出了“知识驱动 + 数据驱动”的理念,通过整合知识、数据、算法和算力这四大要素,确保AI技术不仅具备强大的智能能力,还能够在多样化的应用场景中发挥稳定且长效的作用。

  基础模型的三种落地方向

  目前,在生成式AI的众多应用场景中,高阶应用如设计、规划,低阶应用如服务、营销是相对容易实现的。例如,券商可依托大模型打造新一代AI中台大脑,帮助企业实现智能化的开户、客服、AI选股等服务场景。

  与之相反,涉及企业关键业务领域的大模型应用场景则是较难实现的,如自动驾驶或制造行业的定制化生产、质量控制等。因为这些核心业务对于技术的容错率较低,而可靠性、准确性要求更高。

  那么,大模型的应用场景该如何落地到核心业务领域?技术提供商、产业界的机会在哪里?

  张钹院士提出了落地通用基础模型的三种方向。

  第一,面向各个行业的垂类大模型;

  第二,在大模型的基础上打造产业应用;

  第三,让大模型与其他技术、工具相结合,创造产业应用。

  找到了大模型的落地方向,那么让大模型真正落地,同时还能使其用起来安全、可信、可控,这是产业和企业普遍关注的话题。为此,张钹院士提出了基于大模型的六种架构模式,具体为提示工程、检索增强生成(RAG)、微调、知识图谱与向量数据库、内部监测与控制以及安全与治理。

  在人工智能技术突飞猛进的今天,大模型正在各行各业中展现出巨大的潜力。张钹院士强调,坚持中国自主发展之路,必须认识到知识驱动与数据驱动在第三代人工智能中的核心作用,充分结合和利用知识、数据、算法、算力等要素,从而驱动中国人工智能产业的繁荣发展。

(文章来源:广州日报)

(原标题:中国科学院院士张钹:大语言模型“三大能力”与“一大缺陷”不容忽视)

(责任编辑:73)

 
 
 
 

网友点击排行

 
  • 基金
  • 财经
  • 股票
  • 基金吧
 
郑重声明:天天基金网发布此信息目的在于传播更多信息,与本网站立场无关。天天基金网不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资决策建议,据此操作,风险自担。数据来源:东方财富Choice数据。

将天天基金网设为上网首页吗?      将天天基金网添加到收藏夹吗?

关于我们|资质证明|研究中心|联系我们|安全指引|免责条款|隐私条款|风险提示函|意见建议|在线客服|诚聘英才

天天基金客服热线:95021 |客服邮箱:vip@1234567.com.cn|人工服务时间:工作日 7:30-21:30 双休日 9:00-21:30
郑重声明:天天基金系证监会批准的基金销售机构[000000303]。天天基金网所载文章、数据仅供参考,使用前请核实,风险自负。
中国证监会上海监管局网址:www.csrc.gov.cn/pub/shanghai
CopyRight  上海天天基金销售有限公司  2011-现在  沪ICP证:沪B2-20130026  网站备案号:沪ICP备11042629号-1

A
安联基金安信基金
B
博道基金渤海汇金北京京管泰富基金百嘉基金贝莱德基金管理博时基金宝盈基金博远基金
C
长安基金长城基金长城证券财达证券淳厚基金创金合信基金长江证券(上海)资管长盛基金财通基金财通资管诚通证券长信基金财信基金财信证券
D
德邦基金德邦证券资管大成基金东财基金达诚基金东方阿尔法基金东方红资产管理东方基金东莞证券东海基金东海证券东吴基金东吴证券东兴基金东兴证券第一创业东证融汇证券资产管理
F
富安达基金蜂巢基金富达基金(中国)富国基金富荣基金方正富邦基金方正证券
G
光大保德信基金国都证券广发基金广发资产管理国海富兰克林基金国海证券国金基金国联安基金国联基金格林基金国联民生国联证券资产管理国融基金国寿安保基金国泰海通资管国泰基金国投瑞银基金国投证券国投证券资产管理国新国证基金国信资管国信证券国新证券股份工银瑞信基金国元证券
H
华安基金汇安基金华安证券华安证券资产管理汇百川基金华宝基金华宸未来基金华创证券泓德基金华富基金汇丰晋信基金海富通基金宏利基金汇泉基金华润元大基金华商基金惠升基金恒生前海基金华泰柏瑞基金华泰保兴基金红土创新基金汇添富基金红塔红土华泰证券(上海)资产管理华夏基金华西基金华鑫证券合煦智远基金华银基金恒越基金弘毅远方基金
J
嘉合基金金融街证券景顺长城基金嘉实基金九泰基金建信基金江信基金金信基金金鹰基金金元顺安基金交银施罗德基金