明升手机版(中国)

 
作者:沈湫莎 来源:文汇报 发布时间:2023/11/29 8:44:20
选择字号:
大模型爆火,ChatGPT在全球引发AI“狂飙”

 

“太忙了。”这是清华大学人工智能(AI)国际治理研究院副院长梁正面对记者脱口而出的一句话。
      
去年11月30日,非营利性研究机构OpenAI推出AI聊天机器人ChatGPT,它所展现出的智能涌现能力在全球范围内引发了一场AI“狂飙”,也在业界点燃了一场百模大战。在记者询问过的每一个和大模型相关的人中,“忙”是出现频率最高的词。
      
忙碌的景象不仅在国内,那些大洋彼岸原本早已习惯了“慢慢”打磨产品的AI专家们也进入了“满负荷”状态。“在谷歌、微软或OpenAI的办公室里,你能感受到他们的工作节奏至少比之前快了两倍。”梁正说。
      
这一切都是因为以ChatGPT为代表的大语言模型向世人展露出了前所未有的能力,一条通往AGI(通用人工智能)的道路被打通,谁也不希望落于人后。
      
这一年,人工智能领域发生的事件比前十年加起来还要多。据不完全统计,目前国内的AI大模型已超过100个。除了百度、阿里等互联网大厂,创新工场CEO李开复、美团创始人王兴、搜狗创始人王小川等“科技老兵”纷纷重披战甲进军大模型领域。
      
这一年,大模型改变了公众的关注点。据柯林斯词典统计,今年人们提及“AI”的次数是去年的4倍。而有关AI是否会取代人类的担忧,也比以往任何时候都紧迫而强烈。
      
前所未有的变革
      
“这是倾盆大雨前的一场雨,是一个分水岭。”OpenAI首席app家伊利亚·苏茨克维这样形容ChatGPT的诞生。
      
一年前的11月30日,ChatGPT上线,短短5天,用户数突破百万。由于太过火爆,OpenAI不得不暂时关闭了用户的测试入口。两个月后,ChatGPT月活跃用户破亿,刷新了App应用用户过亿的最快纪录。半个月前,OpenAI暂停ChatGPT Plus的新用户注册,原因是11月6日的开发者大会后,用户量激增。
      
一年来,ChatGPT从一个只能处理文字信息的网页端应用,变成了一个可以同时处理文字、语音、图像信息的超级应用,每周吸引上亿人使用。OpenAI也从一个非营利性研究机构变成了估值900亿美元的超级“独角兽”,聚拢了200万开发者。在最新演示中,ChatGPT的表现甚至超越了“神笔马良”——当有人想要做一个创业助手时,只要把概念说给GPT-4Turbo听,两三分钟后便可生成一个应用。
      
ChatGPT几乎以一己之力改变了AI研究生态。在它爆火之前,谷歌是该领域当之无愧的翘楚,不仅论文发表数量最多,其对思维链路提示、大模型涌现现象的研究也走在前列。那时,自然语言处理、计算机视觉等还是众人追捧的AI前沿领域;现在,几乎所有人都涌向OpenAI引领的生成式AI方向。今年2月,研究自然语言处理的复旦大学计算机app技术学院邱锡鹏教授团队发布国内首个类ChatGPT模型“MOSS”,也曾一度因用户的大量涌入而“宕机”。
      
与谷歌技术路线相比,OpenAI是“力大砖飞”的代表。“我们的算法非常简单。”伊利亚·苏茨克维直言不讳。他们把从海量数据中获取的标注信息导入模型,不断重复这个过程,最终得到一个超复杂的“黑箱”,即使是OpenAI首席app家自己也不知道模型中正在发生什么。
      
ChatGPT上线后,全球大科技公司几乎都发布了自己的大语言模型,比如谷歌的PaLM2、Meta的Llama2、百度的文心一言、华为的盘古等,但只要使用过这些模型,你就会发现,GPT模型是“独一档的存在”。对此,梁正解释说:“这种差距可能无关芯片、算法、数据,纯粹是OpenAI比较幸运。”

幸运是指什么?不妨从凯文·凯利的畅销书《失控》中寻找答案。他在书中预测明升m88的智慧来自涌现,而科技也是一种明升m88。伊利亚同样认为,数据在大模型“黑箱”中发生的就是演化,尽管世界上有很多这样的“黑箱”,但发生在GPT身上的涌现与众不同,如同300多万年前开始直立行走的“人类祖母”露西。
      
借助于世界上最大的算力和最强的GPU芯片,这一年,GPT正以人类难以想象的速度继续进化。事实上,在基于GPT-3.5模型的ChatGPT上线时,OpenAI已经完成了GPT-4的训练。而据微软研究院估算,GPT-4已经是一个早期的、仍不完整的AGI系统。
      
业界认为,800亿参数是大模型得以涌现的“门槛”,这意味着全球有多个大模型可能涌现智能。对于大模型的未来,梁正借用菲尔茨奖得主陶哲轩的说法表达自己的预见:如果使用得当,到2026年,AI将成为数学研究和许多其他领域值得信赖的合著者。而数学,一直是象征人类智力巅峰的学科领域。
      
前所未有的繁荣
      
在人工智能投资领域,美国与明升中国是全球投入最多的两个国家。随着ChatGPT的横空出世,各国对AI的投资继续加码,中美之间的AI投资差距正在缩小。
      
早在ChatGPT发布之初,明升中国计算机学会术语工委副主任、同济大学特聘研究员王昊奋就意识到,这是一个改变人与计算机交互模式的“接口”。这也解释了为何整个科技界对它如此兴奋,以至于任何可能“搭边”的人都动了起来。
      
浙江大学上海高等研究院常务副院长、人工智能研究所所长吴飞对大模型的态度有过一次明显改变。“今年3月前,我对它还是旁观待变的态度,现在我已经深刻感受到它的‘通用之力’。”
      
大模型是比互联网门槛更低的“接口”。吴飞解释说,互联网的能力是赋能特定领域、特定任务。比如用互联网赋能餐饮,可以让程序员做一个美食推荐应用,而要赋能体育,则可以做一个体育手机版推送应用。因此,现在我们每个人的手机里都装有各种不同功能的应用。大模型则不同,基础大模型可以解答我们提出的任何问题,但如果想要在专业上更进一步,则需要垂直领域大模型。
      
过去一年,吴飞团队打造了多个垂直领域大模型。只用45TB(万亿字节)法律方面的专业数据,他们就训练出了“智海-录问”,一个为法律从业者提供法律问答、知识检索增强问答、案情分析、意图识别等多项法律辅助服务的工具。过去一年,该模型已应用于浙江省高级人民法院,大大加快了法官审案流程。
      
科大讯飞今年则一口气发布了12款行业大模型,涉及金融、汽车、运营商、工业、住建、法律等多个领域。科大讯飞总裁刘庆峰援引知名咨询机构Gartner的数据表示,目前全球已有5%的企业在使用大模型,到2026年,这一数字将达到80%。
      
在邱锡鹏看来,大模型在应用端的发力速度会比预计的更快,覆盖面也会更广。因为大部分软硬件服务公司都开始接入大模型,在感叹效率提高的同时,用户可能不知道自己其实已经在使用大模型了。
      
梁正用30年前的互联网“诞生时刻”来类比当下,且相较前者,大模型能够覆盖的行业更多,更加避无可避。他甚至认为,30年的互联网繁荣似乎就是为大模型准备的,因为驱动大模型涌现的主要数据来自互联网。
      
这一年,大模型已经在教育、医疗等诸多领域展现出过人本领。不久前,ChatGPT根据病情描述和检查手机版,帮助一位母亲为她的孩子找到了病因——新生儿发病率最高只有0.025%的脊髓栓系综合征。此前,这位母亲已经带着孩子求医3年,求助了17位医生,都没有诊断出原因。
      
前所未有的分裂
      
如果说ChatGPT的问世让全球科技界沉浸在大模型的狂欢之中,那么关于AI伦理之争则是新技术“狂飙”之下的灵魂拷问。
      
从3月底的千人联名信到5月底的AI风险声明,在要不要继续推动大模型发展、如何防范AI风险上,即使是AI阵营内部也呈现出了前所未有的分裂。5月初,有“AI教父”之称的计算机app家杰弗里·辛顿离开谷歌,加深了人们对AI是否已经失控的担忧。他坦言,之所以离开谷歌,就是为了完全自由地说出AI潜在的风险,向世人提出警示。
      
最具戏剧性的事件要属最近发生在OpenAI内部的“宫斗”:首席执行官山姆·奥尔特曼被董事会开除,几天后,他又宣布重返OpenAI。业内普遍推测,如何规制AI发展是公司内部矛盾爆发的导火索。作为掌握最“聪明”大模型的公司,OpenAI的态度很大程度上代表了AI发展的最真实状态,而据其判断,AGI有很大概率会在10年内到来。
      
人类已经致力于发展AI超过60年,为什么这一次如此警铃大作?伊利亚·苏茨克维表示,AGI与迄今为止人类创造的任何东西都不同,它是有自己目标的完全自主的生物。如果这一天到来,人与AGI的关系相当于人与动物,只不过这一次站在动物位置上的是人类。
      
奥尔特曼则表示,AGI只是发展AI道路上的一个小节点,他们的远景目标是创造出远超人类智能的超级AI。不过即便如此,他仍向美国国会表达了希望加强对OpenAI监管的愿望。今年7月,OpenAI首次提出“超级对齐”概念,宣布将投入20%的计算资源、花费4年时间全力打造一个超级对齐系统。
      
如何保证AI向善?梁正说,目前业界观点主要分成了两派:一派认为应该先在AI中普及人类的道德规范再允许其发展;另一派则认为AI在发展中会形成自己的道德规范,就像人类在群体行为中产生了道德一样,但前提是AI需要拥有和人类一样的外形。
      
 一方面人们对可能到来的AGI争论不休,而另一方面,充分的竞争则会加速AGI的到来。上海交通大学教授江晓原对人类能否对一路“狂飙”的AI适时“踩刹车”表示悲观。他说,企业是推动AI“狂飙”的决定性力量,它无法依靠自己的道德慢下来,因为如果你不做,别人就会赶超你。
      
仍有许多app家坚信AI只是人类发明的一件好用的工具,即便如此,它仍然有毁灭人类的风险。清华瑞莱智慧科技有限公司AI治理研究院院长张伟强提出了这样一个假设:人类总是在不断试错的过程中走向成功,而大模型提供了前往正确答案的直通车,人们将由此减少很多试错机会。正如刘慈欣在科幻作品《镜子》中描写的一种人类“结局”,人类因为从不犯错而走向灭亡。
      
还有更多问题
      
“与上半年的烈火烹油相比,下半年大家对大模型的态度务实了许多,它还有很多问题没有解决,比如模型复杂度、多模态融合、模型评测等,我们都在全力解决。”邱锡鹏说。
      
吴飞也表示,继续通过某些任务对大模型进行特定训练,以期在某个指标上超过ChatGPT,意义可能并不大,明升中国在大模型上的机会与当年的互联网一样,即从实际应用倒逼模型迭代。
      
许多专家都表示,国内大模型的挑战主要来自两方面——算力和数据。大模型与其他软件应用不同,不仅训练起来费钱,运行起来更烧钱。想要处理用户输入的问题,基本上每个字都要在大模型上跑一遍,参数上千亿的大模型,每跑一遍都要调用多个A100 GPU,每个价值一万美元,十分“烧钱”。
      
国内使用大模型的用户画像也和国外有所区别。简单来说,国外有更多高端用户倾向于使用GPT,这些相对高质量的海量数据使GPT的迭代比国内大模型要快。
      
如何破局?当务之急是提高算力。据浪潮信息、国际数据公司(IDC)和清华大学联合发布《2021-2022年全球计算力指数评估手机版》,15个重点国家的计算力指数平均每提高1个点,国家的数字经济和GDP将分别增长3.5‰和1.8‰,预计该趋势在2021-2025年将继续保持。吴飞认为,随着“算力网”的落地,国内大模型会在未来几年不断带来好消息。
      
大模型是AI发展唯一正确的路吗?Meta首席AIapp家杨乐昆对此并不认同。在他看来,大模型是“一条下坡路”,远离了通往更强大的AI的道路。他在《经济学家》上撰文说:“大型语言模型能有多聪明、能有多准确,都是有限度的,因为它们没有现实世界的经验。”
      
邱锡鹏表示,在使用工程性的方法确保自己“不掉队”的前提下,还要想办法研究下一代大模型,即在算力不够的现有条件下,有无新途径去实现生成式AI。“前者我们只能跟随,后者则有几率超越。”他透露,MOSS正朝着这一目标努力。这一年来,它在架构上有所创新,规避了现有系统的一些缺陷;在“对齐”上采用了更人性化、更多维度的幻觉数据集,使内容生成更安全;在学习能力上也更加主动。
      
面对大模型高昂的成本和耗能,整个行业也在寻找解决办法。一些科技巨头亲自下场研发芯片,比如谷歌、亚马逊、微软,甚至OpenAI都在考虑针对AI运算自研芯片,或是让消费者购买更适合大模型计算的手机和电脑,分担算力成本。
      
“开源会让创新速度更快。”上海对外经贸大学人工智能与变革管理研究院副院长、上海开源信息技术协会秘书长张国锋说,目前国内大模型的开源方式都以企业为主导,并且只开源了整个大模型生态的一小部分,从而出现了算力分散、算力资源浪费等问题。他建议整合政府、高校、企业等优质的大模型生产要素数据、算法和算力,采用开源项目的协作模式和治理方式降低成本,建立大模型时代的“Linux”生态位。

(原标题:大模型爆火这一年——对ChatGPT在全球引发AI“狂飙”的观察与思考)

 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关手机版 相关论文

图片手机版
>>更多
 
一周手机版排行
 
编辑部推荐博文