国内AI大模型“太热”又“太小”

2023-06-10 07:42:04

来源：北京日报

(资料图片仅供参考)

昨天，2023北京智源大会开幕。国际人工智能（AI）领域的顶级专家和学者齐聚大会，围绕当前人工智能学术领域的迫切问题和产业落地存在的各种挑战，开展深入研讨。正值风口的大模型是最热话题，专家认为，AI未来将颠覆性地改变人们生活，当前中国的大模型发展“太热”，但规模又“太小”。集中力量办大事，是目前最应该发力的。

北京智源大会是智源研究院举办的年度国际性人工智能的高端学术交流活动，今年是第五届，已经成为北京乃至于中国人工智能发展的学术名片。

大模型是全社会关注的热点。什么是大模型？智源研究院院长黄铁军当日在大会上表示，大模型至少有三个特点：其一，规模要大，神经网络参数要达到百亿规模以上。其二要有涌现性，这是人工智能发展六七十年来最具里程碑的一个新特性，可以产生预料之外的新能力。如果一个模型只从原有的数据、算法推导出来结果，那不叫“涌现”，“涌现”一定是有全新的功能出现。其三，通用性，也就是说，它不限于专门问题或者专门领域，能够解决各类问题。

从算法、算力和数据三个维度，目前大模型发展的制约点在哪里？黄铁军在接受采访时表示，目前制约点是中国训练的大模型都太小，智能水平也有差距。从技术判断来说，现在大模型的“大”远远没有达到天花板和包罗万象的程度。仅从语言这一大类来说，可能也得3年左右的时间才能做到包罗万象。他判断，未来3年大模型的规模肯定还会放大，能力还会更强，这应该是基本趋势。

“现在太热，太热就是制约点。”他表示，国内大模型有很多，但顶尖的还没有，这是当前的问题。重复性发力越多反而越分散资源，在大模型方面能否集中力量办大事，这是目前最应该发力的。

智源研究院是2018年11月成立的新型民营非盈利研发机构。近年来研究院积极探索新型科研管理等体制机制的创新，已在创新研究、学术生态、成果转化等方面取得重大进展，取得一系列研究成果。当日，智源研究院正式推出全面开源的“悟道3.0”模型，包括视觉大模型EVA、大语言模型悟道·天鹰在内的一系列多类别模型。

关键词：