本文来源:时代周报 作者:郭美婷
12月2日至4日,2024年“读懂中国”国际会议在广州举行。
“人工智能的发展并不是一件新事情。”在研讨会上,香港科技大学校董会主席、美国国家工程院外籍院士、英国皇家工程院外籍院士沈向洋谈到。
1956年,达特茅斯会议首次提出了“人工智能”这一概念。此后,人工智能发展几经起伏,1986年世界上第一台自动驾驶汽车启动,1997年深蓝(Deep Blue)计算机击败了国际象棋大师卡斯帕罗夫,2015年深度学习技术迅速发展……
图源:主办方供稿
近年来,以Open AI为代表的大模型蓬勃发展,带给了世界巨大冲击,如文生文、文生图等。
人工智能的发展让算力变得供不应求。“讲卡伤感情 没卡没感情。”沈向洋表示,大模型数量爆发式增长的当下,GPU算力每年以4倍的速度增长,10年后预计将增长100万倍。在这个过程中,英伟达成为最大的赢家,去年该公司的下单量至少是15万张。
此外,数据也是大模型发展的另一关键要素。沈向洋表示:“GPT3用了大概2万亿Token,到GPT4时,一开始讲的是12万亿的数据,但是在不断训练中,我们预计大概是用了20T的数据……这基本是把互联网上能公开搜到的数据都拿了下来,洗干净后的数据量。”
他提到一个有意思的现象,互联网经历了40年,人们将数据放到网上——好像就是为了这样一个“ChatGPT的时刻”。
“我们是第一代人类智慧和人工智能共存的,喜欢也好,不喜欢也好,未来人工智能的数量是远远超过人类的数量,今天我们在这里读懂中国,未来我觉得还需要读懂人工智能。”沈向洋表示。
他认为,未来通用大模型会收敛得很快,而行业大模型数量会越来越多。从国内的整体发展来看,到7月底,中央网信办批准的大模型大概有 200 个,其中只约有1/ 3是通用大模型,2/3是行业大模型。
“我们今天对人工智能的理解还是远远不够的。大模型虽然被做出来,但确实不可理解、不鲁棒(稳定)的,这让人怀疑,现在一套体系是不是真的能走远。人们认为智能有限,似乎大模型出来之后,智能就出来了。”沈向洋提到,去年,他在香港科技大学组织了一批科学家,正在试图解开AI涌现出来背后的数学原理的谜题。