2023年5月27日,是复旦大学118周年校庆。“校庆种种活动,以促进科学研究为中心。”从1954年校庆前夕时任校长陈望道提出这一主张开始,在校庆期间举办科学报告会,成为复旦的重要学术传统之一。
赓续学术传统,百年弦歌不绝。5月9日起,来自文社理工医各学科的50多位复旦名师将陆续带来学术演讲。
“2023相辉校庆系列学术报告”第十场,由复旦大学国家智能评价与治理实验基地副主任、大数据研究院教授赵星,与浙江大学公共管理学院信息资源管理系“百人计划”研究员蒋卓人于线上线下共话“生成式人工智能的挑战与治理”。
活动现场。 本文均为 复旦大学 供图
从2011年苹果手机首次推出的Siri语音助手,到今年包揽奥斯卡七大奖项的电影《瞬息全宇宙》,生成式人工智能早已融入人类生活。当下,ChatGPT类工具进一步引爆全球人工智能热潮,赵星和蒋卓人携手带来一场贯穿生成式人工智能前世、今生和未来的学术盛宴,解析生成式人工智能带来的多重挑战,启发我们对其治理问题的思考。
生成式人工智能的前世今生
金色的夕阳被乌云遮住,小草在风雨中摇曳,水珠在叶片上滚动……蒋卓人首先播放了一段名为“Summer showers”(《夏日阵雨》)的视频。这段充满灵动色彩和生动风景的视频,却完全是由生成式人工智能模型创作的。
何为生成式人工智能?
目前,生成式人工智能还没有统一的定义,一般可以理解为一种能够根据提示生成文本、图像或其他媒体信息的人工智能系统。
“这个技术不是像魔法一样凭空出现的,而是有着悠久的历史渊源。”蒋卓人强调。在生成式人工智能90多年的发展历程中,不乏人类智慧闪耀的时刻。
1932年,法国工程师Georges Artsrouni创造了装置“mechanical brain”(机器大脑)。它通过查询多功能词典完成翻译,输入、输出都是一条纸带。蒋卓人认为,虽然它和今天的机器翻译不同,但它完全符合今天对生成式人工智能的定义,即人类输入一段内容,机器产生一段新的内容。
在20世纪中,麻省理工学院创造了最早的生成式人工智能之一Eliza,Judea Peal(朱迪亚·珀尔)引入了贝叶斯网络因果分析概念,Yann Lecun(杨立昆)等展示了如何利用卷积神经网络来识别图像……
2006年,华裔计算机科学家李飞飞着手构建数据库ImageNet。该数据库中有超过1400万张手工标注的图片,包含超过2万个类别。“正是有了这样一个庞大数据库的支撑,深度学习才能得以兴起。所以我们总说,好的科研品位,加上持续不断的努力,就能成就一段好的学术生涯。”蒋卓人评价。
ChatGPT何以成为明星产品?
1750亿参数量,3000亿训练单词数,这是ChatGPT的数据。2022年发布后,ChatGPT在短短两个月内吸引了超过1亿的用户,成为有史以来用户增长最快的应用。
蒋卓人认为,要理解ChatGPT,就要理解它的关键技术:大模型基础训练、指令微调、人类反馈强化学习。
“大模型的全称是大型语言模型,”蒋卓人讲道,“它是一种概率模型,能告诉你一个词出现的概率是多少。”