生成式人工智能会塑造信息茧房？复旦教授揭示如何让危机“已知”_智能_资讯

2023年5月27日，是复旦大学118周年校庆。“校庆种种活动，以促进科学研究为中心。”从1954年校庆前夕时任校长陈望道提出这一主张开始，在校庆期间举办科学报告会，成为复旦的重要学术传统之一。

赓续学术传统，百年弦歌不绝。5月9日起，来自文社理工医各学科的50多位复旦名师将陆续带来学术演讲。

“2023相辉校庆系列学术报告”第十场，由复旦大学国家智能评价与治理实验基地副主任、大数据研究院教授赵星，与浙江大学公共管理学院信息资源管理系“百人计划”研究员蒋卓人于线上线下共话“生成式人工智能的挑战与治理”。

活动现场。本文均为复旦大学供图

从2011年苹果手机首次推出的Siri语音助手，到今年包揽奥斯卡七大奖项的电影《瞬息全宇宙》，生成式人工智能早已融入人类生活。当下，ChatGPT类工具进一步引爆全球人工智能热潮，赵星和蒋卓人携手带来一场贯穿生成式人工智能前世、今生和未来的学术盛宴，解析生成式人工智能带来的多重挑战，启发我们对其治理问题的思考。

生成式人工智能的前世今生

金色的夕阳被乌云遮住，小草在风雨中摇曳，水珠在叶片上滚动……蒋卓人首先播放了一段名为“Summer showers”（《夏日阵雨》）的视频。这段充满灵动色彩和生动风景的视频，却完全是由生成式人工智能模型创作的。

何为生成式人工智能？

目前，生成式人工智能还没有统一的定义，一般可以理解为一种能够根据提示生成文本、图像或其他媒体信息的人工智能系统。

“这个技术不是像魔法一样凭空出现的，而是有着悠久的历史渊源。”蒋卓人强调。在生成式人工智能90多年的发展历程中，不乏人类智慧闪耀的时刻。

1932年，法国工程师Georges Artsrouni创造了装置“mechanical brain”（机器大脑）。它通过查询多功能词典完成翻译，输入、输出都是一条纸带。蒋卓人认为，虽然它和今天的机器翻译不同，但它完全符合今天对生成式人工智能的定义，即人类输入一段内容，机器产生一段新的内容。

在20世纪中，麻省理工学院创造了最早的生成式人工智能之一Eliza，Judea Peal（朱迪亚·珀尔）引入了贝叶斯网络因果分析概念，Yann Lecun（杨立昆）等展示了如何利用卷积神经网络来识别图像……

2006年，华裔计算机科学家李飞飞着手构建数据库ImageNet。该数据库中有超过1400万张手工标注的图片，包含超过2万个类别。“正是有了这样一个庞大数据库的支撑，深度学习才能得以兴起。所以我们总说，好的科研品位，加上持续不断的努力，就能成就一段好的学术生涯。”蒋卓人评价。

ChatGPT何以成为明星产品？

1750亿参数量，3000亿训练单词数，这是ChatGPT的数据。2022年发布后，ChatGPT在短短两个月内吸引了超过1亿的用户，成为有史以来用户增长最快的应用。

蒋卓人认为，要理解ChatGPT，就要理解它的关键技术：大模型基础训练、指令微调、人类反馈强化学习。

“大模型的全称是大型语言模型，”蒋卓人讲道，“它是一种概率模型，能告诉你一个词出现的概率是多少。”