以ChatGPT为代表的人工智能生成内容(AIGC)发展日益蓬勃,引起了业界与学界的广泛讨论,然而目前对于AIGC如何影响学术生态的讨论尚不系统。文章首先梳理了AIGC的源起与发展,并讨论了ChatGPT带来的新变革。然后基于学术生态的基本概念构建分析框架,讨论了AIGC对学术生产、学术评价、学术传播方面的影响,并以ChatGPT为例进行了具体分析与讨论。研究认为,以ChatGPT为代表的AIGC可以在知识生产、科学评价、快速传播等方面发挥作用,但也可能造成责任分散、潜在歧视与信任危机。最后,文章讨论了如何应对AIGC带来的风险挑战。未来需要进一步强化责任规范、构建审查机制与推动研究透明。本研究为政策制定者理解AIGC对学术生态的影响提供了一个理解视角,并对如何科学合理使用AIGC提出了逻辑进路,旨在为未来学术生态的良性健康发展提供参考。
The Impact and Response of Artificial Intelligence Generated Content (AIGC) on Academic Ecology——Discussion and analysis based on ChatGPT
LUO Fei MA Yu-xuan
School of Public Administration and Policy, Renmin University of China Information Technology Center, Tsinghua University
The growing development of artificial intelligence-generated content (AIGC) represented by ChatGPT has attracted widespread discussion in the industry and academia, yet there is still an unsystematic discussion on how AIGC affects the academic ecology. This paper first compares the origin and development of AIGC and discusses the new changes brought by ChatGPT. Then it constructs an analytical framework based on the basic concept of academic ecology, discusses the impact of AIGC on academic production, academic evaluation, and academic communication, and takes ChatGPT as an example for specific analysis and discussion. The study concludes that AIGC, represented by ChatGPT, can play a role in knowledge production, scientific evaluation, and rapid dissemination, but it may also cause fragmentation of responsibility, potential discrimination, and trust crisis. Finally, the paper discusses how to deal with the risk challenges posed by AIGCs. The future needs to further strengthen responsibility norms, build review mechanisms and promote research transparency. This study provides a perspective for policymakers to understand the impact of AIGC on academic ecology and proposes a logical progression on how to use AIGC scientifically and rationally, aiming to provide a reference for the sound and healthy development of academic ecology in the future.
artificial intelligence generated content; academic ecology; ChatGPT; academic production; academic evaluation;
近年来人工智能生成内容(Artificial Intelligence Generated Content,AIGC)快速发展,逐渐成为AI发展的一个关键分支。近日,由Open AI发布的ChatGPT展现出惊人的内容创作能力,使AIGC再度受到广泛的关注。众多专家学者对这一问题表达了看法:一部分学者表达了担忧和焦虑,例如著名语言学家、哲学家Chomsky表示ChatGPT是一种“高科技的剽窃”
一 AIGC与ChatGPT:源起与发展
ChatGPT是AIGC的最新成果,能够输出自然语言
1 AIGC及其发展脉络
对于AIGC而言,学界或业界还没有得出广泛认可的定义。有些研究者认为AIGC是算法深度参与的信息生产模式。例如《AIGC白皮书》认为AIGC是通过人工智能算法对数据或媒体进行生产、操控和修改的统称
AIGC的发展历程可以分为三个阶段,分别是萌芽、发展与勃兴。萌芽阶段是指20世纪50年代到21世纪10年代,其主要产品包括计算机创作的音乐作品、人机对话机器人、语音控制打字机等。1947年,莱杰伦·希勒(Lejaren Hiller)和伦纳德·艾萨克森(Leonard Isaacson)完成了历史上第一支由计算机创作的音乐作品。萌芽阶段的突出特点是成本高昂,缺乏成熟的商用产品。随着人工智能算法的进步,AIGC进入发展阶段。产品的自动化程度和智能化程度日益提升,出现了100%由人工智能生成的诗集、DELL-E等产品。但同时仍成本依旧高昂、成熟产品尚不丰富、商业模式还不明朗等问题。21世纪10年代以来,AIGC进入勃兴阶段,以ChatGPT、Bard、文心一言为代表的大型语言模型持续成熟。虽然目前其成本依旧高昂,但产品形态已经较为成熟,商业模式也在不断明朗。其发展脉络如表1所示。
表1 人工智能生成内容(AICG)发展脉络 导出到EXCEL
阶段 | 时间 | 产品 | 特性 |
萌芽 | 20世纪50年代— 21世纪10年代 | 计算机创作的音乐作品;人机对话机器人;语音控制打字机等 | 成本高昂;缺乏成熟产品 |
发展 | 21世纪10年代— 21世纪20年代 | 100%由人工智能生成的诗集;Open AI公司推出的DALL-E等 | 成本高昂;成熟产品不多;商业模式不明朗 |
勃兴 | 21世纪20年代至今 | ChatGPT;Bard;文心一言等 | 成本高昂;较为成熟;商业模式明朗 |
2 AIGC与学术生态
AIGC的强大内容创作能力正在日益渗透到人类生活的方方面面,其也将对学术生态带来重要影响。从广义上说,在学术生产的过程中,凡是利用人工智能进行的内容生产都可以被视为AIGC的一部分,包括但不限于文献检索、辅助选题等环节。一部分学者认为人工智能技术可以赋能学术生产。例如人工智能技术可以在监测学术不端、推荐审稿人等方面发挥作用
从狭义上看,只有在学术作品中直接利用人工智能技术完成产出观点、文献评述等工作的内容生产过程才可以被认为是AIGC的一部分。在ChatGPT出现之前,AIGC更多的是作为一个研究对象参与到学术生产之中。在ChatGPT出现之后,AIGC才被当作具有能动性的主体对待。有学者认为,AIGC可以成为个体的外脑,并与内脑构成复合脑,进而引发学校教育在思维、问题、逻辑等方面的变革
3 AIGC的新变革:ChatGPT
从产品的角度来看,ChatGPT是更加完备的AIGC产品。首先,ChatGPT有望开启通用型人工智能(Artificial General Intelligence,AGI)时代。AGI指的是人工智能可以实现和人类近似的思考能力,处理多种类型的任务。ChatGPT可以从海量数据中学习各种知识并生成解决办法,处理多种类型的实际问题,超越单一任务场景
从学术生态角度来看,ChatGPT有望在生产、传播、评价等环节带来新的变革。在学术生产过程中,ChatGPT可以凭借自然语言生成能力、强大的训练数据库、多重内容交互等特性成为学术生产的强力助手,在论文构思、文献检索等多个方面发挥重要作用。在学术传播过程中,ChatGPT可以利用自身的观点组织能力,形成传播材料与推荐模型。此外,ChatGPT还有望在信息传播、观点搜集等方面发挥辅助作用。在学术评价过程中,ChatGPT可以对相关文献做出初步审查与归纳,强化学术评价的效率与质量,辅助进行质量评价。但于此同时,ChatGPT也可能带来新的隐忧,具体将在本研究的后续部分展开讨论。
二 如何发生:AIGC带来的学术生态变革
日益繁荣的AIGC无疑会对内容创作产生重要影响。从某种意义上说,学术生产也是一种内容创作的过程,其自然也会受到影响。学术生态为理解这一影响提供了一个视角。从广义上看,学术生态指的是与学术有关的社会生态、自然生态、文化传统等众多要素
从某种程度上说,学术生产、学术传播、学术评价三个环节都是行动层面的表征,未能揭示学术生态的内核关系。事实上,学术生态的发展依赖学术共同体中通过多种互动建立的共识与非正式决策
基于这一内核关系的变化,行动层面的各个环节也将发生改变,进而影响整个学术生态。在此之前,有必要就行动层面的概念加以定义。学术生产指的是从事学术活动的研究者以学术创新为追求,对学术发展的再生产价值
三 机遇与风险:AIGC对学术生态的影响
AIGC强大的内容创作能力将对学术生态带来影响,那么,我们应该从哪些角度来理解AIGC对学术生态的影响呢?本文主要考虑从学术生产、学术评价、学术传播三个环节展开论述。首先,学术生产、学术评价和学术传播是学术生态的关键环节和主要领域,这三个环节集中体现了学术思想与创新的基本逻辑和演变轨迹。借由这一分析框架,我们得以呈现出学术生态的基本面向与运行结构。其次,AIGC在这三个环节存在深度介入的可能。作为目前影响力较大的AIGC产品,ChatGPT有潜力辅助人类进行海量信息的收集、处理、输出与总结,在知识生产、知识传播等方面有所作为。因此,我们必须考虑AIGC对学术生态的影响与作用,并具体到学术生产、学术评价、学术传播等方面。
1 学术生产
学术生产是学术生态的基础环节,其在学术发展中处于基础性地位。AIGC对学术生产的发展可能带来多重影响。这些影响可以从两个方面来看:一方面,AIGC可以辅助知识生产;另一方面,AIGC带来了学术责任的分散。
(1)机遇:辅助知识生产
学术生产的关键是产出具有创新性的知识,因此知识生产也是学术生产的关键环节,对文献的检索与整理则是知识生产的基础环节。就目前而言,这一环节主要取决于知识生产者的理解和视角,需要自行判断文献的观点与可靠性。但知识生产者受到人类精力的固有限制,难以处理海量信息,也可能缺乏不同观点的碰撞与争鸣。AIGC有望帮助知识生产者克服相关问题,提升知识生产效率。具体来说有以下三点:
①AIGC可以辅助文献梳理和搜集工作。以ChatGPT为例,其可通过自然语言的对话快速生成某个话题领域相关文献,也可以按照主题、关键词等检索条件对相关文献进行汇总与分析。诚然,ChatGPT检索文献的合理性与准确性仍旧受到质疑与拷问。但相较于人类的算力与记忆力,人工智能凭借其高算力、高互联等特性,其在快速搜集、检索信息时具有显著优势。
②AIGC可以辅助进行观点评述与讨论。在知识生产过程中,学者需要通过不同领域、学科、理论、视角的沟通与交流产生新的洞见。首先,ChatGPT可以通过算法模型对文本内容做出分析和总结。其次,ChatGPT已经具备一定的推理能力,可以通过思维链(Chain-of-Thought,CoT)理解推理过程。因此其能够帮助知识生产者续写文字、头脑风暴,甚至进行观点讨论,这无疑能够帮助知识生产者提升工作效率。
③AIGC可以辅助提升写作质量。在知识生产的过程中,学者必须关注如何以一种简明清晰的方式将观点传递给读者。为此,学者要不断考虑不同类型的表达方式和语言组织,以求简洁明了。ChatGPT可以帮助人类进行自然语言的组织与优化,使研究者的表达更加符合不同的语言习惯,检查语法局式,优化篇章布局。
(2)风险:学术责任分散
与此同时,AIGC也会给知识生产带来新的挑战。首先就是学术责任的分散。所谓学术责任,指的是一种内生性的学术契约精神,是学者必须坚守的学术底线和自律精神
2 学术评价
学术评价是以追求真理和知识创新为尺度,对学术活动效果做出价值判断的过程
(1)机遇:助力评价体系
正如上文所言,ChatGPT输出的结果已经可以在形式和表达上与人类保持高度近似。因此仅靠人类自身的理解和判断能力,已经很难在形式上判断学术作品出自谁手,进而在学术评价上造成新的困难。例如据《纽约时报》报道,北密歇根大学的哲学教授Antony Aumann读到的一篇“全班最好的论文”就出自ChatGPT之手
①AIGC可以助推同行评议。随着学术研究的快速发展,需要同行评议的文章数量暴增,同行评议速度慢、成本高等问题逐渐暴露,科学家的批评和抱怨也在与日俱增
②AIGC可以赋能期刊运作。学术期刊的运作离不开编辑的辛勤工作。编辑必须在海量的自然来稿中完成快速甄别和判断文章质量。就目前来看,AIGC有潜力成为期刊编辑运作的助推剂。例如可以考虑引入ChatGPT构建更加即时的审稿流程与反馈系统,同时也可以借助ChatGPT构建更加个性化的审稿服务系统。目前,已有政府机构表示正在积极会同国内企业开展技术研究,推动ChatGPT与政府服务应用相结合
(2)风险:产生潜在歧视
首先,AIGC的运作高度依赖数据指标,对定性的学术评价可能造成冲击。AIGC高度依赖算法模型与量化数据,这导致其需要依靠被引量、下载量等指标进行评价。然而对于学术作品而言,量化指标仅是一个维度,学术作品的价值必须经过多元综合考量。目前AIGC还无法模拟人类专家的思考模型和行为习惯,也无法将专家意见纳入生成模型。因此,AIGC可能无法公允的判断学术产品的学术价值,造成学术活动中的区别对待
其次,AIGC的运作依赖海量资金支撑。以ChatGPT为例,其基础模型有1750亿个参数,其训练一次需要花费450万美元
3 学术传播
学术传播是人类科学活动的重要组成部分,是推动科学发展的重要手段。其中,知识的生产、传递和利用是学术传播体系的核心概念
(1)快速传播
随着算法时代的到来,智能算法可以捕捉和探查用户兴趣,在海量信息中搜集、处理、生成定制化的信息推送。AIGC的出现无疑大大加速了这一过程,借助AIGC的相关技术,学术产品可以快速生成定制化的文章摘要、综述文字、信息推动与汇总分析。这主要在于以下几点:
①AIGC可以快速生成文字、图片、视频等多媒体内容,这无疑可以帮助学者快速产出解释性的信息,快速完成文字推介、图片介绍等事务性工作,极大地提升信息传播的速度与效率。
②AIGC可以实现定向推送。学术传播无疑也需要实现精准触达可能感兴趣的相关群体,因此学术传播也可以借助AIGC的算法模型,精准定向推送相关研究成果,同时在内容和形式上保持高度的定制化风格,从而实现更好的用户体验和传播效率。
(2)信任危机
但与此同时,学术传播中AIGC的使用也可能带来新的信任危机。这种信任危机主要来自于学术共同体内部的学术造假、社会公众对于学术权威的信任等方面。
首先,AIGC可能造成产生新的传播造假。ChatGPT学习海量的在线文本数据库,以语言统计的方式进行运作。其数据库很难进行全面彻底的清洗,不实、虚假信息会使ChatGPT输出看似合理但实际荒谬的知识,很容易传播误导信息。《自然-机器智能》(Nature Machine Intelligence)的一篇社论表示ChatGPT甚至会输出虚假的参考文献。那些使用严肃内容进行训练的模型表现也不佳。Meta发布的Galactica使用学术摘要进行训练,有望提供出色的科研辅助功能,但是其测试版也被用户发现会产生不准确的内容,现在已经下架。
其次,AIGC可能挑战公众对学术界的信任。AIGC的输出结果不再由具有专业知识的专家或者学者生成,而是依靠海量数据与生成算法,但海量数据与生成算法则是依靠技术人员。因此,技术人员成为学术生态中的一个重要创作部分。未来,凭借AIGC的持续增加,技术人员如何定义数据与算法,如何定义权威知识与专业知识,将会对原有的学术生态体系形成冲击。从某种程度上说,技术人员得以重新成为创造知识的权威。与此同时,公众可能对学术界的基础知识与相关数据兴趣寥寥,从而失去对科学研究的兴趣与信任。
四 应对之道:如何化解AIGC带来的挑战
AIGC的浪潮似乎不可避免,因此我们必须思考如何理解AIGC在学术生态中的位置和作用。具体来说,我们需要在责任规范、审查机制、研究透明等方面着力推进变革。
1 构建责任规范
AIGC的发展可能导致学术责任分散化,带来学术问责的模糊与缺失。因此,必须首先考虑构建适应AIGC发展的学术责任规范,主要包括以下几点。
①新的学术责任规范需要理解AIGC的主体性地位。在未来的学术生产中,可能出现这种情况:AIGC帮助人类梳理知识性的事实,人类负责运用创造性思维进行创作,实现“人-机”协作。那么,新的学术责任规范必须对如何理解AIGC这一参与主体做出回应,包括但不限于以下方面:AIGC能否作为独立作者?AIGC的版权保护如何实现?AIGC的内容需要受到更多审查吗?等等。
②新的学术责任规范需要明确AIGC的参与边界问题。AIGC几乎可以深度参与到学术生产的方方面面,因此新的学术责任规范必须对AIGC的参与边界做出明确规定,包括但不限于以下方面:哪些问题可以引入AIGC参与讨论,哪些问题不可以?AIGC与学术不端的关系是什么?多大程度上使用AIGC可以被算作学术不端?哪些环节采用人工智能辅助写作是可以接受的,哪些是不能接受的?在学术共同体的评议过程中引入人工智能技术是合理且适当的吗?以上问题都必须得到进一步讨论与明晰。
③新的学术责任规范需要明确如何问责与AIGC有关的学术不端。学术问责是学术责任的实践环节,而AIGC的发展造成了责任分散,因此也产生了问责困境。新的学术责任规范需要明确谁来为AIGC可能出现的学术不端负责。如果是使用者负责,那么是否需要公开人工智能训练记录?如果是算法模型的开发者负责,那么是否需要审查整个算法模型以确保不再出现相关问题?以上问题还需要进一步的讨论和思考。
2 推进研究透明
AIGC无疑会学术评价产生巨大影响。正确使用AIGC可以进一步提升学术评价的效率和效益。然而在当下,AIGC的使用还需要受到更加严格的审查与限制,进一步提升学术评价和学术研究的透明度,主要包括以下几点。
①持续推进研究者对AIGC的自律审查。AIGC可以进一步助推知识生产,但其也存在可能的学术不端风险。考虑到目前对于AIGC的审查机制还相对有限,因此需要推动研究者对于AIGC的自查自纠。例如可以考虑发起合理使用AIGC倡议书、组建合理使用AIGC的研究联盟、要求研究者在提交作品时提供相关书面声明或责任条款等。
②持续推进期刊对AIGC的公开审查。学术期刊是学界“公器”,在学术评价中发挥着重要作用。同样,对于学术研究中的AIGC,学术期刊也应当承担起审查责任。例如适时引入人工智能检测技术引导AIGC的合理使用、建立AIGC专家委员会对相关内容进行审查、提供公开的AIGC审查标准查询、在审稿过程中将AIGC的使用情况纳入考察等。
③持续推进研究群体内部对于AIGC的信任监督。学术共同体对AIGC的认知决定着AIGC在学术研究中的未来。恐惧源自于未知,AIGC的发展也是一样。正确合理使用AIGC的一条重要途径就是不断强化研究人员与技术人员之间的沟通与信任。例如建立学界与开发机构之间的沟通机制、强化AIGC的算法公开等。
3 强化审查机制
AIGC的发展为学术传播带来了新的机遇,但也可能造成新的潜在歧视。那么,如何克服AIGC在学术传播中可能出现的挑战与风险呢?关键在于进一步强化对于AIGC的审查机制,主要包括以下几点。
①推动AIGC的算法透明。AIGC一方面依靠算法模型产出新的内容,另一方面依靠数据画像实现精准推送。然而算法模型的作用并不总是公正无碍的,其带来的信息茧房问题也需要加以应对。例如在学术传播中,必须思考算法模型是否曲解原有表达;必须思考如何推动算法透明避免算法偏倚;必须思考学术传播中算法的参与角色;必须思考人工审核的审查机制等问题。诚然,算法透明的需要也可能与商业秘密的需求之间产生冲突。但目前,应当考虑在AIGC的算法中加入人工审核,从而遏制不符合学术伦理的内容传播。
②强化AIGC的法律规制。AIGC的发展高度依赖海量数据的投喂与训练,目前ChatGPT的训练模型包含45TB的文本数据,包含接近8000亿个单词
五 结语
AIGC的发展有望赋予人工智能和人类一样的思考和创作能力,向着通用型人工智能持续迈进。未来,人类必须学会如何与人工智能并存,并在这个过程中不断思考如何赢得尊严。但无论如何,我们应当对未来持有审慎的乐观。只要合理使用,人工智能将首先带来解放而不是枷锁。
本文主要讨论了AIGC对学术生态的作用与影响,并结合ChatGPT进行了具体讨论。本文的研究价值在于为理解AIGC对学术生态的作用提供了一个理解框架,并在此基础上进一步得出了AIGC带来的风险与挑战,最后尝试提出其解决之道。作为一种新型技术,AIGC还将快速发展,其可能对学术生态带来极为重要的影响,需要不断追踪研究。未来可以从AIGC对教育场景、教育环节、教育评价等方面展开研究。