曾军:二手阅读:人工智能时代的文论问题

一、作为问题的“阅读”

2000年前后,由图书出版领域发起的以“老照片”“黑镜头”“红风车经典漫画丛书”等为代表的那场图文书出版热被冠名为“读图时代”,从而引发“阅读危机”和“经典危机”的大讨论。时人曾提出尖锐的批评,认为“图书形式上的革命并不是简单的‘图文并举’。经典作品的图说化容易导致一个民族文化消化和咀嚼能力的弱化和退化”。笔者在2003年开始展开以“观看的文化分析”为主题的研究时,也曾对研究视觉文化的“文化赝品”经验和舶来品理论的双重困境进行自我反思。其实,真正带来“阅读危机”和“经典危机”的并非图文书,而是看电影电视、玩电子游戏、刷抖音快手等日益成为大众娱乐文化消费的主要方式之后,所带来的“人们越来越不读书”的担忧。尽管笔者并不完全认同“图文战争”的提法,但是中国的视觉文化研究有一个强大的现实动因,即影视文化带来的文学经典阅读危机,这一事实也表明“阅读”之于知识的生产传播、个人的心性成长、群体的文化认同具有极其重要的意义。因此,任何可能引发“阅读危机”的因素都需要引起高度警惕。

近几年来,随着ChatGPT、DeepSeek等生成式人工智能(以下简称“AI”)大语言模型的成功出圈,“AI赋能科学”(AI for Science)、“AI赋能社会科学”(AI for Social Science)、“AI赋能人文与艺术”(AI for Humanities and Arts)的范式变革正在加速影响人们社会生活的方方面面。生成式AI最大的特点就是其具有人机交互、辅助生成的“生成”(generative)能力,这正是人们广泛关注于它们的文生文、文生图、文生音、文生视频、文生代码以及图生视频等多模态生成的重要原因。人们纷纷惊艳于大语言模型一键输出、出口成章的性能,惊恐于它们对人类引以为豪的精神生产活动的替代;当“人机交互、辅助生成”成为特定的AI创作方式之后,原有的文学、美术、音乐、影视等艺术门类也面临着需要被重新定义的问题;由于数字新媒介的介入,原有的作家、读者、世界与文本的“四要素”及其文艺活动诸关系,也面临着重大的调整。

在这一系列的探索中,“阅读”问题也成为一个亟待解决的重要问题。在笔者看来,如果说AI对人类文化的影响中有什么是最为重要的致命性因素的话,那么它一定是阅读。1972年,联合国教科文组织向全世界发出“走向阅读社会”的倡议;1995年,联合国教科文组织进一步宣布将每年的4月23日确定为“世界读书日”;2015年,“建设书香社会”正式写入全国两会的政府工作报告。以国际组织、国家政府的名义来推动的事情,也从一个侧面反映出“阅读”正在承受的压力。那么,AI时代的阅读问题有哪些?这个问题的展开可以有诸多层面,既可以从社会学角度观察阅读群体及其阅读行为的变化,也可以从传播学角度来分析阅读的媒介及其技术正在发生的转型,还可以从人文艺术的角度来辨析生成式AI兴起之后,交互式、多模态方式下的阅读经验及审美体验等。本文拟延续“赝品观看”的思考,提出一个“二手阅读”的问题,作为从文论角度来思考AI时代的阅读问题的一个小的切口。

所谓“二手阅读”,是指阅读对象不再是原文原着,而是对原文原着加工处理过的“次生文本”。从日常阅读经验来说,“二手阅读”是指人们不再花很大的精力去啃原着,而只是满足于通过他人的介绍、摘抄或者梗概来了解原着的内容;从人类文化史发展的角度来看,所有对于经典的理解和阐释其实都算“次生文本”,如中国古代的注疏、评点,现代出版中的导读、简本,还有大量对经典着作的摘抄、笔记之类。数字人文技术出现之后,对海量文本、标注数据所作的可视化呈现所形成的图像或文本,也是新的“次生文本”形态。生成式AI兴起之后,次生文本又出现了多模态转换的新形式。德里达有过“原始文本”的提法,也可以成为对阅读对象的次生文本现象的一个注脚。

正如阿尔维托·曼古埃尔在《阅读史》中所谈到的,“阅读”是一种人类观察世界、理解世界的视觉方式。早在文字诞生之前,原始人类已从自然变化规律中上识天文、下知地理,并将宇宙万物转化成一系列可以被阅读并赋予其意义的符号。正是在这个意义上,曼古埃尔认为“阅读乃先于书写”“阅读仍是先于书写”。曼古埃尔的这一判断与约翰·伯格在《观看之道》中的“观看先于言语”非常类似,都在强调一个具有主体性的人以积极主动的方式,通过视觉对外部世界的认知和理解,而且这种认知能力和理解能力早于人类发明语言。从媒介文艺史的角度来看,“阅读”是与文字类抽象符号有关的视觉行为,属于书写印刷时代的文学接受活动。与之相关的,一个是口传时代与语音相关的听觉行为,与“讲”“吟”“诵”“唱”关系密切。无论是弹奏竖琴、行吟《荷马史诗》的“讲故事的人”,抑或“情动于中而形于言,言之不足故嗟叹之,嗟叹之不足故永歌之,永歌之不足,不知手之舞之足之蹈之也”的风诗骚人,都需要与之同在现场的听众一起配合。另一个是书写印刷时代的美术类与线条、色彩等具象类符号有关的视觉行为,是为“欣赏”。虽然艺术的鉴赏需要一定的专业技能,但即使是目不识丁之徒也能够看得懂具象的山水花鸟。但是阅读行为对阅读者提出了识字能力的要求。正因如此,阅读才更多地与抽象符号、语言文字等人类的知识生产、高级的精神生活相联系,承担着知识情感的记忆、人类文化的传承的使命,并在书写印刷时代获得了长足发展,形成了以“细读”“精读”“泛读”等为代表的丰富多样的阅读方式和技巧。在这些复杂的阅读活动中,人们不仅强化了识字书写的能力,更重要的是不断提升对语言文字背后深层含义的理解,以及由此而展开的批判性思考。所有这些正是“阅读”这一主动的、积极的、探究性的视觉行为给予人的重要能力。人类的文化也因此而不断创新、丰富、繁荣和发展。

二、技术介入与阅读转型

到了机械复制时代,以摄影和印刷方式带来对艺术作品(主要是指美术作品)的机械复制,实现了对原作的原真性、此时此地性的替代,本雅明所感叹的“灵韵的消失”其实主要是针对以美术为代表的视觉艺术。机械复制技术本身并没有给文字阅读带来更多负面影响,相反,因为印刷术的发明实现了文字的民主化,有更多的人学习和掌握了识字能力,由此大大提升了人们的文化知识水平。也正因如此,本雅明将印刷术视为机械复制技术中的“特殊现象”。机械复制时代对阅读产生的影响是以电影、电视为代表的动态影像的出现。正如曼古埃尔所言,“阅读不是一种捕获文本的自动过程……是具有个人色彩的重新建构过程”。正因(对文字的)阅读是一种积极的、主动的视觉行为,而(对影像的)观看是一种消极的、被动的视觉行为,所以当电影、电视等动态影像成为人们精神文化、娱乐活动的重要方式之后,“影视对于青少年的负面影响”一直成为学术界研究和关注的热点。这类议题甚至始于电视刚刚进入寻常百姓家,尚未进入真正普及的时期。笔者曾多次在“视觉文化入门”的课堂上,与同学们讨论“为什么喜欢看电视的小孩就不喜欢读书了”这个话题,引导同学们思考书本阅读与影视观看之间不同的视觉注意力机制,以及不同的视觉机制对于信息接收、加工处理的不同影响。

到了数字生成时代,口传时代的“讲”“诵”“唱”和书写印刷时代的完成性作品都开始数字化,并向着数据化、向量化、多模态化方向发展。在这里,有一个技术性问题需要略加辨析。在机械复制时代,人们已经开始尝试用科技手段来保存和传播声音了。如留声机就是一个通过机械方式记录和再现声音的设备,电报采取的是以摩尔斯电码表示字母、数字和符号,以模拟技术实现信号的传输。人类进入数字时代的时间应该是在20世纪40年代;数字信息技术进一步发展进入到人工智能阶段,其生成能力才获得增强。如果进一步细分,我们可以将数字生成时代区分为彼此有连续、但又不相互替代的三个发展阶段:“作为存储和传播的数字技术阶段”“作为模拟和算法的数字技术阶段”和“作为交互与生成的数字技术阶段”。因此,关于阅读的数字化问题早在大半个世纪之前就已经开始,只不过让阅读数字化成为一个问题的是以个人电脑为代表的计算机技术开始普及,传统的纸质图书大规模地被转换成电子书,阅读、写作、交流也都通过办公软件和社交软件进行;而人工智能技术出现之后,主要作为存储、传播以及模拟的数字技术开始向作为算法、交互、生成的数字技术转换。当前以大语言模型为代表的生成式AI的成功,标志着数字生成时代的真正到来。因此,我们有必要从数字化的不同技术发展阶段来辨析阅读所发生的不同转型及其所面临的不同挑战。

所谓阅读的数字化,是指将此前基于书写、印刷的纸质图书转换成以比特(bit)为载体的数字形式。这一数字形式既可能是可编辑的纯文本的,也可能是不能编辑的图像式的。事实上,在文字识别技术(OCR)还不是很发达的阶段,纸质图书的数字化主要是以图像形式被保存的。图书的数字化过程对阅读的影响主要体现在两个方面:一方面是手稿的图像化、阅读的屏幕化。虽然图像方式保存了书写的痕迹,电脑屏幕也能够呈现图书的原貌,但已经失去了纸质图书的质感和触感。另一方面是保存及呈现的标准化。为了尽可能地延续纸质图书的阅读习惯,人们尝试发明各种电子书的阅读器,试图以虚拟的方式保持纸质书阅读的感受,如具有护眼提示功能的墨水屏(在此之前是背光技术)、自定义显示效果(如用户可以根据自己需要调整字体大小、字形、行距等)、多格式存储、内置搜索导航、手写笔记、PDF重排等功能。可见,阅读的数字化进程时至今日仍然还在持续不断地丰富、优化。

随着文字识别技术的发展与进步,原来书写和印刷的作品会被识别成可编辑的规范化文本数据,纸质图书中的正文、图片、表格、页眉等不同因素都被处理成为不同的数据层,从而改变了图书数字文本的呈现形态。在图书从数字化到数据化的过程中,图书中的文字、图像以及各种符号都具有了可提取、可检索功能,从而开创了“检索阅读”的方式。这种检索式阅读在提升阅读效率的同时,也使得带有强烈目的、功利化的共时性阅读替代了线性的历时性阅读。在带给读者的阅读体验中,因为上下文语境的缺失以及阅读的连续性的断裂,很有可能会带来理解上的浅薄、误差,乃至误读;在读者根据检索的关键词进行跳跃式阅读的过程中,还会因为未对所阅读着作的系统性、整体性认知而自行“脑补”其中的逻辑链条,形成对知识的拼贴组装。尤其对于叙事性作品来说,作家在作品中设置的悬念、埋藏的伏笔以及精心设计的叙事节奏等,都有可能被这种检索打乱甚至被重新排序。由此,文学阅读的整体性在信息检索的活动中被肢解。

如果说在数字化、数据化的阶段,图书还多多少少以某种数字化的形式保存其形态的话,那么,到了生成式AI阶段的向量化阶段,(纸质的和数字化数据化的)图书仅仅被标记为一个出版信息,与图书有关的所有信息都作为大语言模型预训练的数据,以一种无差别的方式被算法赋予特定的向量表示,被“封装”在预训练模型中。套用海德格尔的话说,在预训练模型中,图书“到处都在而无一处在”。尽管我们现在可以通过知识库增强检索、专题数据集对模型进行微调,却已经无法(可能也无必要)恢复“作品”的原初状态及整体性了。或许可以继续沿用“书”的概念,将生成式AI比喻成一本不具有传统纸质图书形态,但在知识上无所不包的“超级百科全书”(Hyper-Encyclopedia)。人们对这个“百科全书”的“阅读”是以咨询、对话、质疑的方式展开的;生成式AI所提供的知识不再是原汁原味的人类经验和原初文本,而是对所有用户所关切的、与该主题相关的知识的概要式综合和拼装式生成。换言之,人们通过生成式AI所阅读的内容其实是经过AI咀嚼消化过的“精华/残渣”,是一种典型的拾人牙慧式的“二手阅读”。

生成式AI还有另外一种辅助阅读的方式,即在电子书的阅读器或电子书的软件上嵌入生成式AI。如WPS AI就是嵌入WPS的AI工具。当读者打开一个PDF格式的电子书文档,WPS AI就能提供文档问答、全文总结、AI文档脑图等功能。亚马逊的Kindle也搭载上AI,启用“Recaps”功能,能够帮助读者在阅读系列图书时快速回顾此前的情节和角色,提取关键情节和核心概念。从AI辅助阅读的技术环节来看,AI工具不仅能利用自然语言处理技术对原文进行词性标注、句法分析以及语义解释,还能实现对大批量文本的主题分类和情感分析,生成式AI更能通过深度学习自动生成文本摘要、提取文本中的重点语句。借助生成式AI的预训练模型的能力,再配上知识库,加上工作流,设计成具有特定功能的“AI代理”(AI Agent),生成式AI还能成为阅读助手,进行个性化推荐、可视化呈现、智能辅助批注以及互动问答,等等。所有这些AI功能,也都正在以各种方式转化到大学、中学、小学的教育教学环节之中,成为“AI赋能教育”(AI for Education)的组成部分。

三、AI辅助阅读的基本方式及其反思

那么,对于作为个体的阅读者,在AI赋能之后会产生哪些阅读方面的影响呢?在笔者看来,AI的本质就是效率工具,它的主要功能就是对重复性任务的自动化处理和对海量信息的数据统计及快速检索。当一位研究者需要面对每天都会新出版和发表的巨量图书、杂志以及其他类型的文献时,仅仅靠个人的一己之力显然是杯水车薪。从这个意义上说,生成式AI对阅读效率的提升是显而易见的。然而,阅读效率的提升如果是以阅读质量的下降为代价,那么这种阅读方式就需要高度警惕,值得怀疑。下面以三种比较有代表性的AI辅助阅读方式(摘要式阅读、搜索式总结和可视化统计)来作进一步的分析。

生成式AI具有对单篇文献或多篇文献作摘要和综合的能力。不过,这种能力主要是凭借其算法来实现的,通过语义解析,生成式AI能够识别出文本的章节层级结构,并运用注意力机制识别出调频术语、统计数据以及主要的结论;如果是多篇文献,它还能建立起文献之间的主题映射矩阵,比较不同文献之间的差异,并寻求“最大公约数”的总结。因此,从技术角度来讲,生成式AI所提供的“二手阅读”材料理论上说是能够实现对原着或原始文献的一般性总结和概括的。在笔者看来,这种“摘要式阅读”之于科技文献的阅读是有效的。它能够帮助读者快速捕捉相关研究主题的对象、前期研究成果、研究视角与方法,总结实验的过程及其结论。但对于人文类图书的阅读来说,这种摘要式阅读则被缩减成情节摘要、故事梗概,剥离了文学的感性修辞、叙事细节、微妙情感及朦胧复义,减化了历史的枝蔓细节、复杂动因,简化了哲学的概念界定、论证过程以及理论的丰富性、思辨性。

所谓“搜索式总结”,是指以联网查找的方式对所搜索文献材料的主要观点进行提炼。在ChatGPT 3.5发布之后,无法联网的局限使得生成式AI的知识只能停止于其结束训练的那个时刻。因此,当联网功能补齐之后,信息的同步性问题就获得了解决。生成式AI也因此强化了其作为智能搜索引擎的功能。就目前具有联网功能的ChatGPT和DeepSeek等的实际应用情况来看,搜索式阅读存在一个十分明显的缺陷,即任何一次搜索行为都不可能做到全网的完整、精准的信息获取。受技术条件的限制,每一次搜索都只能随机性搜索到部分文献,并依据这些文献进行归纳总结。因此,这种随机性总结以及由此所能提供的信息距客观、全面、准确的知识至少隔了两层:一是未能全面检索;二是未能完整总结。因而,我们依此而进行的阅读不可能完全获得对于所要思考问题的可靠性和正确性。

“可视化统计”也就是莫莱蒂所说的“远读”(Distant Reading),即将海量数据中的关键信息,在大尺度(大数据、长时段、多重空间等)上转化成可被人进行整体把握的可视化形象(表格、曲线、图像)等,通过对这些可视化形象的辨析,人们可以发现一些演进规律或隐秘信息,从而获得对研究对象的全新认识。“可视化统计”作为数字人文技术所生成的“次生文本”不具有前面“摘要”和“总结”文本的相对独立性,它对于研究者来说,辅助功能更强。“当‘次生文本’出现之后,此前传统人文研究所面对的‘元文本’与‘原初文本’之间的二元关系,就演变成新增了‘次生文本’的三角关系:‘次生文本’既可能是对‘原初文本’的抽象化还原,也有可能包含着对‘原初文本’的颠覆性解构,既有可能突显‘元文本’与‘原初文本’之间的隐性关联,也有可能提示两者之间的矛盾和张力。”“可视化统计”在文学文本的分析中,已经发展出诸如词频、情感、情节、人物、时间、空间等不同主题相关的可视化分析技术,通过将历时性的、需要凭记忆进行“脑补”的阅读经验转化成可以借助数字技术进行的共时性的、由AI进行“机补”的可视化呈现,也是一种辅助阅读的手段。

由此可见,AI辅助阅读在提高阅读效率的同时,也会给阅读带来无法估量的损耗:因为有了自动摘要和关键词提取,有可能会带来“阅读偷懒”,让读者浅尝辄止、速读浅读;AI辅助阅读会遵循内置的特定算法,有可能形成阅读的同质化,影响阅读的个性化,“一千个读者,只有一个哈姆雷特”的局面是符合算法的均值化逻辑和正态分布规律的;“次生文本”(可视化呈现、多模态转换等等)还可能分散读者的阅读注意力,在信息过载的同时往往会带来注意力涣散,等等。上述这些对阅读的影响,还只是阅读方式的改变。AI辅助阅读最大的影响在于检索、储存的功能对人的理解、记忆能力的替代。虽然AI是以“第二大脑”的面目出现的,但是在脑机接口技术获得了突破之前,在记忆可以实现数据传输之前,阅读仍然是人类获得知识、形成对世界的认知、产生对事物的理解的基本途径。AI辅助阅读能够提高获取特定信息的效率,加快知识总结和接受的速度,但仍无法替代欣赏式阅读(文学的审美)与个体化阅读(个体化阅读才能激发起个体的生命经验,获得不一样的阅读体验)。

不难发现,到了数字生成时代,阅读面临着更多的新情况、新问题、新困惑。AI时代的阅读危机,不仅仅是“没人读书了”“读书的时间少了”的问题,更重要的是“读书偷懒”“不会读书了”“假装读了许多书”的问题。当检索式阅读替代“整本书阅读”、摘要总结式的二手阅读替代涵咏品鉴式的亲自阅读、“远读”(distant reading)替代文本细读(close reading),人们沉浸在加速主义的、寻求快感的、浅尝辄止的,甚至可能包含AI生成的幻觉、偏见的信息获取之中不能自拔之后,人之所以为人的精神的自主性、理性的辨别力、审美的判断力以及随之而来的创新、创造的能力将有可能被严重削弱。不仅如此,阅读能力对于人类的文化传承而言,尤为重要。只有拥有了内化于心、外化于行的阅读能力,人们才能拥有欣赏、理解、阐释和创新的可能,原创性的创造能力才有可能。因此,我们需要高度重视AI时代的阅读问题,尤其是重视经典的阅读问题,“悦读”“速读”“远读”“智读”仅能作为辅助性阅读,而更应大力强化“细读”“精读”“慢读”“复读”(反复的阅读)之于人的智力和脑力的锤炼,重视培养基于“语感”的“文本鉴赏能力”和基于“体验”的“文化认同能力”。唯有如此,我们人类个体才能成为一个合格的读者,进而成为一个具有身份自觉的文化主体。

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/87520.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年8月8日 下午3:01
下一篇 2025年8月8日 下午3:08

相关推荐

  • 从Polo到ID.3:50年“小钢炮”精神进化 电动时代再续传奇

    2025年5月,大众品牌迎来重要里程碑——Polo问世50周年。自1975年横空出世,这款经典产品以六代焕新、全球2000万+辆销量的战绩,成为入门级车型的标杆之作和燃油车时代小钢炮的代名词。 数十年来,大众品牌在精品座驾领域佳作辈出,包括Polo、甲壳虫等在内,以高效、实惠、创新及实用等核心竞争力,让科技进步普惠更多人。如今,电动化…

    2025年5月20日
    12700
  • 院士王坚发声:AI不是工具革命,而是科学革命的工具

    新浪科技讯 2月20日下午消息,昨日,世界互联网大会人工智能专委会在京召开“人工智能赋能科学研究”研讨会。会议认为,人工智能以数据为驱动、以模型为载体,正成为科学研究的加速器、技术创新的孵化器,开创了科研的新范式。 世界互联网大会人工智能专业委员会首席主任委员、中国工程院院士、之江实验室主任王坚表示,“AI不是一次工具的革命,而是一次科学革命的工具。” 他谈…

    2025年2月20日
    15600
  • 轻薄续航兼顾!曝三星Galaxy S26 Edge电池升级到4400mAh

    8月5日消息,据知名数码博主@i冰宇宙爆料,2025年全球最薄直板机三星Galaxy S25 Edge的迭代机型S26 Edge的电池容量将做进一步提升,兼顾轻薄与续航能力。 目前,关于Galaxy S26 Edge电池容量的说法有两种:官方规格显示为4400mAh,而供应链方面则显示为4200mAh。 尽管存在差异,但无论哪种情况,其电池容量相比前代产品G…

    2025年8月5日
    8300
  • 真正的游戏平板 iPad mini,终于要用上 OLED 屏幕了

    虽然「听劝」这个词被国内厂家滥用了许多次,但如果用来形容这段时间的苹果,似乎又格外贴切。 根据彭博社记者马克·古尔曼的最新报道,有来自供应链的信息表明,苹果正在规划一次比较大的产品调整,主要动作是为包括 iPad mini、iPad Air 和 MacBook Air 在内的热门产品换装 OLED 屏幕。   图|Tom’s Guide &nbsp…

    2025年10月30日
    14000
  • 阿里巴巴的股份构成:马云如何用1.5%股份掌控万亿帝国?

    您是否知道,马云仅持有的阿里巴巴股份,却能牢牢掌控这家万亿市值的科技巨头?本文将为您揭秘阿里巴巴的股权架构,解析控制权与股权分离的奥秘,并揭示软银退出背后的资本博弈。 一、股权结构现状:分散与集中并存 双市场架构 截至2025年7月,阿里巴巴采用“港股主导、美股辅助”的双市场结构: 港股(09988.HK):流通股131.21亿股,占全球总股本的63.19%…

    2025年7月29日
    2.7K00

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信