
文学计算导论
刘洋 著
科学出版社 2026年1月出版
内容简介
《文学计算导论》是一部深入探讨文学作品量化分析方法的专著。它系统介绍了文学计算这一领域,从 19 世纪的手工文本统计分析到数字时代利用计算机技术的系统研究方法,不仅回顾了历史渊源,还探讨了如何通过数学模型、特征量建构、数字细读等方法解析文学作品,以揭示其内在的隐藏结构和普遍规律。全书覆盖了作者归属与风格分析、人物关系网络、计量叙事研究、文学文本的情感计算、文本分形结构分析及最新的人工智能技术在文学研究中的应用等多个方面,全面展示了文学计算这一前沿的跨学科领域的发展现状和未来潜力。
本书适合数字人文、文学、语言学、自然语言处理、复杂系统等领域的研究者以及对文学计算感兴趣的研究生和本科生阅读。
作者简介
刘洋,知名科幻作家,物理学博士,重庆大学人文社科高等研究院研究员,中文系副教授,创意写作基地副主任。在国内外发表科幻作品200万余字,出版短篇小说集4部,长篇小说3部,部分被翻译为英语、德语等在国外出版,6次获得全球华语科幻星云奖。主要研究方向为数字人文、创意写作,主持国家自然科学基金与国家社会科学基金项目各一项,在各类核心期刊发表论文20余篇,出版著作《科幻创作》《科幻创作的未来版图》等。

推荐序
在智能计算与文学创造之间摸索前行
——序《文学计算导论》
陈跃红
刘洋把他的书稿《文学计算导论》发过来,请我给这本书写个序,理由是:“文学与科学的交融、跨学科的研究视野,一直是陈老师的主张,可以说,我在写作本书时,其实受到了您的很大的影响与鼓舞,否则可能也不会如此坚定地在文学计算这个前沿而又风险极大的领域走到现在。因此,特别想要邀请陈老师为拙著撰写一篇序言,相信一定可以为本书增彩不少。”于是,完成这个序之于我,就感觉有些义不容辞了!
在我的印象中,刘洋总是默默耕耘、不声不响地做着两件事:教书和写作。他一本又一本的科幻小说在人民文学出版社出版,如《火星孤儿》《裂缝》《井中之城》,每一部都在科幻文学界引起反响,并且基本上也都能获奖。他很珍惜时间,日常说话不多,很少主动与谁交流。即使是在几年后最终决定离开南科大去重大工作,来办公室找我告别,也只是进得屋来,在沙发上轻轻坐下,说一句“我办完手续要走了,陈老师您还有什么要提醒的?”,然后搓搓手就没话了。职业性喜欢说话的我絮絮叨叨了一通,最后说“南科大科学与想象力中心给你留了一个无薪的兼职位置,方便以后回来合作交流”,我们就这样告别了。此刻要写这篇文字的时候,总是不自主地回想起这些场景。
说到文学中的计算,2016年刚到南科大工作的第二年,我在人文中心搭建的“计算人文学研究中心”就是5个科技人文科研平台之一。此后围绕这一平台组织的一系列学术活动,也大多与此主题相关。每次会议,只要时间允许,刘洋一定会参加,提交PPT,发言,然后离开。该书中几个篇章的内容,也都与这些学术活动相关联,这就是他会在微信中说“本书中的几个重要章节,都是基于我在南科大时发表的数字人文论文扩展而成”的原因。鉴于此,无论如何,这篇叫作“序”的文字,也算得上是我在南科大一段曾经的科技人文跨学科探索的另外一种历史记录吧。
刘洋这本书的写作缘起、时间背景和今天的成书,确实是南科大人文学科以科技人文为主导的新文科建设的一个见证。自21世纪初以来,当人工智能开始下棋、创作诗歌,当算法能够解析《红楼梦》的情感脉络的时候,我们就关注到了AI与文学生产的可能关联,从2018年我在南科大组织的“人工智能时代的技术与人文”学术研讨会,到2022年与吴岩、尹迪联合编剧的科幻哲理剧《云身》的问世和上演,再到今天围绕GPT和DeepSeek等各种大语言模型与人文学科未来变革发展的研究性探讨,大伙儿不仅亲眼见证了历史,同时也比许多人更早介入了这场关乎人文学科和文学创造未来的疾风暴雨。关于这一点,我和我的南科大人文学界同人们多少都有点得风气之先的自豪。进入当下,文学研究的范式甚至文学生产的方式都在经历前所未有的变革,在这个数字智能技术重构人文认知的时代洪流中,刘洋这本书的出版,肯定是其中一朵水光迸溅的浪花。
具体到这本《文学计算导论》本身,作者以自己的文学创作实践和写作教学经验总结,试图搭建起一座横跨文学与计算的桥梁,目标在于探索二者之间的内在关联,为文学创作和研究寻找另外一种可能。这毫无疑问是没有前例可以参照的尝试。刘洋在这部著作里不仅系统梳理和延展了文学计算的理论脉络,更以扎实的实践案例展示了数字技术如何为文学研究注入新动能。我读此书,至少有如下一些收获。
首先是关于文学计算知识谱系的初步梳理。作者以有说服力的资料证明,文学计算并非横空出世的奇技淫巧,其根系曾经深植于人文与科学交融的历史沃土。该书开篇即以“前计算机时代的文学计算”为楔子,带领读者回溯维多利亚时代的数学家在书信中绘制词长曲线,重温统计学家尤尔用句长分布破解作者疑云。这种历史维度的梳理揭示出文学研究对量化方法的渴求其实早已暗流涌动,而当今的计算技术不过是加速这一进程的催化剂。从德·摩根到齐普夫,从词汇丰富度测量到风格特征曲线,早期学者们用纸笔完成的探索,已经为今天的文本挖掘奠定了初步的方法论基础。
刘洋眼下虽是人文教师,但作为一名曾经的凝聚态物理学博士,他的研究和写作总是充满公式公理交集和数理逻辑推导的论证特色。在“作者归属与风格分析”章节,我们看到了传统考据学与计算语言学的巧妙结合,他将多维语言特征投影为可视化的风格地图分析,以Delta分数通过统计检验为争议文本提供身份证明,层次聚类算法则让文学流派的亲缘关系显影于数据森林。这些方法并非会取代文学批评家的直觉判断,但是通过量化工具放大人类对语言风格的感知精度,对我们不无启发。
其次是作者积极尝试以数字解剖方法重识文学的叙事结构的努力。在该书的“人物关系网络”章节,作者将计算视角延伸至叙事结构的深层肌理分析,以社会网络分析技术将科幻小说的宇宙博弈转化为节点与连边的拓扑图。这种分析超越了我们常见的传统人物论描述,使角色关系的动力学特征获得了一种数学性的表达,读来颇有新意。而在“计量叙事研究”与“去趋势波动分析”部分,作者通过叙事节奏的波动曲线、关联词频的时序图谱,对那些潜藏在文本褶皱中的结构密码加以破译。当小说的语体特征显现在赫斯特指数中,我们得以用新的尺度重新丈量文学形式的复杂性。这种将叙事学转化为可计算模型的努力,给人以文学工程学的新鲜感觉,至于是否能提升读者的文本形象感受,见仁见智,可以继续讨论。
在“文学文本的情感计算”章节,作者通过构建情感词典与机器学习模型,将科幻作品中的希望与恐惧量化为起伏的弧线。这种将情感体验转化为数学景观的尝试,既可看作是对“新批评”细读传统的技术升级,也为接受美学研究开辟了技术性新路径。对此,我们不得不重新开始思考:情感究竟是心灵的神秘震颤,还是可被建模的语言信号?这确实有些发人深省了。
当然,在书稿的论述中也并不缺乏作者对技术前沿的批判性思考。面对机器学习与大语言模型的浪潮,该书保持了难得的学术清醒。在“文学计算的新近发展”章节,作者既展示了用大语言模型进行文学计算的便利性和缺陷,也用信息熵理论阐释了文学文本的“温度”特性。更可贵的是,作者时刻流露出对技术局限性的反思。当ChatGPT生成的诗句通过图灵测试,我们是否正在见证文学性的消解?当算法将《哈姆雷特》简化为情感标签,文学阐释的丰富性会否被计算暴力所规训?这些追问将技术工具置于人文价值的审判台前,彰显出研究者应有的批判立场。
最后,该书作为一部导论性著作,作者在方法论和实际操作层面还尝试为读者提供学习便利。譬如附录提供的一系列测试语料、算法流程、学习流程等,都试图将抽象理论转化为可复现的技术方案,以这种“打开黑箱”的写作策略,让文学计算的技术性层面直观可见。当然,全书体制设计的知识和技术难度也明显可见,不仅在方法论上,在研究者知识结构上也强调了跨学科专业素养要求。研究者必须具备技术与人文的多学科知识运用能力。当角色网络分析需要同时调用技术细节识别与社会学理论,当叙事结构挖掘既要精通文本分割算法又需深谙经典叙事学的时候,读者就可以直观地理解,这种“两栖型”的跨学科研究范式,对语言研究的多学科知识是有相当深度的要求的。
在该书的最后,刘洋实事求是地表达了关于“计算批评”的愿景,即作者本人并不打算用算法去取代传统批评家,而是想借助计算思维去拓展文学阐释的疆域。这种变革犹如伽利略将望远镜指向星空:同样的文本宇宙,却因观测工具的革新呈现出前所未有的景观。在这一意义上,《文学计算导论》的出版,既可作为文科研究者尝试进入数字领域的导航图,也可成为有兴趣涉猎文学研究和创造的计算专业学者入场的解码器。在这个AI日益介入文化生产的时代,该书的意图绝不是想把文学研究变成计算数学或者物理推导场景,而是坚持认为,真正的文学计算不是冰冷的技术宰制,而应成为连接感性体验与理性认知的桥梁。有此认知,我们便绝无任何理由拒绝这类具备较大知识难度的跨学科文学研究路径。
刘洋还很年轻,作为一位已经登上文学舞台的科幻作家和大学教师,我衷心希望他的创作和研究未来更上层楼。
是为序。
2025年2月17日于南方科技大学大沙河畔校园公寓
编辑 | 徐浩然
审核 | 唐杰、李广益