2024年4月,博雅学院中文系教师刘洋携本科生周笑竹、卓许儒在SCI二区期刊Physica A: Statistical Mechanics and Its Applications上发表数字人文研究成果“Multifractal analysis of Chinese literary and web novels”(对中国文学与网络小说的多重分形结构分析)。这篇重要的SCI论文成果是由师生共同参与完成,充分体现了博雅学院坚持书院制育人、鼓励跨学科探索、秉承教学相长的特色。
刘洋,四川内江人,知名科幻作家,重庆大学中文系副教授。北京师范大学物理学学士、凝聚态物理学博士。研究领域为数字人文(文学计算)、创意写作、复杂系统等。创作方面,曾获得华语科幻星云奖、中国科幻引力奖、黄金时代奖、光年奖等多个奖项。科研方面,曾获2020年广东省优秀社会科学普及作品奖、第十届深圳市哲学社会科学优秀成果奖科普类优秀成果奖等学术奖项。同时,还担任腾讯、字节跳动等公司多款3A级科幻游戏的首席世界架构师。
“学生加入教师科研项目”孕育出的成果
刚刚步入大学的周笑竹对数学拥有浓厚的兴趣,她喜欢研究数学、证明公式,也喜欢解题的感觉,常在课下独自钻研,“这种感觉令我很充实。”凭借兴趣,她在学习博雅课程之外,也自学了高等代数、数学分析等课程。此外,她还主动和数统、经管等其他学院的同学组队参与建模大赛、数学竞赛等。
每两年,博雅学院会开放“学生加入教师科研项目”,拥有省部级以上在研项目的教师会招募学生加入团队,共同探索。“这是一次很好的机会”,周笑竹说:“我们可以寻找自己感兴趣的课题,参与到科研项目的全过程,真正了解科研到底是做什么的。”经过了解,她被刘洋老师的“文学计算批评路径研究”项目吸引了。高中三年的理科学习和大学的文史哲学习使她对于将文学和计算结合起来产生了浓厚的兴趣,于是,她立刻报名参与。
周笑竹在进行语料库的整理
卓许儒和周笑竹有着相似的经历。加入项目前,他正在为数学建模大赛做准备。在准备过程中,他发现Python语言程序设计应用范围较广且操作简单,因此他开始自学Python,并报考参加这一板块的竞赛。在得知有加入教师科研项目的机会时,他也对刘洋的项目产生了浓厚的兴趣,他发现这个项目和他正在准备的数学建模大赛很相似,同时自己也很好奇数字和人文两种看似风马牛不相及的学科如何结合,于是他毫不犹豫地申请加入了此次项目。
是师生亦是队友
为什么传统经典文学作品和网络小说的风格往往存在差异?能否用数字人文的方法解释这种差异?谈到这次科研项目的研究内容,刘洋这样介绍他的问题缘起。他设想,可以通过分析文学作品的“句子长度”来将文学作品数列化,从而研究作品的句列结构。他发现多数网络小说的分形谱比较窄小,风格也极不稳定,主要表现则是句长变化明显。而造成这种现象的原因主要有四个:网络小说通常比较长,总字数远超传统作品;网络小说的发表机制往往是随写随发,而非完成整本书后再发表;网络小说往往写得比较快,对文学性的要求不高;网络小说的写作门槛较低,许多网文作者写作水平并不高。基于此,刘洋选择进一步运用分型结构模型来完成这个对比研究。
但是数字人文的研究并不仅仅靠一个人就能够完成。刘洋强调:“数字人文的研究需要团队合作”,因为数字人文的研究既需要懂人文的成员,也需要懂数学、计算机的成员,并且有许多基础性的工作,如语料库的整理和标注等任务较为繁杂,需要分工合作完成。
凭借较为扎实的数学功底和人文素养,周笑竹和卓许儒积极投入到项目语料库的整理和标注、脚本写作等工作中。周笑竹将上世纪九十年代到本世纪初的网络小说从作者、发表时间等多个方面进行了整理和批注,从而使所需文本规范化,便于计算机进行读取。而卓许儒也通过对Python的学习帮助刘洋写脚本、做正则表达式进行语料库的整理。
卓许儒在阅读相关书籍
“他们帮了我很多,”刘洋说,“当初在进行语料库的整理的时候,卓许儒同学就帮我写了一个表达式,一下子就删掉了语料库中所有的换行符。”周笑竹也说到:“刘洋老师的研究不仅提升了我们的能力,让我们掌握了一些编程软件;还提高了我们的认知,开阔了视野,以前没想过,数学和编程等理工技能可以和人文研究结合,完成这么有意思的研究!”
人文研究需要学科交叉融合
谈到跨学科研究的重要性,刘洋表示:“数字与人文的结合能够带来许多传统阅读无法获得的发现。数字量化的研究方式能够发现文学作品的隐藏结构,比如用情感弧线将小说的情感起伏展示出来,并将其分类,得到传统阅读方式没有的结论。”同时,面对所要阅读的书籍太多这一问题,“计算阅读”(又称“远读”)则发挥了重要作用,这种方式下我们不必阅读完所有书籍,而是将其交给计算机,从而可以超越文本的尺寸、数量的限制,最大程度上的将所需的材料囊括进去,克服人在阅读能力上的限制。
周笑竹则结合参与科研项目的感受,表示:“参与项目的过程中,我发现文字不单单只是文字,它还是符号,通过人和计算机的处理,变成一个个数据呈现在我们眼前,我们可以通过这些数据了解其中的规律。”她还提到博雅学院通专结合的培养模式为跨学科研究提供的沃土:“人文研究需要跨学科,不仅仅是文学与物理学或是统计学的交叉,还可以有如文学与人类学、文学与心理学、文学与地理学等学科的结合,这些都能够让人文研究更加丰富、突破界限。”
卓许儒对此也深有同感,他将跨学科意识延伸到博雅学院“田野方法”这门课程中,用数字人文的方式将调查的资料进行数据化和可视化。加入教师科研项目的经历开阔了他的眼界,让他学习Python更有动力了,也更清楚基础文科的学习与技术的结合可以碰撞出什么样的火花。
撰稿:刘文优、张寒阳
审订:肖馨瑶、刘洋