标题
标题
作者
关键词
日期
近年来,随着大数据方法的兴起,有关数字方法对历史学价值的问题再次引发学界讨论。为更好回顾数字人文在历史学研究中的发展脉络,以及预判学术前沿,2021年7月15日,中国社会科学院近代史研究所和历史理论研究所联合发起“数字史学系列”青年读书会,邀请南京大学历史学院副院长梁晨教授,与所内青年学人分享他关于数字史学的研究心得。本次读书会是“数字史学系列”第一讲,读书会由历史理论研究所副研究员尹媛萍主持,近代史研究所副研究员云妍、经济学研究所副研究员常旭、北京大学光华管理学院助理教授董浩和中国人民大学历史学院博士后陈必佳担任与谈人。来自近代史研究所、历史理论研究所和世界史研究所的青年学人约40余人参与讨论。
“史学本位”的数字史学
当数字技术进入历史学学科,量化何为,史学何为?梁晨教授对这一问题分享了自己的思考。他表示,现在各高校提倡建设新文科,即有技术的文科。但在他看来,数字史学首先是“史学”,而不是信息管理或计算机科学。梁晨援引成一农在《抛弃人性的历史学没有存在价值》一文中对数字技术的批判,表示他不完全赞同成一农的批评,但他认可成一农提出的警醒。面对大数据和新技术的冲击,我们作为历史学者,确实应该重新思考“历史学是什么,历史学家要干什么”的根本问题。
梁晨教授强调,数字史学首先要建立在“史实”之上。他引用何兆武先生在《对历史学的若干反思》中对“历史学的双重性”的定义来说明史实的重要性。何兆武先生说,历史学有两个层次,一个是“史实”,一个是“解释”;前者是“科学”,后者是“人文”。梁晨认为,历史学的“人文”不同于哲学和文学等人文学科,它的“人文”必须建立在“史实”之上。因此,历史学的基础范式是从“求实”到“求是”,从“史实重建”到“形成的解释、规律和理论”。但无论是哪个阶段,都“离不开史料”,仅靠“叙事”和“想象”的历史学研究是远远不够的。
对于数字方法在历史学中的应用,梁晨教授借用吴承明先生的话指出“凡能量化者,皆应量化”。所谓“能”,梁晨解释到,包括“材料”和“操作性”两个层面。当历史学研究者拥有足够多的档案和材料时,采用数字技术能够更好地处理和呈现史料,让历史想象更加平顺。但梁晨也提示大家,在使用量化方法的同时,也要警惕“有数字,有量化,没有史学”的走偏的情况。他强调,数字史学要做得好,“必须要有历史学家的投入和参与。我们要看历史同行,而不是技术专家”。
数字史学的“内连接”与“外沟通”
梁晨教授认为,数字史学的价值有两种,第一种是建立“历史数据内部连接”,第二种是建立“学科之间的外部沟通”。所谓“内连接”,就是利用数字方法将过去独立的、分散的“结构化史料”整理成为充满联系、甚至可供检索的“数据库”,为历史学家提供更多可供观察的“连接数据”。梁晨以“民国时期清华大学教职工流动”为例,展示了“内连接”的数字史学方法在民国教育史中的应用。梁晨表示,长久以来,吴民祥先生在其经典著作《流动与求索:中国近代大学教师流动研究》中关于“民国时期大学老师流动性很强”的结论被学界广泛接受。但他指出,如果我们“更换不同刻度”来进行观测,即使是同一批数据,也可以得出不同结论。例如,如果将《教职员名册》中的教员身份细分为“初级”和“中高级”,再辅以时间维度重新统计,就能看到更为复杂的图景。梁晨在新的统计中发现,在1936年抗日战争爆发高校南迁和1952年大学院系调整时,高校之间人员的流动性的确很大;但流动的人群主要是高校的中高级教师,大部分的初级职员是没有流动的。梁晨认为,如果没有数字史学在方法上的突破,我们就很难与吴先生的经典研究进行真正对话。只有通过挖掘数据内部的联系以及创造新的“连接”(如划分初级和中高级职员),我们才能在经典的阴影下发掘更多研究的可能。
除了对话经典之外,数字史学的“内连接”方法在对单一的“结构化史料”的处理和拓展方面也十分有效。梁晨以“清华留美生职业教育”研究为例,展示了如何从“同质的连接”到“非同质网络数据连接”的具体方法。在以往的研究中,学者们多利用学籍卡等结构化统计材料研究清华留美学生。如果仅依靠登记表中的“就职单位”来考察留美生的职业,学者们就会很容易得出“清华留美生回国后都去高校任职,很少去实业界工作”的结论。然而,梁晨及其团队通过利用Python爬梳其他的互联网材料,发现其实大部分清华留美学生一般先去高校就职作为过渡,最后都去了实业界工作。通过新的信息技术,原有的单一结构化材料得到拓展,学者们得以看到留美生更复杂的就业情形,也就因此丰富了对过去研究的认识。
数字史学的价值之二,梁晨教授认为,是可以把“整体史”和“微观史”沟通起来,甚至沟通人文和社科。梁晨以他发表在《近代史研究》2021年第3期上的《民国大学生地理分析特征》一文举例说明这一点。梁晨及其团队制作的“民国大学生量化数据库”,收录了33所高校近12万学生个人层面的多维度信息,包括籍贯、家庭住址、高中驻地和大学驻地四类。借助量化分析方法,梁晨及其团队对这四类信息进行分别计算和连接比较,动态地呈现民国大学生群体地理来源的模式、特征和变迁。梁晨表示,通过构建大量的“微观史料数据”和开展“多变量描述性统计分析”,历史学者能够有效集合大规模、长时段的“微观史料”,形成扎实的“中观研究”,为构建“宏观史论”提供坚实基础。这样,数字史学就有效沟通了微观和宏观,平衡了求实与求是。
未来已来:数字史学的挑战和机遇
在评议环节,特邀嘉宾李学通研究员和四位与谈人结合各自的研究经历,分别从历史学、经济学、社会学等跨学科角度对量化史学的相关议题展开研讨。近代史研究所李学通研究员首先就“民国时期清华教授流动性”问题和“历史学的发展趋势”进行回应。李老师表示,“清华教授流动性”问题要放在时代背景中来理解。民国时期,清华大学的工资较高,自然吸引很多知名教授前去任教。例如,蒋廷黻留学归来,先在南开任职;过两年小有名气后就去了清华大学。同样,李济和翁文灏也是在自己有一定学术地位和小有名气后被清华大学高薪聘走。其次,李老师赞成量化史学的发展方向。他认为,现代历史学的发展要经历四个阶段,包括“计量史学、数字史学、AI史学和人工技能识别”。李老师表示,历史学家必须要面对的“惊涛骇浪”和“狂风暴雨”,正是“数字化”和“AI技术”,这是历史学未来的发展趋势。未来的历史学将是“基于数字化、数据库和全球互联网”的历史学。但李老师也强调,传统史学仍有“不可替代的作用”,尤其是面对“人的尊严、生存、苦难峥嵘”等信息技术不能完全解决的课题,历史学家的“考证”和“讲故事”能力仍然重要。
近代史研究所云妍副研究员从自己的研究实践出发,分享对量化史学研究的感受。首先,云妍认同“量化”在推动史实构建上的效率和作用,但更重要的是,它“开启了新的研究窗口,改变着我们惯用的工作方式,也不同程度地影响着我们组织学术议题的思维方式”(邓小南《数字人文与中国历史研究》)。另一方面,云妍认为,学者们构建的数据库虽然以客观面目呈现,但同时也是一个主观构建过程,其所建构出来的史实是一种“二级或二级以下的史实”。其次,在现有的量化史学研究里,学者们对具体工具方法的探讨还太少,例如很少有文章专门探讨回归分析、双重差分法等目前流行的分析工具在研究中的优缺点及适用性,也缺乏对其他工具方法的发掘。第三,国外的数字人文研究数据库一般在网上开放,国内虽然学者们所建数据库很多,但开放却很少,不知原因何在。
经济学研究所常旭副研究员从经济学学科的角度讨论经济史的路径问题。首先他回应云妍关于“鄙视链”的问题,承认社科研究中的确存在“经济学帝国主义”的问题。但他也指出,运用定量分析作社会经济史研究在“文章发表”方面有优势,尤其是突破已有研究和“出活儿快”。常旭总结了学界常见的三种经济史研究方法:马克思主义政治经济学的分析和新制度经济学分析,以计量经济学为主的量化分析,以及以研究民间账户和文书资料为主的的社会经济史路径。常旭认为,“科技史”领域也是一个值得量化的方向。
北京大学光华管理学院助理教授董浩从社会学的量化研究谈自己的观察和体会。董浩认为,当今人文社会学科的学科壁垒已经被打破,各学科的学术志趣都是“理解社会运行和社会过程的因然和实然”。他表示,与社会学研究相比,历史学家是“用更少的数据去理解社会运行”,而量化方法给与历史学家“新的工具”。董浩认为,所谓量化研究导致“没有人性”其实是对于“不确定性和差异性”的认知不同,当数据的“量”达到一定程度后,学者们就必须使用统计方法,也因此不得不“放弃细节”。最后,董浩表示,“历史数据的考证严谨”仍然是历史学家的重要贡献。
中国人民大学陈必佳博士后分享她在康文林老师团队的工作以及开设“数字人文”课程的经验和心得。陈必佳首先介绍了“中国历史官员量化数据库”的建设情况,并表示中国人民大学清史研究所《缙绅录》数据库是对外开放的,欢迎大家使用。其次,她分享她与林展、胡恒老师合开的《数字人文》课程的情况。陈老师分别在中国人民大学和清华大学开设这门课程,向跨学科背景的学生教授如何制作数据库和写代码。她发现,虽然理工科背景的同学在使用相关软件方面上手很快,但由于缺乏必要的历史基础知识,他们运用《缙绅录》等数据库仍然会有困难。因此,陈老师鼓励人文类的师生要对自己的知识背景有自信,人文学子在学习相关量化软件的操作后将大有作为。
最后,梁晨教授对特邀嘉宾和与谈人提出的问题进行简单回应。梁晨谈到,今天的讨论从成一农先生的警醒出发,让我们认识到量化史学还在发展和形成自身特点的过程中;其次,关于数据库的开放问题。梁晨表示,数据库的建设是服务学术研究的,应该开放。李中清-康文林团队的“东北人口数据库”早已实现在线开放,但“民国大学量化数据库”由于数据来源涉及多家单位,暂时还未能取得全面开放的授权,今后需要继续努力;最后,梁晨总结了大家讨论中提到的“工具与史学关系”问题。他认为,对于史学研究而言,对工具或方法的追求,不能超脱史料,远离事理与真实。因此,历史学本身是否要做到“高端”,以及如何处理“高级方法”和“远离史料”的关系,大家还需要在实践中不断探索。
历时两个半小时,读书会在大家的热烈讨论中落下帷幕。尹媛萍副研究员再次感谢梁晨教授为大家开启“数字史学系列”第一讲。为更好理解和追踪数字人文为历史学学科带来的机遇和挑战,青年读书会还将继续推出系列讲座,欢迎大家继续参与和关注。