新機遇與新可能:數字人文視野下的歷史學
新機遇與新可能:數字人文視野下的歷史學
【光明青年論壇】
編者按
計算機和互聯(lián)網技術的發(fā)展,極大改變了人文學科的研究范式、教學手段與成果呈現方式。數字人文就是數字技術和人文學科互動下誕生的新興學術領域,在文獻數字化基礎上,以文本挖掘、量化統(tǒng)計、地理信息系統(tǒng)、社會網絡分析、可視化等為代表的數字人文方法給歷史學帶來了很大變化,也逐漸成為我國史學界的關注熱點。盡管認識尚有差異,但數字時代已然來臨,人文學科面臨著如何數字化的問題。本刊組織幾位作為數字人文引入歷史學科的見證者、參與者和推動者的青年學者,圍繞數字人文與歷史學發(fā)展這一主題進行研討,從理念到方法再到實踐,回顧數字人文引入歷史學的歷程和得失,展望未來的新可能,以期對深化相關研究與探討有所助益。
與談人
彭凱翔 河南大學經濟學院教授
潘 威 云南大學歷史地理研究所副研究員
趙思淵 上海交通大學歷史系副教授
主持人
申 斌 廣東省社會科學院歷史與孫中山研究所助理研究員
1
技術與思維:數字人文與史學的不期而遇
主持人:數字人文從本質上說究竟是一種技術工具,還是一種思維方式呢?如果是前者,那么我們應該堅持學科本位,用數字人文技術來解決自身問題。但如果數字人文是一種因應于數字化時代的思維方式,那么它將會給史學等傳統(tǒng)人文學科帶來哪些深刻影響呢?
潘威:在我看來,數字人文集中體現了計算機科學對人類思維方式的影響。目前,對數字人文較為主流的定義為:以計算機、互聯(lián)網等信息化工具為主要手段,通過數字化、可視化、量化等處理方法,對人文社科問題進行研究的方向或者領域。
數字人文作為新興交叉領域,不同學科、不同領域、抱有各自具體目的的學者進入這一領域后,產生不同的看法很正常。數字人文的本質應當是更偏向一種思維方式,因為技術體系不能脫離具體的研究問題而存在,至于它是否會顛覆性重構傳統(tǒng)人文學科,我認為不能簡單地回答“是”或“否”。作為學術研究而言,傳承與變革往往同時存在于我們的工作之中。數字人文如果僅僅是用另一種表達方式重復已有的認識,那注定發(fā)展空間有限。但如果說一定會顛覆傳統(tǒng)研究,也不可能。比如,在歷史自然地理研究方面,“黃河八百年安流期”“唐代氣候特征”“明清小冰期與中國歷史走向”等,都是長期被關注的重大課題,需要信息化技術的支持,數字人文如果能推動這些傳統(tǒng)問題的解決,其生命力才能更為持久。
彭凱翔:數字人文首先是一種技術工具,但它的確會影響看問題的方式——尤其是研究議題的選擇。因為每一種工具都有自己處理起來最有效率的問題,可以把這些問題推到學術前沿,甚至成為“一代之學術”。就數字人文而言,它一方面是將人文學科的文本、圖像等信息以數字化的方式儲存及利用,通過“E考據”等方式提高傳統(tǒng)人文學科研究的效率;但更具革命性的方面在于,它將信息聚合在一起,進行歸類、編碼、匹配等處理,使信息轉化為可比或可關聯(lián)的數據,最終讓研究者能夠從信息中發(fā)現或檢驗某些趨勢、某些關系,為我們從更高維度、以更貫通的方式解釋信息提供了契機。在傳統(tǒng)的學科劃分里,人文學科更偏重特定信息的詮釋,而對通過趨勢、因果關系等來進行理論探討關注不夠。數字人文有助于打破這一劃分,促進社會科學、自然科學與人文學科的交叉,解決一些難點問題(如制度變遷、環(huán)境變遷等)中的數據“瓶頸”。如果說歷史學原本就有一些和社會科學、自然科學交叉性較強的分支(如經濟史、歷史地理等),數字人文給這些分支的發(fā)展提供了新機遇,比如提供了更有趣的呈現方式。
趙思淵:我感覺對人文學科來說,數字人文首先改變了研究環(huán)境。從迄今為止數字人文的發(fā)展來看,特別是在歷史學領域,多數個案研究的核心議題、提問仍然來自歷史學的傳統(tǒng)話題,甚至研究方法也未必超出原本以量化或結構化方法處理史料的方法論。換言之,歷史學總是以史料學為基礎的,這一點不論任何時代都不會發(fā)生變化。不過,數字人文的確改變了整理、分析史料的工作環(huán)境,也令一個歷史學家所能處理的史料規(guī)模達到前所未有的程度。數字人文要面對不同人文學科傳統(tǒng)和多種區(qū)域文化傳統(tǒng),這意味著數字人文本身可以有多重理解,有不同的研究脈絡。
主持人:今天的歷史學教學、研究、大眾傳播等都在不同程度上處于數字人文環(huán)境下,數字人文是怎樣一步一步介入史學研究的具體過程呢?
潘威:我認為,數字人文最初被引入史學領域還是出于提高工作效率的目的,減輕學者在查閱、檢索龐雜史料時的勞動強度,其實這也將是數字人文長期發(fā)揮作用的方向。在計算機普及之前,學者的工作很大程度上依賴圖書館,個人工作必須適應公共資料管理方式;計算機的普及為建立學者個人資料管理體系提供了可能;高性能個人計算機和互聯(lián)網的成熟進一步降低了構建個性化資料管理體系的資金成本和人力成本。數字人文進入史學領域很重要的一個契機,就是順應了史學研究中對個性化信息管理的需求。今后,史學研究更需要跨越學科領域、跨越學者單位,形成復合型的、模塊化的研究團隊,數字人文進一步深入史學就需適應這一趨勢,在發(fā)展個性化資料管理體系的基礎上,形成基于互聯(lián)網的“資料交互網絡”。
彭凱翔:數字人文最核心的理念是對信息進行系統(tǒng)歸類、編碼,而不限于數字化。如果這樣來理解的話,中國傳統(tǒng)文獻中的類書、譜牒之屬,可謂先聲。但真正給這種工作提供動力,是來自近代社會科學、自然科學的需要。以20世紀前期的國內史學為例,傳統(tǒng)史學工作者的譜錄編纂固然活躍,但更能反映風氣之變的當屬有社會科學關懷的湯象龍、梁方仲等學者對經濟史料的表格化整理,以及氣象學家竺可楨將文字記錄轉化為歷史氣候數據等工作。20世紀中期以后,一些國家級的工程又振其余緒,如譚其驤主編《中國歷史地圖集》,中華書局《二十四史》點校中的人名和地名標注,中央氣象局組織繪制的《全國近五百年旱澇分布圖》等。至于相對格式化、規(guī)?;牡胤街?、族譜等史料,海內外學者也在20世紀中期前后就開始不懈耕耘,爬梳其中的農業(yè)、人口等方面資料,并嘗試進行數據化。
最近20多年,由于計算機和互聯(lián)網的普及,文獻的存儲與利用逐步電子化,于是產生了數字人文的提法。存儲與利用形式的改變固然影響面極廣,但如果沒有20世紀以來對史料的編碼化處理作基礎,今天的數字人文或許就僅僅是數字化,而不能真正實現數據化,也難以產生我們所看到和期待的深刻影響。
趙思淵:就數字人文與中國史領域結合而言,項潔主編的《數字人文研究》叢書出版(2010—2016)可能是一個值得關注的事件。此后中文歷史學界有關數字人文的討論逐年增加,以“大數據”或“數字人文”為主題的會議,在2015年之后也顯著增加。
就歷史學內部來說,歷史地理是最早自覺引入各種數字技術的領域,這與歷史地理學的研究特色分不開。而經濟史領域因為處理量化資料,也很早就引入統(tǒng)計分析軟件,并且建設數據庫。不過,對中國古代經濟史來說,進一步開發(fā)適用的數字人文工具也存在一些困難。雖然傳統(tǒng)中國史料中也包含大量經濟相關的數字,但要把這些數字轉化為可分析的數據面臨諸多瓶頸。僅就最基本的價格與度量兩類數字來說,銀兩有多種不同的成色、計重,各類貨物的稱重、體積也都有各種不同的表示方法。如果這些數字不能進行統(tǒng)一的換算,就很難應用現有的數字人文工具進行分析。當然,這也推動我們去思考如何結合史料與研究主題的特性,開發(fā)有針對性的數字人文工具。
2
超越檢索:數字人文在歷史學應用的新進展
主持人:目前,不少歷史學者對數字人文的認識還停留在文獻題錄和史料全文檢索數據庫層面,對量化歷史數據庫、歷史地理信息系統(tǒng)、文本挖掘、社會網絡分析等了解不深。諸位可否結合具體工作介紹一下數字人文在史學研究應用中的新進展呢?
潘威:對于我所從事的歷史自然地理研究而言,環(huán)境和社會信息都非常復雜,要呈現其關系就更為困難,建立一種能夠清晰呈現自然與社會關系、輔助我進行決策的工作環(huán)境非常必要。2016年,我們提出了“數字歷史河流”概念,其核心是實現“歷史時期地表水文過程及人文因素影響機制模擬方法”,對這一理念的試驗是“數字歷史黃河”平臺,包含6個方面:高精度的三維微地貌,水利工程與地形模型的融合方案,河道三維形態(tài)的復原,地表水歷史時期的運動過程模擬與展示,歷史時期的降雨特征重建,歷史時期河流—水利管理方式。而“數字歷史黃河”作為“數字歷史河流”理念的實踐,不僅是一個展現歷史時期黃河河道時空變化的可視化成果,而且是專業(yè)歷史資料管理平臺+一個專題數據集+一系列歷史信息分析和展示功能,是將地理信息系統(tǒng)、工程建模、水文模擬、文本結構分析、社會網絡分析等多種技術手段進行融合的一個嘗試,同時,也是對既有黃河歷史研究中資料體系的重大突破,我們所使用的史料有相當一部分是前人未曾使用過的新史料。目前,這一平臺已經建設了“清代水環(huán)境數據庫”“清代河工用銀數據庫”“清代河務官僚數據庫”和“民國黃河上中游水利工程數據庫”等。我們計劃讓這一平臺提供一種工作環(huán)境,這一環(huán)境以三維方式展現歷史時期黃河的水利工程營建場景和運作場景,包括歷史時期的水文環(huán)境、水利工程三維模型、國家管理制度的可視化等主要組成部分,使用者可以在這一虛擬環(huán)境中“觀察”曾經發(fā)生的黃河故事,也可以通過調整要素(比如增高堤防、抬高水位、增加民夫數量等)重新思考歷史記錄中的黃河水患和工程營造的過程。
彭凱翔:對歷史的理解可以通過對歷史事實按一定的時空關系排比敘述來建構,但無論是時間上的先后關系還是空間上的區(qū)域范疇,本身都不足以構成因果性的解釋。另一種理解歷史的方式是,將它視為多個變量相互影響產生的一個過程,史料則是這個過程給觀測者呈現出來的某些記錄(或樣本)。在后一種方式里,每條記錄都在某種程度上向我們透露變量間的關系,而我們則要努力拼合記錄中的信息,來找出變量間最可能的關系。為此,就需要將歷史記錄結構化,把樣本中的信息分解為若干變量的取值或編碼,形成數據庫。在以往的歷史數據庫建設中,較常見的是將原本就是數據形式的史料進行匯編或電子化。湯象龍、梁方仲等對財政、糧價等數據的整理工作,王業(yè)鍵主持整理的清代糧價數據庫,近年來吳松弟主持的海關數據整理等,均屬此類。也有的數據庫是對原始數據進行某種處理后得到的,如曹樹基研究團隊中的人口數據建立在考辨史料、分析制度背景的基礎上,中央氣象局的歷史災害數據則根據文字記錄進行災害等級的編碼。近年來的一大進展是越來越多的人物、制度等方面非數值但結構化較高的史料得到整理,形成了《中國歷代人物傳記數據庫》《明清人名權威資料庫》《遼寧多代人口數據庫》《清代縉紳錄數據庫》等成果。
與此同時,近20年來,一個突出的現象是經濟學者介入了歷史數據庫工作。他們一方面將歷史學家已整理的數據按時空單元匹配起來,形成多變量的數據庫,另一方面也對一些未結構化的史料進行整理,建立新的數據庫。以我參與建設的利率史數據庫、刑科題本借貸案件數據庫為例,都需要對各種形式的文本史料進行結構化編碼,產生出包含數十個定性與數值變量的數據庫,并盡量將每條數據的時空單元精確到年—府縣級,以便具體研究時能和災害、糧價等其他數據進行匹配。另外,還有一些近代史料,本身已是數據庫,但結構太復雜,它們作為數據庫的價值也需要在社會科學工作者的努力下才能更好發(fā)揮。
主持人:那么諸位認為未來數字人文還可能對史學研究有哪些重大改變呢?
潘威:如同當年“數字地球”與“信息高速公路”理念為歷史地理信息化的起步提供了基礎條件一般,“大數據”和“移動互聯(lián)網”也為歷史地理信息化的進一步發(fā)展準備好了必要條件。但要將這一機遇轉化為實際的創(chuàng)新還有很多問題需要解決。最重要的就是營造好技術創(chuàng)新環(huán)境,數字人文建設需要經費、場地、設備、培訓,這些都需要投入,也需要加強管理。至于具體技術方面,“人工智能”是可以預見的一項具有重大意義的創(chuàng)新,目前,包括我們“數字歷史黃河”在內的多個海內外團隊都在摸索其應用方式。
彭凱翔:史學界的數字人文目前還較少應用人工智能和云計算。人工智能也可以理解成人工+智能。史料的數字化直到現在主要還是依靠人工,也通過人工在文本識別、點校、標注等方面提供了堪稱海量的數據積累,為邁向智能提供了很好的基礎。云計算是和人工智能相輔助的。相信將來我們不僅能夠在互聯(lián)網上方便地查閱史料,還能利用人工智能來更有效地找出我們真正需要的史料。另外,目前民間文獻的數字化還很不夠。對于內在結構較特殊的賬簿、族譜等史料的數字化,學界恐怕還要做不少探索,一旦民間文獻的數據庫工作鋪開,中國史研究乃至社會科學研究都可能發(fā)生驚人的變化。
3
審視與期許:從史學學科傳統(tǒng)展望數字人文的未來
主持人:任何一種技術、方法都有其適用對象、適用限度,須與其他研究方法技術相配合。數字人文熱之下,更需要我們回到歷史學學科傳統(tǒng)進行冷靜的審視與反思,以更好地發(fā)揮數字人文的作用。請就此談談看法。
潘威:傳統(tǒng)與現代結合是我一貫的主張,否則研究工作就成了“無源之水”,技術方案自然也就“無的放矢”。就我個人的經驗和認識而言,數字人文只是改變了歷史敘述的方式,輔助研究者進行史料辨析、建立因果鏈條等,數字人文并不能代替研究者的決策地位。至于歷史感的形成和升華還是需要依托傳統(tǒng)方式,閱讀、寫作、經歷、田野考察等才能真正培養(yǎng)歷史感,數據庫、地理信息系統(tǒng)等技術手段能夠使這些方法的運作更為有效,但無法從根本上改變歷史感的培養(yǎng)方式。
彭凱翔:研究人員在面對更加大量的數字化文獻時,的確可能會在文本的咀嚼上不夠從容,但并不意味著后者不重要。事實上,如果要對史料進行結構化編碼的話,就需要對史料的體裁、筆法、制度背景等有系統(tǒng)的把握,這些都離不開考據上的積累。所以,現在構建新的歷史數據庫,同樣也要在史料辨析上先下足功夫,所謂“越多人工,越多智能”。另外,歷史學的傳統(tǒng)本身有多元性,專門史等分支的交叉性一直就很強。只是,歷史學者在最近的交叉研究中受技術等限制,往往局限于史料或數據提供者的角色,這是有必要矯正的,交叉研究不應僅是用其他學科比較華麗的技術重新印證已有的解釋,而是要讓歷史學也從中開拓新領域,得到新發(fā)展。
趙思淵:如前所述,我始終還是相信,數字人文不會改變歷史學所關切的根本議題。但數字人文的確改變了歷史學家面對歷史文獻的方式,只是這種改變在歷史上也不止一次發(fā)生過。對歷史學家來說,也許當下更需要思考的是將來如何面對原生數字化史料,盡管以數字人文處理傳統(tǒng)史料是當前較為活躍的領域。此外,數字人文對歷史學的影響不僅在于研究方面,也在于教學以及面對公眾的方式,可視化、人機交互等都是顯著的變化。這些變化不僅意味著如何講述歷史,也將改變歷史研究成果發(fā)布中學者與讀者之間的關系。
主持人:數字人文是一個系統(tǒng)工程,想要持續(xù)、健康發(fā)展,必須在原始資料的收藏與提供者(檔案館、圖書館、博物館等)、資料的加工者與數字人文產品的提供者(商業(yè)公司、收藏機構、科研機構、研究者)、數字人文產品的使用者(研究者、公眾)之間形成良性互動與循環(huán)。其中,研究者兼有需求方和供給方雙重角色。諸位可否從這兩種不同角色來談談對數字人文產品提供者有什么期待以及數字人文基礎設施建設所面臨的問題與可能的解決途徑呢?
潘威:這個問題非常值得討論,從需求方而言,我們希望各級檔案管理部門能夠提供資料查閱和使用方面的便利。從數字人文的研制方而言,我認為最重要的是建立有戰(zhàn)斗力的工作團隊,特別是在史學研究機構推行實驗室建設。如果能有更多高校重視“數字人文”實驗室建設,將其納入學校統(tǒng)一的實驗室管理體系,實驗室管理方式和運營方式的改變將會極大改善數字人文的科研環(huán)境。
彭凱翔:目前在高校利用較多的是商業(yè)化的數字人文產品,主要形式是全文數據庫和可檢索的圖像數據庫。不過,這些產品對于深度的數字人文研究而言,還有不小的改進空間。例如,檢索效率不是太高,通常不支持跨庫的檢索,檢索結果的存取亦受很多限制,這些都不利于進行大樣本的研究。一種比較徹底的改進思路是為某些數字產品提供主流數據分析軟件的應用程序編程接口,讓有需要的用戶可以自主調用。當然,配套的版權規(guī)范也要跟上。而方志、族譜等基礎史料的數據化,其工作量既非某一團隊或機構所能勝任,其受益方也是整個學界,最好有國家層面的協(xié)調機制。
趙思淵:這里可能有幾個不同層次的問題需要考慮。第一,數字人文也是互聯(lián)網浪潮的一部分,開放,更開放,應當是數字人文發(fā)展中的追求方向。第二,對于歷史學來說,如果我們將數字人文理解為研究環(huán)境的轉變的話,這種轉變的驅動力既可以是研究者個人,也可以是公藏機構與學術單位,還可以是商業(yè)機構。數字人文產品的供給必然是多元的,如果能夠形成一些通用標準,對更多的研究者是有利的。比如說,各個數據平臺之間是否能夠設置通用的數據接入、轉換接口,或者在開放獲取方面達成一些共識。第三,數字人文的確可能為學者與公藏機構的合作帶來新的可能性。我們已經看到,數字人文的發(fā)展為公藏機構拓展自身的研究領域打開了新的空間。在這個新的空間中,學者與公藏機構唯有緊密合作才可能有新的創(chuàng)獲。進一步說,館藏資源的價值與影響力,將更多由關聯(lián)研究所決定,而不僅是資源本身是否稀缺。
■專家點評
王濤(南京大學歷史學院教授、數字史學研究中心主任):作為歷史學者,我們也要用歷史的眼光看待當前數字人文方興未艾的現實。從歷史的維度來看,歷史學研究領域出現方法的更新、觀念的變革,都是非常正常的事情。這不僅讓歷史學獲得不斷發(fā)展的動力,延續(xù)其生命力,而且能夠讓歷史學的面目變得更加鮮活多樣。比如趙思淵提到數字人文的技術儲備可以帶來歷史書寫的改變,就是數字人文提供的各種可能性之一。
雖然當下數字人文成了一個非常流行的概念,但它也只是一種路徑而已,不能代表歷史學研究的全部內容。數字人文不謀求取代,也沒有能力顛覆整個傳統(tǒng)歷史學科的方法論與問題域。哪怕是作為個體的歷史學研究者,是積極擁抱數字人文,還是恪守傳統(tǒng)方法論,都是一種合理的個人選擇。所以,在很長的一段時期,數字人文與傳統(tǒng)歷史學將和平相處。不過,我們也需要意識到,不管是主動還是消極地看待數字人文,它作為一種方法與一種理念將長期存在,甚至會以愈加彌散的方式影響到歷史學的方方面面。所以,我們始終要用一種探索的、開放的心態(tài)去看待數字人文。探索性與開放性也正是數字人文的應有之義。為此,數字人文的后半場需要落實到對年輕學子的教育層面。當然,數字人文的教育不單純是讓學生掌握某種技能,真正核心的競爭力是數字素養(yǎng),一種能夠觸及靈魂的對新生事物的好奇心,這才能充分調動年輕一代的研究熱情,讓更多具有原創(chuàng)性的歷史成果面世。
胡恒(中國人民大學清史研究所副教授、數字人文研究中心研究員):數字人文被引入歷史學的時間雖然不長,但近年來相關機構不斷設立,學術活動日趨火爆,這時更需冷眼看熱潮,方可行穩(wěn)致遠。數字人文對傳統(tǒng)史學而言,不是顛覆重構,而是如虎添翼。一些歷史學者對數字人文存在的非議,特別是在史料收集與考證方面,嚴格來說,是將數字人文較為狹隘地理解為檢索工具所致。數字人文對歷史學的助力,不僅是技術工具的外部沖擊,而且也是歷史學科發(fā)展的“內部理路”所致。
回歸“宏大敘事”。近40年來,史學研究碎片化日益突出,學界已有較多反思,并不斷呼吁要重建歷史學的“宏大敘事”。但這種回歸應是在新的高度、方法上的再回歸。這一進程并非易事,它需要理論思想的駕馭,但數字人文亦將成為重要工具,幫助我們更好地嫁接起碎片化的經驗研究與富有想象力的結構研究之間的有機聯(lián)系,將整體與個案、定性與定量相結合,催生新的宏大敘事。
強化“問題導向”。當今世界正不斷面臨超越地域、國家和學科的重大問題,僅靠單一學科顯然無法有效回應時代和社會需求,未來學術發(fā)展應該以問題為導向,打破學科壁壘。數字人文為歷史學的這一轉向提供了新的可能,它在人文科學、社會科學與自然科學間建立起互聯(lián)互通的平臺,并在這一融合中以歷史學的人文特性改善技術的工具化取向,亦將大大擴大歷史學的學科影響。
培養(yǎng)“文理兼通”人才。我國學生多自高中時代即已文理分科,歷史學從文科生中選拔,大學以后多數高校又不夠重視對歷史學學生數學和技術方面的熏陶,導致人才培養(yǎng)中知識結構單一。數字人文為歷史學從人才選拔、人才培養(yǎng)和就業(yè)取向上以文理兼通的復合型人才培養(yǎng)為導向提供了新的可能。
版權聲明:凡注明“來源:中國西藏網”或“中國西藏網文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網和署著作者名,否則將追究相關法律責任。