近年歐美日多所高等學府齊聲響應一新概念--“數位人文”(digital humanities,或“電子人文”),引起大眾廣泛關注。人文科學一般泛指與人和社會直接相關的學問,比對自然科學的硬科學。自然科學與現代科技緊密銜接,看似理所當然。人文科學給人感覺就是只管讀書,究竟有沒有追趕時代步伐,把學問數位化的必要呢?
學問的本質就是求真,儘管領域和方法論上的差異,知識必然經過探索、累積、整理、過濾和淘汰的不同階段 。“數位人文”的目標就是希望充分利用科技,克服人類社會既有的各種限制,促進學術和人文科學的研究,整合和普及知識,把人類視野推到最前線。
隨著過去二十多年來個人電腦和網絡普及化, 各種為學習而設計的電子工具如雨後春筍,應運而生。我們所指的“數位人文”除了各種數據化典籍和工具外,實際上牽涉到整個學習的模式和人文學科的整體面貌。舉例說,掃描本和維基百科給大家帶來前所未有的便利,但其中利弊則尚待探討。資訊質素良莠不齊,搜索器的操作局限,還有訊息紊亂的情況,相信對學佛的人來說並不陌生。
數位化訊息如何整合和優化本身也是一門學問。在專業佛學研究的領域裡,不少院校近年耗費大量資源去推動“數位人文”,其中有成功的,但也有些徹底失敗的例子,值得反思探討。
國內一位梵學泰斗曾經被質問為何不去編一套梵漢字典。他淡淡的回答說,字典不是隨便編的,背後需要一個學術團隊,還有基礎研究去支撐,編出來的東西才有價值,不然人家不用便沒有意思。他的一個學生後來當了教授,為了申請國家基金,打著科研的旗號,希望利用科技去編一套梵漢字典。其實當時台灣的林光明已經發願要編譯一套以日本的《梵和大辭典》為基礎的梵漢字典,不過這位教授不理,覺得他有他做,我有我做,反正不用親力親為,只是下判給一群學生“幹活”,馬不停蹄的把荻原雲來的《梵和大辭典》重新輸入,打算隨便加刪一點便交貨。至於數位格式和校對步驟等則完全沒有周詳考慮,覺得先幹著再說。後來日港台多地學府公開他們的數據庫,於是這個名副其實的“國家豆腐渣工程”亦告吹。不過事情還沒完結,這位教授連同另一位不諳梵語的教授在香港申請了一個更大的資金,這次打著“佛經數位化”的旗號,目標是通過電腦分析去比對佛經漢譯與梵語原文之間的語法關係云云。聽起來很科學,但實際操作層面上出現不少問題。首先他們利用的並不是自己輸入的數據,而是抄襲國外學者的公開檔案。不是正軌合作,人家的東西質量如何無法辨認。加上自己不是電腦專業,程式編寫的工序只能外判出去。至於梵語的語法分析,則下判給一批博士生和年輕博士去做機器化的標籤工作。其實西方學者早已經寫出辨認梵語語法的程式,無須依賴人力辨認。他們在這個工程半途才發現自己如何落後,人家的自動化標籤程序,按一個鍵便完成,把那群超時工作的博士和博士生嚇得目瞪口呆。
這情況的出現,先不說資源的浪費,歸根究底還是學者之間缺乏溝通 。既沒有處理大型數據庫的經驗,亦沒有掌握好“數位人文”發展的脈絡,加上好大喜功,閉門造車,最後的結果自然就是失敗。
今年9月筆者在日本松江舉行的日本印度學佛教學會年會發表論文之際,參加了一場“數位人文”的座談會,了解日本佛教界在電子佛學裡的一些前沿工作。其中最令人欣慰的,除了技術的先端性,最重要的還是背後精密的思維,團隊的合作和分工。簡單的說,首要的為眼光和眼界,想清楚,做好準備才去動手。而且項目必須公開,讓各方學者指點批評,互相切磋,這才說得上因緣具足,項目才會至臻完善。實際上,世界各地不少高等學府都在各自建立自己的數據庫,其中只有部分對外公開,筆者親眼目睹現今一些高端程式組合,可以讓學者不用按幾個鍵便能引經據典,進行多語言對勘,並搜索出所有相關的研究論文和材料。至於兩岸三地,台灣在佛學研究中一直佔著領先地位,近十多年來推出不少大部頭的數據庫,其中以法鼓山牽頭成立的中華電子佛典協會的電子佛典集成(CBETA)最為矚目。中國大陸近年得到國家投放大量資源推動佛學研究,而大眾對佛學和“數位人文”的需求亦甚殷切,可惜國內網絡受到諸多限制,學術體制欠透明,引致國內佛學資訊異常紊亂,重量不重質,錯漏百出的情況十分普遍。至於香港就更不用說了,由於就連一個國際水平的佛學圖書館也沒有,學術以營商的管治方式運作,相關的古典學、印歐語言學、印度學、印度哲學、文獻學等基礎學科長期處於真空狀態,因此本地佛學一直未能與世界接軌。不過由於香港擁有高度自由,還有豐厚的經濟基礎和國際交通樞紐的優勢,在網絡開通的時代“電子佛學”也許能夠彌補一些先天的不足,為未來帶來轉機。
(待續)
網頁推介:
1)電子大藏經:CBETA還是SAT?
SAT大正新脩大藏經テキストデータベース:
http://21dzk.l.u-tokyo.ac.jp/SAT/ddb-bdk-sat2.php
CBETA電子佛典集成
http://tripitaka.cbeta.org
要在浩如煙海的大藏經裡翻查資料,就算是熟讀經藏的大德也可能無從入手,經典電子化徹底改變了讀經和研究佛經的模式。CBETA和SAT是兩個當今研究漢文佛典的重要資源,前者原來為東京大學 《大正藏》電子化的科研項目,其後法鼓山的CBETA後來居上,開發出讀經軟件和搜索器,其光盤安裝版功能甚多,並包涵大量其他經藏。不過SAT仍然具有一定優勢,因為包含了《大正藏》55卷以外CBETA所欠的內容,而且網絡版搜索平台操作方便。近年SAT繼續發展,與東大Muller教授的半開放式電子佛教辭典和BDK“平行文數據庫”結合。至於CBETA走的方向則集中文獻收集,搜索工具和引文功能比前者方便,兩者可以說是各有千秋。
2)多方位佛教辭庫
Bauddha Kośa佛教用語用例集
http://www.l.u-tokyo.ac.jp/~b_kosha/start_index.html
佛教名相複雜,在不同經典裡有不同的用法和含義,隨便翻閱佛教辭典有時只能一知半解。要掌握佛教的名相,必須配合經文和注釋,還有整體知識系統和正確的歷史觀才說得上是“如實正知”。東京大學建立Bauddha Kośa的目的就正是要以多方位角度去讓讀者理解複雜的佛教名相。像阿毘達磨的“五位七十五法”,以圖表和HTML鏈接化表達,內容細心挑選,除了提供各種相關語言訊息,還有出典、譯文等等,一目瞭然。 (http://bushiso.mydns.jp/~bkosha/html/index_75dharma.html#)
3)寫本數據庫
日本古寫經數據庫
http://koshakyo-database.icabs.ac.jp/p02_canonList.seam
漢譯佛經有多古老?《四十二章經》、《道行般若經》等相信都是東漢時代譯出,至今近二千年了。不過從文獻學的角度去看,我們今天的漢譯佛經,一般以刻版印刷的經藏為依據,年代最早的而又最為流通的是韓國海印寺的再雕版高麗藏,至今有八百年左右的歷史,其他我們日常接觸到的大藏經,其版本最早的也不會超過北宋。二十世紀學者發現的敦煌殘卷,還有日本的手抄寫本,其中內容往往與後來版本頗有出入。隨著“數位人文”的普及,各國科研機構爭相把自己國家收藏的寫本陸續數據化和公開。國際佛教學大學院大學設置的日本古寫經數據庫便是一個極好的例子。日本那一個寺收藏了那一部經,一目瞭然。由於古經卷十分珍貴,一般放在寺院的藏經閣或博物館裡並不公開,位於東京的國際佛教學大學院大學收藏了大量重要古經卷的掃描檔,而部分已在網站公開。