古籍?dāng)?shù)字化應(yīng)以技術(shù)為突破口
古籍?dāng)?shù)字化應(yīng)以技術(shù)為突破口
──兼與程毅中先生商榷
程毅中先生《古籍?dāng)?shù)字化須以古籍整理為基礎(chǔ)》(刊于《光明日報》4月30日),以國學(xué)公司的電子產(chǎn)品《中國歷代筆記》為例,對古籍?dāng)?shù)字化的基礎(chǔ)進(jìn)行了探討,發(fā)表了看法,也對我們提出了批評。先生能夠?qū)iT探討我們的產(chǎn)品,我感到很高興,也非常感謝。
我與程先生相識已久。多年以來,先生一直對我們的古籍?dāng)?shù)字化給予大力支持和熱情指導(dǎo)。古籍整理不能一蹴而就,我們的古籍?dāng)?shù)據(jù)庫產(chǎn)品也很難一步到位。對于程先生文中所列的問題,我想在此逐一說明。
壹 關(guān)于版本問題。《中國歷代筆記》數(shù)據(jù)庫均有所本,在單機(jī)版的《國學(xué)寶典》中,不但有版本信息,還有書目解題。
貳 關(guān)于序跋問題。按我們的體例,原作者的序跋,一般予以保留;后人所寫序跋,因其非本書的正文內(nèi)容,原則上不予收錄。
叁 關(guān)于書目和版本的選擇問題。為滿足學(xué)術(shù)需要,我們邀請了北京大學(xué)、清華大學(xué)、北京語言大學(xué)、首都師范大學(xué)、東北師范大學(xué)等高校的多位教授擔(dān)綱分卷主編。然而,由于此項工程規(guī)模宏大,掛一漏萬,在所難免。這也正是我們需要與學(xué)術(shù)界共同完成的。
肆 關(guān)于作者的名字問題。由于古籍中書名、人名盤根錯節(jié),情況復(fù)雜,古書作者署名混亂,編者未能詳加考證。但凡遇學(xué)者或用戶指出,我們都將及時更正。《葆光錄》正文誤成《稽神錄》,是程序鏈接錯誤。程先生發(fā)現(xiàn)后告訴我們,亡羊補(bǔ)牢,還不算晚。此外,數(shù)據(jù)庫的開放性也是我們產(chǎn)品的特點,多年來,我們的產(chǎn)品得益于廣大用戶良多,就在于學(xué)者們在使用過程中及時反饋意見,使我們能不斷改進(jìn),以臻完善。
伍 關(guān)于“全書沒有統(tǒng)一體例”的問題。程先生在第柒條頭一句話就是“據(jù)U盤的凡例說”,至少表明產(chǎn)品是有凡例的。按《辭海》的解釋,凡例是“說明著作內(nèi)容和編纂體例的文字”。事實上,《中國歷代筆記》“凡例”對收錄范圍、編目、版本、輯佚、文字、分段標(biāo)點、檢索功能、附錄、卷標(biāo)編碼、人名索引等均有說明,共有15條之多。
陸 關(guān)于“輯集未注出處”的問題。在大型古籍?dāng)?shù)據(jù)庫問世以前,輯佚工作是件難度很大的事;在有大型古籍?dāng)?shù)據(jù)庫之后,輯佚工作難度大大減少,查找時間大大縮短,主要是內(nèi)容甄別的排序。對輯文一般不注出處,是我們數(shù)據(jù)庫的體例,因為查找這些易如反掌。
柒 關(guān)于充分吸收現(xiàn)代人的研究成果與校勘記的問題。對于紙質(zhì)書的出版,國家有一整套統(tǒng)一的出版標(biāo)準(zhǔn)要求;而古籍?dāng)?shù)據(jù)庫尚處于初創(chuàng)階段,在國家尚未制定統(tǒng)一標(biāo)準(zhǔn)的情況下,我們只能自定標(biāo)準(zhǔn),在摸索中前進(jìn)。
程先生舉《朝野僉載》為例,認(rèn)定我們是根據(jù)中華書局整理本錄入并刪除校勘記,此話不妥。《朝野僉載》主要有一卷、五卷、六卷本三個系統(tǒng),《寶顏堂秘笈》及《四庫全書》本均為六卷。民國石印本《寶顏堂秘笈》并不難得,《四庫全書》全文及圖像版數(shù)據(jù)庫首都師范大學(xué)文學(xué)院購有一套,上海古籍、三秦出版社都出過整理本。我們使用的《寶顏堂秘笈》底本,本來就沒有校勘記,又從何處刪起?改正發(fā)現(xiàn)的錯別字,是數(shù)字化流程中的一道工序,是保證古籍質(zhì)量的重要措施,也是我們的基本權(quán)利和義務(wù)。
捌 關(guān)于數(shù)據(jù)庫中的標(biāo)點問題。《中國歷代筆記》總字?jǐn)?shù)逾一億字,如果將這些內(nèi)容排成10萬字一冊的書,足足有一千冊之多。按圖書出版質(zhì)量標(biāo)準(zhǔn)(差錯率低于萬分之一,標(biāo)點每處計0.1個差錯),標(biāo)點差錯在10萬以內(nèi)尚屬合格。程先生精心挑選的幾處標(biāo)點錯誤,我們已全部改正。一些學(xué)者在使用國學(xué)數(shù)據(jù)庫時,發(fā)現(xiàn)錯誤,及時通報,并囑速改,以免貽誤后人。我對這些品行高尚的學(xué)者心存感激,這是對古籍?dāng)?shù)字化事業(yè)的巨大鞭策和鼓勵。
為了做好古籍?dāng)?shù)字化工作,我不僅踏踏實實地做,也一直想在理論上得到證明,集思廣益。
程先生提出的主要觀點是“古籍?dāng)?shù)字化須以古籍整理為基礎(chǔ)”,但以我們研發(fā)數(shù)字產(chǎn)品的實際經(jīng)驗而言,“古籍?dāng)?shù)字化應(yīng)以技術(shù)為突破口”。古籍?dāng)?shù)字化的核心是信息技術(shù),信息技術(shù)是一個強(qiáng)大的工具,是給現(xiàn)代社會帶來巨大便利的創(chuàng)新工程,是讓所有人都受益的工程。這是傳統(tǒng)的古籍整理不能替代的,也是將來發(fā)展的方向。這就如同傳世文獻(xiàn)從手抄本向印刷本轉(zhuǎn)變的過程一樣,是不可阻擋的潮流。數(shù)據(jù)庫建設(shè)是一個非常復(fù)雜的系統(tǒng)工程,不僅涉及計算機(jī)軟件、硬件、數(shù)據(jù)庫結(jié)構(gòu)、數(shù)據(jù)關(guān)聯(lián)、搜索引擎等,還涉及到版本學(xué)、目錄學(xué)、文字學(xué)、文史工具書等。
國學(xué)網(wǎng)從創(chuàng)辦之初就堅持嚴(yán)格的技術(shù)要求,也堅持嚴(yán)格的學(xué)術(shù)要求。古籍?dāng)?shù)字化起步時間不長,已經(jīng)顯示出了它的巨大價值。它在發(fā)展的過程中存在問題,我們隨時都在改正,而且連改正的方式也遠(yuǎn)比傳統(tǒng)古籍整理的改進(jìn)方式更為先進(jìn)。我們還將投入更多的力量,繼續(xù)拓展古籍?dāng)?shù)字化事業(yè)。目前已有千萬學(xué)者受益于古籍?dāng)?shù)字化成果,程先生也當(dāng)是其中一員,這是令我們引以為傲的事情。如果古籍?dāng)?shù)據(jù)庫被個別出版社所壟斷,那將導(dǎo)致古籍?dāng)?shù)字化產(chǎn)業(yè)中道崩殂,半途而廢,這不僅會喪失我國在相關(guān)領(lǐng)域的國際領(lǐng)先地位,危及我國的文化安全,也將使我國的學(xué)術(shù)事業(yè)受損。
與傳統(tǒng)的古籍出版事業(yè)相比,古籍?dāng)?shù)字化才剛剛起步;與博大精深的中華傳統(tǒng)文化相比,古籍?dāng)?shù)字化才邁出了萬里長征的第一步。現(xiàn)在有許多出版機(jī)構(gòu)已經(jīng)參與到古籍?dāng)?shù)字化建設(shè)大軍中來,我們愿與所有支持、關(guān)心國學(xué)事業(yè)的單位和個人合作,共同推進(jìn)古籍?dāng)?shù)字化事業(yè)的發(fā)展,讓中國文化在世界發(fā)揚(yáng)光大。
(作者為首都師范大學(xué)電子文獻(xiàn)研究所所長、北京國學(xué)時代文化傳播股份有限公司法人代表)
(編輯:孫菁)
