男人天堂日韩,中文字幕18页,天天伊人网,成人性生交大片免费视频

實(shí)用文檔>簡(jiǎn)說(shuō)戰(zhàn)國(guó)楚文字?jǐn)?shù)字化處理系統(tǒng)論文

簡(jiǎn)說(shuō)戰(zhàn)國(guó)楚文字?jǐn)?shù)字化處理系統(tǒng)論文

時(shí)間:2024-10-22 14:35:00

簡(jiǎn)說(shuō)戰(zhàn)國(guó)楚文字?jǐn)?shù)字化處理系統(tǒng)論文

簡(jiǎn)說(shuō)戰(zhàn)國(guó)楚文字?jǐn)?shù)字化處理系統(tǒng)論文

簡(jiǎn)說(shuō)戰(zhàn)國(guó)楚文字?jǐn)?shù)字化處理系統(tǒng)論文

  首個(gè)關(guān)于出土戰(zhàn)國(guó)楚文字資料的數(shù)字化成果《戰(zhàn)國(guó)楚文字?jǐn)?shù)字化處理系統(tǒng)》(光盤)經(jīng)華東師范大學(xué)中國(guó)文字研究與應(yīng)用中心古文字?jǐn)?shù)字化開發(fā)組多年開發(fā)研制,日前由上海教育出版社出版。

  該成果是一個(gè)多功能的戰(zhàn)國(guó)楚系漢字及其所傳載的出土文獻(xiàn)的數(shù)字化處理平臺(tái),包括“戰(zhàn)國(guó)楚文獻(xiàn)檢索系統(tǒng)”、“戰(zhàn)國(guó)楚文字字庫(kù)”、“楚文字輸入法”、“楚楷對(duì)應(yīng)轉(zhuǎn)換程序”四大部分!皯(zhàn)國(guó)楚文獻(xiàn)檢索系統(tǒng)”收錄了迄今已發(fā)表的戰(zhàn)國(guó)楚系簡(jiǎn)帛文、銅器銘文、璽印文、貨幣文文獻(xiàn),相關(guān)實(shí)物材料2267件。其中以簡(jiǎn)帛文為主體,以著錄材料計(jì),有《曾侯乙墓》(文物出版社1989年7月版)竹簡(jiǎn)及竹簽文字218條;《包山楚簡(jiǎn)》(文物出版社1991年10月版)竹簡(jiǎn)、木牘文字306條;《九店楚簡(jiǎn)》(中華書局2000年5月版)竹簡(jiǎn)文字196條;《郭店楚墓竹簡(jiǎn)》(文物出版社1998年5月版)竹簡(jiǎn)文字711條;《戰(zhàn)國(guó)楚竹簡(jiǎn)匯編》(齊魯書社1995年11月版)竹簡(jiǎn)文字417條;《上海博物館藏戰(zhàn)國(guó)竹書》(一)(上海古籍出版社2001年版)竹簡(jiǎn)文字98條;《上海博物館藏戰(zhàn)國(guó)竹書》(二)(上海古籍出版社2002年版)竹簡(jiǎn)文字116條;《長(zhǎng)沙子彈庫(kù)戰(zhàn)國(guó)楚帛研究》(中華書局1985年7月版)帛書3篇。銅器銘文則以《殷周金文集成》、《考古》、《文物》、《考古與文物》的著錄為主要材料來(lái)源,計(jì)收銘文61篇。璽印文以《古璽匯編》為主要材料來(lái)源,計(jì)收印文92篇。貨幣文以《中國(guó)錢幣大詞典·先秦編》為主要材料來(lái)源,計(jì)收貨幣文32篇?傋?jǐn)?shù)達(dá)56689字,刪除添加的對(duì)應(yīng)通用字、合文釋字及各種符號(hào)等,文獻(xiàn)本體字?jǐn)?shù)為50538,其中簡(jiǎn)帛文48724字,金文1437字,璽印文317字,貨幣文60字。該系統(tǒng)不但具有任意字、句的全文檢索,任意字的頻率數(shù)據(jù)檢索,文獻(xiàn)附著材料的各種屬性檢索,著錄檢索等必要的數(shù)字化處理功能,并且還具備逐字顯示對(duì)應(yīng)原始實(shí)物文字影象的功能。

  “戰(zhàn)國(guó)楚文字字庫(kù)”的收字包括了“戰(zhàn)國(guó)楚文獻(xiàn)多路徑全文檢索系統(tǒng)”中所收錄的文獻(xiàn)實(shí)際用字,并按數(shù)字化處理要求進(jìn)行了嚴(yán)格整理。包括楷體字和原形字?w字形端正,原形字據(jù)銘文拓本掃描制作,逼真美觀。

  “楚文字輸入法”采用了針對(duì)古文字輸入特殊需要的新近開發(fā)的“三級(jí)字符全拼輸入檢索系統(tǒng)”的編碼原則進(jìn)行編碼,是一種非常簡(jiǎn)單易學(xué)(只要掌握全拼輸入者無(wú)需專門學(xué)習(xí))的古文字輸入法,同時(shí)也具有大字符集中生僻字簡(jiǎn)易輸入(即不知讀音也可成功輸入)的功能。

  “楚楷對(duì)應(yīng)轉(zhuǎn)換程序”可以在Word上實(shí)現(xiàn)現(xiàn)代通用繁體字和楚文字原形字的雙向?qū)?yīng)轉(zhuǎn)換,為楚文字原形字的使用創(chuàng)造了極大方便。

  光盤中還附有“說(shuō)明文檔”,含各種程序使用的詳細(xì)說(shuō)明以及有關(guān)系統(tǒng)開發(fā)研究的介紹闡釋,如《“戰(zhàn)國(guó)楚文獻(xiàn)檢索系統(tǒng)”使用指南》、《“楚文字輸入法”使用手冊(cè)》、《“楚楷對(duì)應(yīng)轉(zhuǎn)換程序”使用說(shuō)明》及立足數(shù)字化平臺(tái)的楚文字文字系統(tǒng)的論著《基于“戰(zhàn)國(guó)楚文字?jǐn)?shù)字化處理系統(tǒng)”的楚文字系統(tǒng)概述》。

  這個(gè)系統(tǒng),實(shí)現(xiàn)了出土戰(zhàn)國(guó)楚文獻(xiàn)的多路徑全文檢索,及楚文字的計(jì)算機(jī)輸入,使學(xué)界所期盼的出土楚文字材料的計(jì)算機(jī)數(shù)字化處理變成了現(xiàn)實(shí)。然而,保證這個(gè)目標(biāo)得以實(shí)現(xiàn)的根基,還在于對(duì)該系統(tǒng)的數(shù)據(jù)本身——楚文獻(xiàn)文本的收錄、整理和加工。

  古文字?jǐn)?shù)字化對(duì)數(shù)據(jù)(古文獻(xiàn)文本)是有自己特定要求的,這種要求大致涉及收集、整理、保真三個(gè)方面。

  1.?dāng)?shù)據(jù)的收集,以真實(shí)、系統(tǒng)、窮盡為目標(biāo)。

  古文字?jǐn)?shù)字化具體目標(biāo)涉及多方面多層次:古文字研究,漢字教學(xué),數(shù)字化圖書館建設(shè),互聯(lián)網(wǎng)上的古文字傳輸平臺(tái)建設(shè),乃至涉及古文字的排版印刷等等。要真正完成這多方面多層次的任務(wù),在古文字的數(shù)字化處理平臺(tái)中的數(shù)據(jù)就應(yīng)該是真實(shí)、系統(tǒng)、窮盡的。另一方面,數(shù)據(jù)統(tǒng)計(jì)乃是“數(shù)字化”一大獨(dú)特功能,從這一功能的要求來(lái)看,古文字?jǐn)?shù)字化開發(fā)中的數(shù)據(jù)更必須要在真實(shí)的基礎(chǔ)上達(dá)到系統(tǒng)、窮盡的,因?yàn)椴桓F盡(至少是一定范圍、層次的窮盡),統(tǒng)計(jì)所得數(shù)據(jù)就沒有多大意義。然而具體落實(shí)這種要求,勢(shì)必需要首先在材料收集方面付出艱苦的努力:窮盡是指在所劃定范圍內(nèi)的沒有遺漏;系統(tǒng)是指對(duì)應(yīng)有的方面、層次合理包蘊(yùn)及必要的強(qiáng)調(diào);真實(shí)是指對(duì)資料原始面貌的客觀保持。應(yīng)該說(shuō),各種不同類型的古文字?jǐn)?shù)字化項(xiàng)目為實(shí)現(xiàn)以上目標(biāo)可能會(huì)有不盡相同的操作方式,但在“字”的處理這個(gè)基礎(chǔ)層面上則會(huì)面臨同樣的選擇。比如在目前古文字尚未在國(guó)際標(biāo)準(zhǔn)字符集中編碼的條件下,任何一種古文字?jǐn)?shù)字化產(chǎn)品都必須另建古文字字庫(kù)來(lái)支持電子文本,字庫(kù)中的字形是取自二手材料還是取一手材料?二手材料,是指已有的古文字字匯字典類工具書;一手材料,則是實(shí)物文字材料的拓片影象。毫無(wú)疑問(wèn),利用二手資料,工作會(huì)省力方便得多,而利用第一手資料,則必須投入巨大的歸納、整理、認(rèn)同之類工作量。面對(duì)兩種選擇,開發(fā)組選擇了后者。這是因?yàn),事?shí)證明,如果作前一種選擇,無(wú)法真正實(shí)現(xiàn)數(shù)字化的目標(biāo)。比如說(shuō),開發(fā)組曾經(jīng)利用有關(guān)的古文字字匯建成的古文字字庫(kù),但這樣的字庫(kù)僅在古文字書籍排印中就存在大量缺口。當(dāng)然,不能把問(wèn)題僅僅歸咎于傳統(tǒng)二手資料本身,因?yàn)閭鹘y(tǒng)字匯等二手資料的編纂目標(biāo),一般與數(shù)字化的目標(biāo)并不一致,而它們只收錄摹寫古文字,它們收錄的古文字資料在數(shù)量上相對(duì)現(xiàn)有古文字材料總量有所缺漏,又每每是由歷史原因造成的。所以不能用今天的數(shù)字化的要求來(lái)苛求它們。但我們今天要開發(fā)古文字?jǐn)?shù)字化產(chǎn)品,還去選擇二手材料作為數(shù)據(jù)來(lái)源則是完全不合適的。

  要實(shí)現(xiàn)資料的真實(shí)、系統(tǒng)、窮盡,還有一個(gè)實(shí)現(xiàn)手段問(wèn)題,客觀地講,做卡片之類紙筆操作輔助人腦記憶的傳統(tǒng)方法難以應(yīng)付數(shù)字化所提出的龐雜資料高精密儲(chǔ)存關(guān)聯(lián)的要求,而真正合乎這種要求的手段也應(yīng)該是數(shù)字化的。我們的具體做法是,古文字語(yǔ)料庫(kù)建設(shè)與古文字字庫(kù)建設(shè)同步進(jìn)行,互為支撐,以達(dá)到所需數(shù)據(jù)的真實(shí)窮盡。具體來(lái)說(shuō),就是以原始文字資料圖片為處理對(duì)象,一方面逐字錄入以建設(shè)文獻(xiàn)語(yǔ)料庫(kù),一方面逐字對(duì)應(yīng)造字建設(shè)字庫(kù),這樣就在操作程序上首先保證了語(yǔ)料與其載體字的嚴(yán)密對(duì)應(yīng),再立足這樣的嚴(yán)密對(duì)應(yīng)的基礎(chǔ)平臺(tái),運(yùn)用查詢,關(guān)聯(lián)等數(shù)字化手段來(lái)保證整個(gè)系統(tǒng)資料的完整性。

  當(dāng)然,古文字資料(包括字形、文獻(xiàn)語(yǔ)料等)的窮盡,只能是相對(duì)的,這種相對(duì)性表現(xiàn)在這樣幾個(gè)層次上:一是相對(duì)于實(shí)際存在的資料而言,窮盡是相對(duì)的,因?yàn)榭赡苓有大量客觀存在的古文字資料尚有待我們今后去發(fā)現(xiàn);二是相對(duì)于已經(jīng)出土的資料而言,窮盡是相對(duì)的,因?yàn)橛邢喈?dāng)一部分已經(jīng)出土的資料至今并未正式發(fā)表;三是相對(duì)古文字資料內(nèi)涵的實(shí)際信息而言窮盡也是相對(duì)的,因?yàn)槠裎覀儗?duì)古文字的認(rèn)識(shí)還存在一些盲點(diǎn)。

  如何面對(duì)這種相對(duì)性? 首先,這種客觀的障礙,并不能成為我們?cè)谫Y料收集工作上敷衍了事的借口,立足現(xiàn)實(shí),盡可能地實(shí)現(xiàn)資料的窮盡系統(tǒng)是必須努力達(dá)到的目標(biāo)。同時(shí),由于數(shù)字化工具書是可以不斷進(jìn)行版本升級(jí)并通過(guò)網(wǎng)絡(luò)等渠道提供給用戶的,因此在首次開發(fā)的版本中預(yù)留了各類資料增補(bǔ)路徑是必要的,這樣開發(fā)者就可以很方便地跟蹤古文字資料不斷出土,相關(guān)研究不斷推進(jìn)的發(fā)展,與時(shí)俱進(jìn),隨時(shí)把新的文本數(shù)據(jù)填加進(jìn)老版本中去。

  2.?dāng)?shù)據(jù)的整理,以標(biāo)準(zhǔn)、統(tǒng)一為目標(biāo)。

  要實(shí)現(xiàn)數(shù)字化處理,必須貫徹標(biāo)準(zhǔn)化原則,也就是說(shuō),所有應(yīng)該統(tǒng)一的數(shù)據(jù),都不能存在歧異。具體來(lái)說(shuō),在任何一種古文字工具書所必需的古文字字庫(kù)和古文獻(xiàn)語(yǔ)料庫(kù)建設(shè)中,都必須實(shí)現(xiàn)字的唯一性,只有唯一,相關(guān)的字才能夠在字庫(kù)中占據(jù)一個(gè)唯一的內(nèi)碼碼位,在計(jì)算機(jī)的查詢、統(tǒng)計(jì)、篩選等過(guò)程中才能成為唯一的處理對(duì)象,從而保證數(shù)據(jù)的準(zhǔn)確可靠。而在語(yǔ)料庫(kù)中,同一個(gè)字也絕不能使用多個(gè)字形,而在某些層次上有對(duì)應(yīng)關(guān)系的不同文字又有必要加以認(rèn)同,只有這樣才能實(shí)現(xiàn)數(shù)字化處理的效果。為達(dá)到這樣的目標(biāo),我們又不得不面對(duì)楚文字資料(包括實(shí)物資料和研究資料)的重新整理問(wèn)題。

  從數(shù)字化的角度來(lái)看,現(xiàn)有古文字資料中存在不少難以容忍的歧異。舉例來(lái)說(shuō),在最近出版的《上海博物館藏戰(zhàn)國(guó)楚竹書(二)》中的“舜”字,共21見,原形均為 ,而由于不同考釋者的不同隸定,此字在該書中就出現(xiàn)了兩種寫法: (見于“容成氏”篇11次)和 (見于“子羔”篇10次)。

  毫無(wú)疑問(wèn),如果保留了這種歧異,數(shù)字化處理就成了一句空話。因此,在《戰(zhàn)國(guó)楚文字?jǐn)?shù)字化處理系統(tǒng)》中,我們對(duì)類似歧異都作了統(tǒng)一。需要說(shuō)明的是,我們?cè)趯?duì)此種歧異的統(tǒng)一中,一般是選擇相對(duì)能夠體現(xiàn)造字理?yè)?jù)的字形,但這并不意味著我們對(duì)被淘汰的字形持完全否定的態(tài)度,因?yàn)樗鼈兺鶑哪承┙嵌葋?lái)看有著存在的合理性。只是因?yàn)閿?shù)字化的處理無(wú)法容許歧異的存在,我們才進(jìn)行了統(tǒng)一工作。

  3.?dāng)?shù)據(jù)的保真,以兼顧不同層次需要為目標(biāo)

  整理、統(tǒng)一,無(wú)疑是數(shù)字化所必須的,但另一方面,經(jīng)過(guò)整理、統(tǒng)一,我們的成果最終所呈現(xiàn)的字形就有可能與所依據(jù)的實(shí)物材料或研究材料不盡一致。這樣我們又不得不面對(duì)一個(gè)古文字資料的保真問(wèn)題。

  數(shù)字化處理的標(biāo)準(zhǔn)化,與古文字資料的保真要求之間存在一定的矛盾,但我們必須看到,保真只能是相對(duì)的,也應(yīng)該具有相對(duì)性,這是因?yàn)閺牟煌繕?biāo)出發(fā),保真有著不同的要求,而超越需要的保真,則不免成為一種干擾。比如記錄文獻(xiàn)的用字,如果僅從保真的角度看,似乎應(yīng)該使用原形字,但如果真的使用原形字,勢(shì)必遭遇這樣的麻煩:古文字原形實(shí)際是一種手寫字,一個(gè)字在文獻(xiàn)中出現(xiàn)多少次就會(huì)有多少個(gè)特定的原形字形,難道在它出現(xiàn)的每一處都用一個(gè)不同的字形嗎?顯然,從一般文獻(xiàn)閱讀的角度來(lái)看,這并非是必要的;而對(duì)一個(gè)本可以用數(shù)字化手段來(lái)處理的電子文本來(lái)說(shuō),這樣的處理只能帶來(lái)災(zāi)難性的后果。相反,用似乎很不保真的楷體字則是合適的,因?yàn)閷?duì)于同樣結(jié)構(gòu)的古文字原形字而言,它具有最大的概括性,因而也就可以成為最合宜的認(rèn)同基點(diǎn),這正是以一般文獻(xiàn)閱讀為目標(biāo)這個(gè)層次的數(shù)字化處理所最需要的。

  當(dāng)然,標(biāo)準(zhǔn)化與保真性的矛盾也并非完全無(wú)法調(diào)和,而兼顧各個(gè)層次的保真和數(shù)字化兩方面的要求的手段,依然只能是數(shù)字化。我們?cè)凇稇?zhàn)國(guó)楚文字?jǐn)?shù)字化處理系統(tǒng)》的開發(fā)中,采用了三種方式來(lái)實(shí)現(xiàn)這種目標(biāo):一是開發(fā)專門程序來(lái)實(shí)現(xiàn)文獻(xiàn)所用楷體字與古文字原形字的對(duì)應(yīng)轉(zhuǎn)換,如“楚楷對(duì)應(yīng)轉(zhuǎn)換程序”,可以保證人們方便的查檢記錄楚文獻(xiàn)的各個(gè)楷體字所分別對(duì)應(yīng)諸多原形字(包括異體原形字)。

  二是開發(fā)文獻(xiàn)閱讀主界面的逐字原始圖影顯示功能。這一功能,可以讓人們?cè)跈z索、閱讀楚文獻(xiàn)時(shí)隨心所欲地調(diào)閱任意字的原始影象,因而更加貼近文獻(xiàn)實(shí)際閱讀的需要。

  第三,在文獻(xiàn)用字的直接呈現(xiàn)上,給予必要的認(rèn)同。具體方式有兩種:隸古定與通用字同出、原形字與隸定字同出。

  隸古定反映了眾多同結(jié)構(gòu)原形字與其所對(duì)應(yīng)的現(xiàn)代通用字構(gòu)形上的基本差異,而對(duì)這種差異的保真,對(duì)古文字研究來(lái)說(shuō),意義重大——由于古文字的考釋研究目前還存在一些盲點(diǎn),同時(shí)又有一定數(shù)量的文字存在歧釋,因此,釋文用字采用比較接近原始形態(tài)的隸古定方式有助于明確對(duì)象、避免誤解,也有助于進(jìn)一步深入研究。然而,如果僅僅給出隸古定,既無(wú)法反映相應(yīng)的研究成果,又取消了相應(yīng)層次的數(shù)字化處理的可能。因此,我們采用了在隸古定字形后加括號(hào)標(biāo)注通用字的方法,以兼顧兩種需要。

  原形字與隸定字同出的方法一般適用于考釋研究尚存某種局限的文字。對(duì)一般歧釋字則在原形字后加括號(hào)標(biāo)注楷體字,以前者明確所指對(duì)象,以后者反映某種考釋意見。另外,對(duì)有些用法已有共識(shí),而文字隸定尚有疑問(wèn)者同樣用在原形字后加括號(hào)標(biāo)注楷體字的方法來(lái)反映現(xiàn)有的認(rèn)識(shí)水平。

【簡(jiǎn)說(shuō)戰(zhàn)國(guó)楚文字?jǐn)?shù)字化處理系統(tǒng)論文】相關(guān)文章:

學(xué)校數(shù)字化校園建設(shè)自評(píng)報(bào)告范文03-22

《馬說(shuō)》韓愈賞析06-29

教學(xué)設(shè)計(jì):《雨說(shuō)》02-12

八年級(jí)《晏子使楚》教學(xué)設(shè)計(jì)(精選15篇)10-16

說(shuō)屏教學(xué)反思大全03-20

馬說(shuō)的教學(xué)體會(huì)及反思03-07

打擊樂說(shuō)課教案02-27

《說(shuō)“木葉”》教案設(shè)計(jì)(精選10篇)04-21

楚源小學(xué)2017年小學(xué)語(yǔ)文二年級(jí)上冊(cè)期中試卷03-20

小學(xué)水墨畫的教與學(xué)論文03-19

用戶協(xié)議