「滿文輸入通」和「滿文識別通」的滿文電腦字美觀自然。但二「通」除常用滿文字外,對阿禮嘎禮字和老滿文都不能辨識,希望「一檔館」日後能再接再勵,增大辨識功能,這對研究入關前史和滿文大藏經將大有助益。(甘德星附識)
───────────────────────
日前,中國第一歷史檔案館(以下簡稱“一史館”)在“改革開放四十年滿文檔案工作回顧與展望”座談會上正式發佈了“滿文輸入通”“滿文識別通”軟體及“滿文朱批奏摺全文檢索資料庫”。這是國內少數民族手寫體文字圖像電腦識別的首次成功應用。
“滿文識別通”
專家首先演示了“滿文識別通”軟體,它的功能是將滿文檔案的圖像資訊通過識別技術轉換成可編輯檢索的文本資訊。軟體介面如下:
介面可同時顯示滿文檔案原圖、滿文標準字體或滿文轉寫字母,便於校對。上圖演示以滿文朱批為例,左邊是檔案的檔案名,淡黃色背景為檔案圖像,右邊的拉丁字母是識別結果。
在實際操作中,大批量資料加工在後臺進行,由機器操作,而具有滿文專業技能的人均可以參與校對,一定程度上緩解了滿文人才稀缺的壓力。
據介紹,這一系統的滿文行書識別率86.6%,滿文楷書識別率95.1%,處於國內外行業領先地位。同時軟體可以實現機器學習、迭代更新,隨著樣本庫的增加,識別率逐步提升。它的單機識別速度達到每小時625畫幅,相較於純人工每人每小時大約4畫幅的速度,效率顯著提高。此外,軟體易操作、相容性強,基於微軟系統開發,對軟體和硬體環境要求不高,便於推廣使用。
“滿文輸入通”
“滿文輸入通”軟體包括滿文輸入法、滿文字形檔、拉丁字母與滿文相互轉換軟體。
其中滿文字形檔包含了團隊最新設計的幾種滿文字體,這些字體取材於一史館檔案中真實存在的滿文字體。
滿文字形檔:雕版體
滿文字形檔:書名體
滿文字形檔:榜書體
拉丁字母與滿文相互轉換軟體
上圖演示中,左邊是滿文的拉丁字母轉寫,右邊是滿文。這一軟體能夠實現雙向轉換、批量轉換,既方便學者使用,也方便相關機構進行資料庫的建設。
滿文輸入法
滿文輸入法解決了滿文鍵位與滿文轉寫統一的難題,省略了切換按鍵。在文檔中,輸入滿文時可像漢語一樣切換字體,軟體設計了包括雕版體、奏疏體、行書體、匾額體、書名體和榜書體等字體供選擇;方便教學、科研和滿文古籍出版等工作。有學者提到,現在有些文物機構的滿語匾額書寫尚不規範,可以應用“匾額體”字形檔來解決。
字體較為雄渾的滿文匾額體
滿文朱批奏文檢索資摺全料庫
應用“滿文識別通”及“滿文輸入通”開發的“滿文朱批奏摺全文檢索資料庫”有滿文史料13萬餘件,可以應用於局域網,也具備接入互聯網的能力。
資料庫登錄介面
以往檔案查詢只能依據著錄題名通過檢索檔號或者責任者來查詢檔案,有了全文資料庫以後,可以檢索檔案全文資訊,檢索效率更高。
資料庫利用平臺的檔案閱讀介面,左邊是原檔圖像,右邊是文本信息
右側的文本資訊可以顯示為拉丁字母轉寫或滿文字體,滿文字體可切換三種字體
此外該資料庫還有後臺管理功能,為資料庫中的資料和使用者設置使用權限,包括是否能下載、閱讀,以保障資料安全。滿文朱批奏摺全文檢索資料庫將於2018年12月3日起在中國第一歷史檔案館利用平臺向社會開放利用。
湃新聞記者 彭珊珊
2018-11-06
責任編輯:鄭詩亮
沒有留言:
張貼留言