從圖書館“搬”到網絡平臺
點擊瀏覽器,進入一個名為“識典古籍”的網站,記者看到《周易》《左傳》《禮記》等典籍陳列在首頁上。隨機點開一本,左側為章節目錄,右側為正文,排版形式既符合現代人的閱讀習慣,又還原了古籍紙張的閱讀美感。
這是北京大學數字人文研究中心與字節跳動合作研發的一個數字古籍平臺,自去年10月發布以來,已上線古籍1200余部,免費供公眾瀏覽。
與一些數字化平臺僅提供古籍影像不同,點擊該平臺的功能按鈕,還能實現簡繁體轉換、圖文對照、全文檢索、支持移動端等服務。北京大學人工智能研究院副研究員楊浩介紹,該平臺應用了文字識別、自動標點等技術,不僅將影印本上的文字提取整理,還可以標記文本中的人名、地名等信息?!拔覀兝萌斯ぶ悄芗夹g,將古籍由以前的圖像加工成可檢索的文本與數據,方便研究者、用戶直接閱讀?!?/p>
隨著數字技術不斷成熟,科技賦能古籍工作取得可喜進展。國家圖書館公布的數據顯示,全國已累計在線發布古籍數字資源13萬部。打開《永樂大典》高清影像數據庫(第一輯),讀者能瀏覽到國家圖書館館藏的《永樂大典》40冊、75卷的高清圖像及相關知識;浙江大學打造的“智慧古籍平臺”可在線查閱數萬篇古籍,還有著者小傳、人物行跡及社會網絡關系圖等延伸信息。
這些古籍是怎樣從圖書館庫房“搬”到網絡平臺的?楊浩介紹,古籍數字化過程分為兩步。首先將古籍進行掃描。古籍掃描使用專用非接觸式掃描儀,通過高像素照相機,盡量不按壓古籍頁面進行拍照;采用的光源是防紫外線的LED燈冷光源,減少對古籍的損害。其次是對圖像做數據化處理,利用人工智能技術對文字進行識別,對標點、實體等進行標引,方便讀者閱讀與檢索。
減少人工智能識別錯誤率也很重要。字節跳動公益古籍項目相關負責人說,具有中文、歷史等專業知識并對古籍感興趣的員工,自發成立2600人的志愿者團隊,參與古籍校對工作。
方便讀者獲取資源
“作為再生性保護的重要手段,古籍數字化及其平臺建設意義重大?!北本┐髮W數字人文中心主任王軍認為,古籍數字化可以很好地解決古籍保護與利用之間的矛盾。傳統上,人們要利用古籍,必須直接接觸書籍,這可能導致書籍受到進一步磨損,且只能在特定的圖書館或機構中閱讀。通過數字化,不僅能減少對古籍的物理損害,還方便讀者隨時隨地獲取這些資源。
近年來,古籍數字化和平臺建設進展很快。國家圖書館搭建的“中華古籍資源庫”已成為全國古籍資源類型和品種最多、體量最大的綜合性資源共享發布平臺。中華書局的“中華經典古籍庫”已發布6000多種、15億字的點校本古籍。一些地方還打造了整理少數民族古籍的數字平臺,如“廣西古籍文庫”目前共收錄100多部古壯族文字古籍底本和近千份民族地區文書等資源。
不過,古籍數字化工作依然任重道遠。業內人士指出,中國現存古籍中,只有少部分被拍攝成圖像資料,而大部分未實現文本數字化。此外,大量古籍分散收藏在各個圖書館或收錄于不同的數據庫,難以進行高效檢索、關聯閱讀和深度挖掘與利用。
如何將這些散落的古籍整合起來?6月初,一個旨在對2.5萬種古籍進行數字化整理的古籍智慧圖書館項目啟動。該項目到2025年底,將實現國家圖書館等館藏古籍數字化,并為人們提供公益性閱讀服務。
短視頻再現古籍里的美食
“沒想到古籍這么‘香’?!痹诳赐晗盗卸桃曨l《食光機·隨園私房菜》后,有網友留言說。該短視頻由南京圖書館歷史文獻研究館研究員史星宇和韓超制作,他們按照清代文學家袁枚寫的《隨園食單》,再現古籍里的美食,吸引不少人觀看。
“為了更好地呈現《隨園食單》中的菜品,我們結合歷史和古代文學等相關學科背景,對原文文本一起推敲斟酌,在烹飪上反復試驗,同時盡量還原書中的烹飪手法,保證菜品的原汁原味。”韓超說。
如何讓數字化的古籍和人們更親近呢?這考驗著文保機構、科研院校與互聯網公司等相關從業者的創新能力。如紀錄片《古籍尋游記》運用交互技術、掃描技術等,讓用戶以更沉浸的方式體驗甲骨文刻字、建造敦煌莫高窟的過程。
王軍認為,在古籍數字化、活化過程中,人文社科學者要積極介入,并加強與技術人員合作;高校古典文獻學等相關專業應培養兼具技術與學術能力的復合型人才,部分古籍內容應向著“數字文創”轉化,讓古籍更好地走進千家萬戶。
鄭重聲明:此文內容為本網站轉載企業宣傳資訊,目的在于傳播更多信息,與本站立場無關。僅供讀者參考,并請自行核實相關內容。