北京大學攜手字節跳動推動中華古籍數字化平臺建設
      • 來源:中國科普網
      • 作者:陳杰
      • 2022-03-18 13:06

      中國古籍一直面臨數字化程度低、以文本形式進行數字化的古籍數量少、難以檢索等問題。數據顯示,我國現存古籍有20萬種,據不完全統計,其中有數字化掃描影像的已經有8萬種,而實現文本數字化的僅有3-4萬種左右。這對于古籍內容檢索和開展研究造成了不便。

        3月17日,字節跳動向北大教育基金會提供捐贈,全面支持“北京大學-字節跳動數字人文開放實驗室”的工作,研發古籍數字化平臺,利用智能技術加速中華古籍資源的數字化建設,向全社會提供公益化服務。

        據了解,該實驗室將調動國內外的相關力量,在三年內完成一萬種精選古籍的智能化整理工作,基本覆蓋儒家、道家和佛學的核心典籍目錄。提供開放、體驗良好的閱讀服務和基本文本庫,并借助知識圖譜等技術幫助學者高效檢索和利用古籍中的信息。

        同時,項目也將推出結合OCR、句讀、實體識別和知識圖譜等技術構建的一站式自動古籍智能化整理平臺,并對社會大眾免費開放,便于收藏機構、研究者、相關專業的師生和廣大古籍愛好者自行完成古籍數字化工作,加快整個行業數字化古籍資料的效率。

        “北京大學-字節跳動數字人文開放實驗室”重視傳承中華傳統文化,希望將平臺建設成為開放、共享、可對古籍進行充分檢索利用的信息平臺,以應對這些古籍保護與利用中的挑戰。

        字節跳動AI Lab總監李航表示:“我們希望通過公益捐贈,支持北大的古籍數字化成果全面轉化為社會服務。我們也希望與北大的跨學科團隊在OCR、自然語言處理、知識圖譜等技術領域展開全面合作,充分利用人工智能技術加快古籍數字化整理、研究、與利用,讓更多的研究者、愛好者以更高效、便利的方式獲取古籍里蘊藏的豐富知識?!?/p>


      責任編輯:胡利娟
      • TEL:010-58884104
      • E-Mail:kepu@kepu.gov.cn
      • 如果您有任何意見或建議,請聯系我們!
      一级一级A片视频正版,一级一级毛片A级毛片,一级一级毛片免费版,一级一级毛片免费播放,一级一级毛片免费播放器