網(wǎng)站地圖|客服中心|設為首頁|加入收藏

解決方案

古籍文獻全文數(shù)字化

時間:2009-8-11 16:27:13 人氣指數(shù): 【 大 中 小 】

北京天潤智力專業(yè)從事紙質(zhì)文獻的數(shù)字化加工,將文獻資源制作成符合國際標準的數(shù)字資源,進行深度數(shù)據(jù)加工和加密處理,制作成全文檢索光盤供用戶使用,非常適合于圖書館、出版社、期刊雜志、各類企事業(yè)單位以及個人用戶。

古籍全文數(shù)據(jù)庫

對古籍資源的全文進行數(shù)字化處理,為讀者提供全文閱讀、全文檢索或智能分析服務。根據(jù)全文數(shù)字化的技術(shù)處理情況,可以將其分為圖像版、文字版、圖文版。對圖像的掃描處理我們一般采用JPEG、TIFF格式,經(jīng)過OCR識別、人工校對后生成可以全文檢索的雙層PDF文件,既便于用戶閱讀、檢索,又便于數(shù)據(jù)共享和傳輸。

1、手工錄入:

將古籍的全文以鍵盤輸入計算機,使之數(shù)字化。經(jīng)過標引及系統(tǒng)處理,凡錄入的文字都可以檢索、統(tǒng)計,貯存空間小,檢索速度快。同時,為了保證文字的準確率,我們開發(fā)了古籍自動?毕到y(tǒng),對錄入后的文本進行自動校對,并采用人工輔助校對的方式,經(jīng)過3~5個校次,文字錯誤率控制在萬分之一以內(nèi),達到出版水平。

2、圖像掃描:

保存古籍文獻的電子影像,用掃描儀等將古籍文獻的文字(包括圖表)以圖像形式進行存儲。存儲為國際通用的PDF格式,版式保留完整,文字不會產(chǎn)生錯誤,且能保證文獻的原始狀態(tài),同時圖像文件經(jīng)過技術(shù)處理后,能以較小的貯存空間存儲。

3、雙層PDF圖文格式:

用掃描方式制成TIFF圖像,然后利用OCR技術(shù)將圖像形式全部識別為可檢索的漢字,并將文字和圖像進行對應,制作成圖像在上、文字在下的雙層PDF格式文件。既便于用戶快速準確地查找到所需內(nèi)容,又能使用戶古籍的原始面貌。雙層PDF特別適合于古籍數(shù)字化,異寫、通假、避諱等造成的眾多漢字無法完全識別,用戶通過圖像即可對照。

古籍書目數(shù)據(jù)庫

以書目內(nèi)容為數(shù)字化對象,對古籍的元數(shù)據(jù)描述,內(nèi)容包括書名、責任者、版本、卷數(shù)、刻印年代、藏地、版式等情況,形成機讀目錄格式,向用戶提供結(jié)果查詢。

本站搜索關(guān)鍵詞:北京解決方案提供商 | 國內(nèi)解決方案專業(yè)公司 | 信息化解決方案 | 企業(yè)應用解決方案 | 解決方案中心 | 企業(yè)解決方案 | 公司解決方案 | 行業(yè)解決方案 | 信息化解決方案公司 | 應用系統(tǒng)解決方案

銷售熱線

7x24小時全國售前咨詢熱線:010-57281389

7x24小時全國售后服務熱線:13020085953 15313016798

手機 | 微信同號:18600846206   QQ:523313456

立即咨詢 網(wǎng)站建設業(yè)務咨詢|客服熱線:010-57281389 13020085953

點這里給我發(fā)消息 電子郵箱:cnet99@cnet99.com

營業(yè)地址(東部):北京市朝陽區(qū)伊莎文心廣場A座3層B-22

位置分享

營業(yè)地址(西部):北京市豐臺區(qū)汽車博物館東路1號諾德中心9-605

標準網(wǎng)站,網(wǎng)站建設,域名注冊,虛擬主機,獨享主機,企業(yè)云郵箱,網(wǎng)站維護一條龍,北京網(wǎng)站建設中心


  掃一掃 加微信
  微信號:cnet99com

  掃一掃 加關(guān)注
  微信平臺

天潤智力-專注于互聯(lián)網(wǎng)平臺建設與服務領(lǐng)域 中國互聯(lián)網(wǎng)平臺建設服務提供商

萬網(wǎng)阿里云金牌首席合作伙伴站點 全線代理萬網(wǎng)阿里云產(chǎn)品及服務

中國萬網(wǎng)正式通過ISO9001國際標準質(zhì)量體系認證

Copyright©1999-2024 天潤智力 備案/許可證編號 京ICP備2020040216號-3

公安部備案號 11010502032413