300229 拓爾思
產品功能
通用文檔識別
表格識別
文檔矯正
圖片文檔還原
卡證識別

識別圖片中的文字,返回包括字位置信息。同時能夠識別表格、特殊字符等。

支持識別圖片/PDF格式文檔中的表格內容,覆蓋各類表格樣式,包括常規有線表格、無線表格、含合并單元格表格。同時,支持多表格內容識別。

對圖片中的文件、卡證、票據等內容進行四角點檢測定位,提取主體內容并對其進行矯正。

支持各種圖片格式,及PDF、OFD文件識別。針對辦公、政法、票據等常用場景的文檔進行表格、文本等元素的識別和提取,并進行全文排版,輸出完整的文件。

支持對二代居民身份證正反面所有8個字段進行結構化識別,包括姓名、性別、民族、出生日期、住址、身份證號、簽發機關、有效期限。支持識別社會保障卡號、姓名、性別、出生日期、銀行卡號、有效期限等。

通用文檔識別

識別圖片中的文字,返回包括字位置信息。同時能夠識別表格、特殊字符等。

表格識別

支持識別圖片/PDF格式文檔中的表格內容,覆蓋各類表格樣式,包括常規有線表格、無線表格、含合并單元格表格。同時,支持多表格內容識別。

文檔矯正

對圖片中的文件、卡證、票據等內容進行四角點檢測定位,提取主體內容并對其進行矯正。

圖片文檔還原

支持各種圖片格式,及PDF、OFD文件識別。針對辦公、政法、票據等常用場景的文檔進行表格、文本等元素的識別和提取,并進行全文排版,輸出完整的文件。

卡證識別

支持對二代居民身份證正反面所有8個字段進行結構化識別,包括姓名、性別、民族、出生日期、住址、身份證號、簽發機關、有效期限。支持識別社會保障卡號、姓名、性別、出生日期、銀行卡號、有效期限等。

>
產品優勢
復雜環境下的高識別度
拓爾思 OCR 自研技術支持橫向、豎向拍攝,適應透視畸變、光照不均、部分遮擋、畫質模糊、加蓋公章、水印以及文字寬度、粗細、顏色、下劃線高度不一致等情況,大幅提升文字檢測的準確度,復雜環境下具有高可用性。
命名實體識別的高匹配度
對于字段信息較為固定的文件,如身份證、社???、醫???、增值發票等,可以使用模版匹配等技術。對于版式不固定的文件,例如簡歷、合同、辦公文件等文檔,可采用實體識別解決關鍵信息提取困難的問題,能夠實現在不同場景中精準識別不同實體類型。
具備自訓練的多樣化配置
用戶結合實際場景需求,可采用全新自主訓練模式,快速定制識別表單/卡證/票據。用戶還可在平臺自主搭建獨有的訓練模型,進行獨有模版文檔的識別和結構化數據提取,滿足多樣化的場景應用需要,享受企業費用成本大幅降低、工作效率切實提高等便利。
應用場景
用戶身份認證
票據單據識別
印刷圖像轉文本
文本審核與管理
身份識別主要包括身份證識別、社???、醫???、銀行卡識別、行駛證/駕駛證識別??蓮V泛應用在政府、銀行、保險、醫院、證券行業等需要驗證用戶身份的場景中,幫助減少用戶的身份信息輸入,提升認證效率,提高用戶體驗。
用于企業開具的各類票據識別,通過 OCR 技術提取各種紙質票據的號碼、抬頭、金額、票據代碼等關鍵信息,支持數據錄入和自動核對,減少人工校驗成本。
大量紙質印刷作品掃描電子文檔后,通過OCR 技術轉換成可編輯的文本,實現文檔高度還原,為文字排版、信息檢索提供極大的便利。
在政府、銀行、電力、公安等行業中,通用OCR可以智能識別商業合同、電子卷宗、招投標文檔等的文字內容,并根據不同業務場景的校驗點進行文檔合規性審核。也可以校對廣告圖中的文字內容,過濾廣告中的不良信息,為企業降低業務風險。