300229 拓爾思
方案內容

面向文字校審中常見的五大類錯誤,提供智能化、自動化的文字校審服務,包括:

字詞類錯誤校對
語法類錯誤校對
常識類錯誤校對
政治敏感類錯誤校對
格式類錯誤校對

識別由各種編碼輸入法、語音識別、機器翻譯等導致的字詞類錯誤,包括字音相似、字型相似、人名錯字、人名多字、稱謂錯誤、地名錯誤、機構錯誤等。

識別多種句法類錯誤,包括:句式雜糅錯誤和結構助詞錯誤等。

識別多種語義知識錯誤,包括:地名錯誤、地域歸屬錯誤、國家首都搭配錯誤、洲國歸屬錯誤、組織成員國錯誤、單位指標錯誤、縮略詞錯誤以及特定事件錯誤等。

識別多種政治類常識錯誤,包括:職務稱謂錯誤、人物職務搭配錯誤、宗教民族搭配錯誤、政治敏感詞錯誤等。

識別多種文檔格式錯誤,包括:標點符號錯誤、日期格式錯誤、百分比格式錯誤等。

字詞類錯誤校對

識別由各種編碼輸入法、語音識別、機器翻譯等導致的字詞類錯誤,包括字音相似、字型相似、人名錯字、人名多字、稱謂錯誤、地名錯誤、機構錯誤等。

語法類錯誤校對

識別多種句法類錯誤,包括:句式雜糅錯誤和結構助詞錯誤等。

常識類錯誤校對

識別多種語義知識錯誤,包括:地名錯誤、地域歸屬錯誤、國家首都搭配錯誤、洲國歸屬錯誤、組織成員國錯誤、單位指標錯誤、縮略詞錯誤以及特定事件錯誤等。

政治敏感類錯誤校對

識別多種政治類常識錯誤,包括:職務稱謂錯誤、人物職務搭配錯誤、宗教民族搭配錯誤、政治敏感詞錯誤等。

格式類錯誤校對

識別多種文檔格式錯誤,包括:標點符號錯誤、日期格式錯誤、百分比格式錯誤等。

方案優勢
技術先進
采用知識庫匹配和深度學習相結合的技術,囊括單詞和文本語義,文本糾錯效果更好。
功能齊全
糾錯詞庫、知識庫的種類齊全,提供5大類,20多種糾錯功能。
使用快捷
提供網頁端與Microsoft Word插件客戶端,并提供Restful API接口規范可與業務系統快速集成。
誤報率低
對糾錯候選集進行了語言模型的權重計算,使得糾錯誤報率降低。
性能卓越
單機支持100并發,每秒鐘30k以上的吞吐能力。
行業定制
針對行業語料,可以用已有詞庫、知識庫自動構建訓練集,訓練行業糾錯模型。
國產適配
支持大部分的國產芯片和操作系統,包括x86平臺的海光、arm的鯤鵬和飛騰、龍芯等國產化硬件環境,以及深度、中標麒麟等國產化操作系統。
應用場景
公文校對
新聞媒體內容采編
OCR識別與語音識別后校審
在公文稿件寫作的各個環節中,文稿校對是非常重要的一環。利用自動校對技術,校審文稿內容是否合乎黨和國家的方針、政策、法律、法規,避免在政治、法律、思想、道德等方面,可能對社會產生的影響和后果。拓爾思自動校對云服務利用AI自動校對技術,從內容準確性、表述規范性、敏感信息檢測等多個方面出發,輔助校審人員對公文稿件進行自動校審工作。
加強媒體內容審核檢測,不僅有利于提升新聞輿論工作的引導力和公信力,更有利于吸引更多的用戶和創作者關注平臺,保證平臺良好的發展勢頭。然而人工審核無法應對鋪天蓋地的網絡信息,且無法在保證在信息時效性內完成相關內容的審核。TRS自動校對云服務通過與采編平臺的集成,可實現內容發布前的內容校對;通過與內容巡檢平臺的集成,可實現對網站、新媒體等內容發布后的檢測,做到及時發現及時整改。
在OCR識別場景中,原始圖片信息由于清晰度不夠或污損情況將導致識別出現偏差,造成文字錯誤的情況;同樣在語音識別中,由于方言或語速因素也會造成識別不準確現象。借助TRS自動校對云服務可以快速定位疑似問題,解決大批量電子文件的自動快速校審問題。
最佳實踐
海思智媒
海思智媒的采編中心中提供文字校審工具,集成自動校對的SaaS服務,在文稿采編的工作中進行實時文字校審,為客戶提供了便捷、快速的校審體驗。