300229 拓爾思
產品功能
圖像分類
以圖搜圖
圖像敏感識別
人臉識別
OCR識別
目標檢測
音視頻處理
智能語音處理
視頻檢索

本功能基于定制的深度卷積神經網絡模型實現。支持ImageNet的1000類分類以及定制模型分類功能。 在線接口:http://ai.trs.cn/DL-VRS/docs中圖像分類部分

此功能基于定制的深度卷積神經網絡模型提取的深度特征實現。深度特征集成圖像的高層語義特征,利用 CNN 和 RNN 等深度學習算法得到的深度特征不僅保持了一定的不變性,而且還包含了更多的高層語義信息,可以有效地縮小底層特征與高層語義之間的鴻溝。同時,相鄰位置的特征往往是高度相關的,因此可以檢測到圖像的局部特征,可以有效解決相似圖像檢索問題。 在線接口:http://ai.trs.cn/DL-VRS/docs中以圖搜圖部分 圖像檢索Demo:http://ai.trs.cn/image_demo/image/image_search 艦船檢索Demo:http://ai.trs.cn/graphdemo/

此功能采用定制的深度卷積神經網絡模型實現。支持NSFW識別及暴恐識別。 在線接口:http://ai.trs.cn/DL-VRS/docs中圖像敏感識別部分

此功能采用目標檢測和人臉特征比對相結合的方法。第一步先把圖片中的人臉位置檢測出來;第二步提取人臉部分圖片的特征;第三步和庫中的人臉進行相似度比對,得到結果。支持自建庫。幫助用戶識別圖像、視頻中的重要人物及敏感人物。 在線接口:http://ai.trs.cn/DL-VRS/docs中人臉識別部分 人臉檢索在線Demo:http://ai.trs.cn/image_demo/image/face_search

此功能基于 CRNN+CTC 模型框架,在保證識別效果的同時實現模型蒸餾,使模型尺寸縮小,加快推理速度。目前支持簡體中文、英文、數字、常用標點的識別。幫助用戶識別圖像、視頻的字幕;幫助用戶識別圖像、PDF中的表格及文字信息。 在線接口:http://ai.trs.cn/DL-VRS/docs中OCR識別部分 在線Demo:http://ai.trs.cn/table_image_demo/static/index.html

此功能基于經典深度學習模型架構,實現敏感旗幟、商標 Logo、電視臺標及道路行人車輛檢測等功能。模型可定制。幫助用戶識別圖像、視頻中感興趣目標的位置。 在線接口:http://ai.trs.cn/DL-VRS/docs中目標檢測部分 旗幟檢測Demo:http://ai.trs.cn/flag-detection/ 商標 Logo 檢測Demo:http://ai.trs.cn/logo-detection/ 電視臺標檢測Demo:http://ai.trs.cn/tv-detection/ 車輛行人檢測Demo:http://ai.trs.cn/street-detection/

此功能主要基于視頻處理 SDK,實現音視頻基礎信息提取、視頻抽幀、音視頻分離、音視頻編碼轉換以及音視頻格式轉換功能。幫助用戶編輯音視頻數據,更方便地對接智能識別業務。 在線接口:http://ai.trs.cn/DL-VRS/docs中音視頻處理部分

此功能基于深度學習模型,實現語音識別、語音生成及語音分類功能。支持語音中英文識別及生成。幫助用戶更方便地將音頻數據打標以及將音頻轉換為文字,更全面地理解視頻中的信息。 在線接口:http://ai.trs.cn/DL-VRS/docs中智能語音處理部分

基于深度學習模型提取出的圖像特征、文字及人臉信息,實現綜合的視頻檢索功能。 在線Demo:http://ai.trs.cn/image_demo/image/video_search

圖像分類

本功能基于定制的深度卷積神經網絡模型實現。支持ImageNet的1000類分類以及定制模型分類功能。 在線接口:http://ai.trs.cn/DL-VRS/docs中圖像分類部分

以圖搜圖

此功能基于定制的深度卷積神經網絡模型提取的深度特征實現。深度特征集成圖像的高層語義特征,利用 CNN 和 RNN 等深度學習算法得到的深度特征不僅保持了一定的不變性,而且還包含了更多的高層語義信息,可以有效地縮小底層特征與高層語義之間的鴻溝。同時,相鄰位置的特征往往是高度相關的,因此可以檢測到圖像的局部特征,可以有效解決相似圖像檢索問題。 在線接口:http://ai.trs.cn/DL-VRS/docs中以圖搜圖部分 圖像檢索Demo:http://ai.trs.cn/image_demo/image/image_search 艦船檢索Demo:http://ai.trs.cn/graphdemo/

圖像敏感識別

此功能采用定制的深度卷積神經網絡模型實現。支持NSFW識別及暴恐識別。 在線接口:http://ai.trs.cn/DL-VRS/docs中圖像敏感識別部分

人臉識別

此功能采用目標檢測和人臉特征比對相結合的方法。第一步先把圖片中的人臉位置檢測出來;第二步提取人臉部分圖片的特征;第三步和庫中的人臉進行相似度比對,得到結果。支持自建庫。幫助用戶識別圖像、視頻中的重要人物及敏感人物。 在線接口:http://ai.trs.cn/DL-VRS/docs中人臉識別部分 人臉檢索在線Demo:http://ai.trs.cn/image_demo/image/face_search

OCR識別

此功能基于 CRNN+CTC 模型框架,在保證識別效果的同時實現模型蒸餾,使模型尺寸縮小,加快推理速度。目前支持簡體中文、英文、數字、常用標點的識別。幫助用戶識別圖像、視頻的字幕;幫助用戶識別圖像、PDF中的表格及文字信息。 在線接口:http://ai.trs.cn/DL-VRS/docs中OCR識別部分 在線Demo:http://ai.trs.cn/table_image_demo/static/index.html

目標檢測

此功能基于經典深度學習模型架構,實現敏感旗幟、商標 Logo、電視臺標及道路行人車輛檢測等功能。模型可定制。幫助用戶識別圖像、視頻中感興趣目標的位置。 在線接口:http://ai.trs.cn/DL-VRS/docs中目標檢測部分 旗幟檢測Demo:http://ai.trs.cn/flag-detection/ 商標 Logo 檢測Demo:http://ai.trs.cn/logo-detection/ 電視臺標檢測Demo:http://ai.trs.cn/tv-detection/ 車輛行人檢測Demo:http://ai.trs.cn/street-detection/

音視頻處理

此功能主要基于視頻處理 SDK,實現音視頻基礎信息提取、視頻抽幀、音視頻分離、音視頻編碼轉換以及音視頻格式轉換功能。幫助用戶編輯音視頻數據,更方便地對接智能識別業務。 在線接口:http://ai.trs.cn/DL-VRS/docs中音視頻處理部分

智能語音處理

此功能基于深度學習模型,實現語音識別、語音生成及語音分類功能。支持語音中英文識別及生成。幫助用戶更方便地將音頻數據打標以及將音頻轉換為文字,更全面地理解視頻中的信息。 在線接口:http://ai.trs.cn/DL-VRS/docs中智能語音處理部分

視頻檢索

基于深度學習模型提取出的圖像特征、文字及人臉信息,實現綜合的視頻檢索功能。 在線Demo:http://ai.trs.cn/image_demo/image/video_search

>
產品優勢
接口規范
統一采用HTTP RESTful接口實現,并配有Swagger UI,方便調試。
處理效率高
支持圖像/視頻的多種接口傳輸類型,支持多線程調用以及GPU加速計算。
全要素提取
采用大數據、語義智能等技術,實現對圖像/視頻內容進行全要素智能提取,包括圖像特征、文字信息、語音信息、位置信息等,進行細顆粒度打標,極大地提高處理效率。
綠色軟件
不修改注冊表,不修改系統目錄。
模型定制
可根據智拓提供的服務對模型進行訓練和驗證。
免費試用
可根據該文檔中提供的在線地址或TRS人工智能開放平臺提供的服務進行免費試用。
全場景擴展
采用微服務架構,實現圖像及視頻檢索、圖像及視頻場景分類、視頻編輯處理、圖像視頻審核及版權比對等全場景應用進行可插拔式的擴展。
應用場景
圖像及視頻檢索
圖像及視頻場景分類
視頻編輯處理
圖像視頻審核/版權比對
面向大規模圖像及視頻庫,以及多樣的文件格式,幫助用戶實現更加高效、準確、便捷的檢索服務。
面向大規模圖像及視頻庫,提供全方位的特征及標簽信息。幫助用戶實現更加高效的數據打標及數據分類功能。
面向大規模視頻庫及視頻編輯場景,幫助用戶更加高效、統一地編輯和轉換視頻庫。
面向大規模圖像及視頻庫,幫助用戶更加精準、準確及高效地進行內容審核工作。
用戶價值
提升數據處理效率
 
助力數據檢索精準直達
 
規范數據存儲及應用更加合法和有序
 
最佳實踐
大規模艦船分類檢索
海關智能圖像識別