眾所周知,數(shù)據(jù)對于人工智能產業(yè)的重要性就如同石油之于工業(yè)一樣。傳統(tǒng)的人工智能數(shù)據(jù)生產過程是人工采集標注大量的數(shù)據(jù)給機器去學習,這樣的處理數(shù)據(jù)方式是高成本的,低效率的,并且無法大規(guī)模生產的。
數(shù)據(jù)堂自主研發(fā)的“human-in-the-loop人在回路”的技術應用到人工智能數(shù)據(jù)生產中后,可以將人工的采集標注與智能工具標注相互迭代,融為一體,從而顯著提高數(shù)據(jù)生產效率,降低生產實施成本,擴大產能。(完整視頻請搜索:數(shù)據(jù)堂“human-in-the-loop”智能數(shù)據(jù)工廠)
簡單來說,human in the loop數(shù)據(jù)處理過程是:人處理的數(shù)據(jù),教給機器學習,機器將學習的結果反饋給人工進行校對,持續(xù)提升準確率。當最后有大量的原始數(shù)據(jù)給機器的時候,機器便可以很快的處理,直接提供出結果數(shù)據(jù)。
車輛檢測
半監(jiān)督深度學習的圖像分割數(shù)據(jù)標注技術,可以有效提高無人駕駛標注數(shù)據(jù)集的生產效率,實現(xiàn)精確的目標檢測和像素級分割,并半自動地完成上百個屬性的標注。這樣無人駕駛數(shù)據(jù)的生產方式,才能滿足國內外日益增長的智能無人車市場需求。

文字識別
也稱為ocr,數(shù)據(jù)堂基于半監(jiān)督深度學習的文字識別技術,通過注入海量標注數(shù)據(jù)做預訓練,并伴隨人工的監(jiān)督性學習,可以明顯提高ocr標注數(shù)據(jù)集的質量,提升ocr標注數(shù)據(jù)產品生產效率。

語音識別
自語音識別技術進入深度學習時代,語音識別準確率突飛猛進。數(shù)據(jù)堂半監(jiān)督深度學習的語音識別數(shù)據(jù)標注技術,利用kaldi識別引擎對語音數(shù)據(jù)做預識別和自然語言輔助糾錯,再加上人工的監(jiān)督性校對,可以顯著提高語音識別標注數(shù)據(jù)集質量。

人臉檢測
人臉檢測常用的數(shù)據(jù)集,包括fddb、aflw、wider face等。應用人機交互式的標注技術,將人臉預識別結果通過人機交互式修正,如此往復,可以有效提高數(shù)據(jù)處理速度,人臉關鍵點標注數(shù)據(jù),從68點快速過渡到95點、106點、202點等,有效降低人工成本。

視頻追蹤
視頻追蹤是也是當下人工智能技術研究的重點方向,數(shù)據(jù)堂視頻目標跟蹤數(shù)據(jù)標注技術,通過人機交互、過程糾偏、自學習反饋機制,實現(xiàn)近乎逐幀的目標對象框選、主體id對齊、顯現(xiàn)片段等,有效解放人工操作,進而降低生產成本、提高數(shù)據(jù)質量。

數(shù)據(jù)堂跟蹤統(tǒng)計結果表明,“human in the loop”技術的應用,使數(shù)據(jù)處理的效率平均提升25%以上,數(shù)據(jù)堂堅信智能數(shù)據(jù)處理工具的普及將帶來的不僅僅是ai數(shù)據(jù)產業(yè)的提升更是整個ai產業(yè)革命性的創(chuàng)新。
數(shù)據(jù)堂的ai開放實驗室目前已聚集數(shù)位人工智能數(shù)據(jù)科學家。專注于多模態(tài)數(shù)據(jù)采集、大數(shù)據(jù)處理、人工智能數(shù)據(jù)標注加工等方面的研究。我們歡迎更多的伙伴加入我們,數(shù)據(jù)堂有海量的數(shù)據(jù)和訓練集群,我們希望有更多的算法和調優(yōu)技巧的融入,讓我們共建智能數(shù)據(jù)工廠,助力ai產業(yè)創(chuàng)新。
關于數(shù)據(jù)堂
數(shù)據(jù)堂(北京)科技股份有限公司,成立于2011年(股票代碼:831428),專業(yè)的人工智能數(shù)據(jù)服務提供商,致力于為全球人工智能企業(yè)提供數(shù)據(jù)獲取、處理及數(shù)據(jù)產品服務。數(shù)據(jù)堂總部位于北京,擁有8家全資和控股子公司,并在硅谷設立美國子公司,目前在南京、保定、合肥、貴陽等地設有多個專業(yè)數(shù)據(jù)處理中心。數(shù)據(jù)堂數(shù)據(jù)采集范圍遍及全球30多個國家,合作伙伴遍布世界10多個國家。公司創(chuàng)始人及合伙人來自stanford university、nec、中國移動等知名高校和高科技公司。數(shù)據(jù)堂已成功為國內外眾多企業(yè)提供人工智能數(shù)據(jù)產品與服務,包括百度,騰訊,阿里巴巴、奇虎360、聯(lián)想、科大訊飛等國內頂級互聯(lián)網(wǎng)和高科技企業(yè),microsoft、nec、canon、intel、samsung、nuance、fujitsu等企業(yè)及在華研發(fā)機構。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“機電號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.
