openai利用人工智能教機(jī)器人操縱物體為靈活性設(shè)定新基準(zhǔn)

2018-07-31 22:28:14　來源: 　訪問：880 次

這個世界上沒有任何東西能夠非常接近人手的敏捷性和靈活性，無論是動物還是機(jī)器人。對于埃隆·馬斯克創(chuàng)立的非營利組織openai的工程師來說，這既是挑戰(zhàn)也是機(jī)遇。它們的研究人員如何使用人工智能來教導(dǎo)機(jī)器人像人一樣巧妙地操縱物體?

通常，在教授ai來控制物理機(jī)器人時，科學(xué)家們往往會遇到同樣的問題。培訓(xùn)通常使用強(qiáng)化學(xué)習(xí)來完成;ai通過反復(fù)試錯的學(xué)習(xí)方法。但這需要很多時間，幾乎相當(dāng)于多年的經(jīng)驗(yàn)。如果你想讓ai打贏一場電子游戲，很簡單，你只需要讓它以更快的速度玩游戲。但如果你想教它一個真實(shí)的任務(wù)，那就麻煩了。你無法等待機(jī)器人手臂經(jīng)歷多年的練習(xí)，并且很難足夠準(zhǔn)確地出于訓(xùn)練目的模擬世界。

對于openai，它們自己設(shè)定的任務(wù)是教一個機(jī)器人用手來操縱一個六面立方體;將這個立方體從一個位置移動到另一個位置，使特定的一面朝上。與早期的研究一樣，首先盡可能準(zhǔn)確地模擬這種環(huán)境，但下一步卻產(chǎn)生差異：開始弄亂模擬。

圖片來源：openai

首先，添加了隨機(jī)視覺噪音;然后，改變了虛擬手和立方體的顏色。它們隨機(jī)化了立方體的大小;表面有多滑;有多重。它們甚至弄亂了模擬的重力。所有這一切的效果是讓ai更好地理解在現(xiàn)實(shí)世界中操縱立方體的可能性。雖然模擬可能不是完全真實(shí)的，但它有足夠多的變化，允許系統(tǒng)學(xué)習(xí)處理意外。

參與該項(xiàng)目的openai的matthias plappert解釋說，改變模擬的重力是一個特別有趣的變量。該團(tuán)隊(duì)知道，當(dāng)ai系統(tǒng)(稱為dactyl)正在控制真正的機(jī)器人手時，手的基部每次可能不會以相同的角度定位。較低的角度意味著立方體會更容易從手中掉落。為了教dactyl如何處理這種變體，他們決定將模擬中的重力隨機(jī)化。 “沒有這種隨機(jī)化，它就會一直弄丟物體，因?yàn)椴涣?xí)慣。”plappert說。

通過所有這些隨機(jī)化需要很長時間。很長一段時間。事實(shí)上，dactyl必須積累大約100年的經(jīng)驗(yàn)才能達(dá)到最佳表現(xiàn)。反過來，這意味著團(tuán)隊(duì)必須使用大量的計(jì)算能力 —— 大約6,144個cpu和8個非常強(qiáng)大的英偉達(dá) v100 gpu。這種硬件只有極少數(shù)研究機(jī)構(gòu)才能使用。

但plappert說，最終的結(jié)果是值得的。完成訓(xùn)練后，dactyl能夠?qū)⒘⒎襟w從一個位置移動到另一個位置，連續(xù)50次，而不會掉落。 (雖然它這樣做的中位數(shù)要小得多;只有13次。)在學(xué)習(xí)移動立方體的過程中，dactyl甚至開發(fā)了類似人類的行為。所有這些都是在沒有任何人為指導(dǎo)的情況下學(xué)到的 —— 只是反復(fù)試錯，幾十年一次。

“這表明我們?nèi)祟悶椴倏v所做的事情是非常優(yōu)化的。”plappert說。 “當(dāng)你看到一個試圖解決問題的機(jī)器人時，這是一個非常有趣的時刻，你會想‘噢，嘿，我也會這樣做。’”

圖片來源：openai

機(jī)器人技術(shù)和人工智能領(lǐng)域的專家對the verge高度贊揚(yáng)了openai的工作，但警告說它并不代表機(jī)器人操縱有了突破。卡內(nèi)基梅隆大學(xué)機(jī)器人研究所的smruti amarjyoti指出，隨機(jī)化系統(tǒng)訓(xùn)練環(huán)境的想法之前已經(jīng)完成，但是說dactyl的動作是“優(yōu)雅的”，他認(rèn)為對ai來說是不可能的。

“最終的結(jié)果非常復(fù)雜和精細(xì)。”amarjyoti說，“[但]我認(rèn)為openai在這一領(lǐng)域的最大成就將是，它所采用的工程協(xié)調(diào)以及用于實(shí)現(xiàn)這一壯舉的計(jì)算能力。”

istituto italiano di tecnologia的機(jī)器人學(xué)教授安東尼奧·比奇(antonio bicchi)表示，這項(xiàng)研究“優(yōu)雅且令人著迷”，但指出了一些局限性。 “結(jié)果仍然局限于在相當(dāng)有利的條件下(手正面朝上，所以骰子落在掌中)進(jìn)行的一個特定任務(wù)(滾動一個大小合適的模具)，對于這些技術(shù)能解決現(xiàn)實(shí)世界的機(jī)器人問題，甚至不是一個確鑿的論據(jù)。”比奇說。

對于openai來說，這項(xiàng)研究大體上是令人滿意的。該系統(tǒng)使用了許多與實(shí)驗(yàn)室開發(fā)的相同算法和技術(shù)，來教授其電子游戲機(jī)器人openai five。該公司建議，這表明它正在構(gòu)建通用算法，可以用來處理各種各樣的任務(wù)，對于雄心勃勃的ai實(shí)驗(yàn)室和公司來說，這是一個里程碑。

在人工智能的幫助下創(chuàng)建更靈巧的機(jī)器人，對于嘗試自動化手工勞動的公司來說，將是一個巨大的福音，并且有許多初創(chuàng)公司積極地在該領(lǐng)域進(jìn)行研究。但是，提高機(jī)器人技術(shù)的先進(jìn)水平肯定會讓更多的工作崗位自動化，而這種工作破壞浪潮是否可以被新技術(shù)創(chuàng)造的工作所抵消，這是一個懸而未決的問題。

不管怎樣，很明顯，人工智能還有一段路要走，才能與人類的運(yùn)動技能相匹配。但毫無疑問，機(jī)器正在迎頭趕上，比以往任何時候都要快。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“機(jī)電號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.

/企業(yè)主營產(chǎn)品/

/閱讀下一篇/

以色列開發(fā)出，可任意變換型態(tài)選擇移動模式

相關(guān)推薦

熱點(diǎn)推薦

六軸工業(yè)機(jī)器人控制解決方案：基于ARMxy BL350系列的邊緣智能控制平臺

深圳市鋇錸技術(shù)有限公司 2025/12/8 9:46:51
661 瀏覽 661
BOB、ANYBODY等生物力學(xué)分析軟件在先進(jìn)干預(yù)與康復(fù)策略制定方面表現(xiàn)卓越！

北京喬澤科技有限公司 2025/8/26 18:17:48
3515 瀏覽 3515
兩位資深專業(yè)整改工程師技術(shù)指導(dǎo)，現(xiàn)場提供整改意見，專業(yè)整改團(tuán)隊(duì)

深圳市正華檢測有限公司 2025/8/25 16:54:39
1018 瀏覽 1018
?？低暼四樧R別門禁：多元場景下的智能安防

鄭州奧普訊電子科技有限公司 2025/2/28 17:40:56
3991 瀏覽 3991
中軟高科誠邀您共赴北京國際社會公共安全產(chǎn)品博覽會，共探多維身份識別新技

鄭州中軟高科信息技術(shù)有限公司 2024/10/14 15:39:13
8772 瀏覽 8772
香港電子展2025年香港春季電子展

廣州明勝展覽服務(wù)有限公司 2024/5/28 22:04:15
8910 瀏覽 8910

161564文章數(shù) 880關(guān)注度

往期回顧全部

東風(fēng)新能源汽車年銷量跨越100萬輛
2025/12/29 11:00:30
2025 年高分子防水卷材市場趨勢全解析
2025/12/29 9:25:46
非標(biāo)伺服減速箱ZT065-FL-002-S1起降用
2025/12/29 9:21:53
強(qiáng)化戰(zhàn)略協(xié)同共享優(yōu)勢資源中國一汽與零跑汽車持續(xù)深化合作
2025/12/29 9:00:36
mpp電力管可以作為排水排污管使用嗎
2025/12/28 15:43:24

openai利用人工智能教機(jī)器人操縱物體 為靈活性設(shè)定新基準(zhǔn)

openai利用人工智能教機(jī)器人操縱物體為靈活性設(shè)定新基準(zhǔn)