英國《自然》雜志24日發表一項人工智能研究成果:美國團隊報告了一類增強學習,可回溯過去、解決復雜任務,真正改善了對復雜環境的探索方式,有望應用于機器人、語言理解和藥物設計領域。這類算法被統稱為“Go-Explore”,其已經在一款經典游戲的算法挑戰中得分超過了人類玩家和先進的人工智能系統。該成果被認為正朝著實現真正“智能學習體”邁出了重要一步。
增強學習,可讓人工智能系統通過探索和理解復雜環境來進行決策,并學習如何以最優的方式獲得獎勵。獎勵可以包括機器人抵達特定位置或是在電腦游戲中達到一定的等級。然而,當遇到很少給予反饋的復雜環境時,現階段的加強學習算法就很容易碰壁,這讓人工智能專家們非??鄲?。
美國“OpenAI”是由諸多硅谷巨頭聯合建立的人工智能非營利組織,推動者包括美國創業孵化器Y Combinator總裁薩姆·阿爾特曼、美國太空技術探索公司(SpaceX)創始人埃隆·馬斯克等,其目標是希望能夠預防人工智能的災難性影響,并推動人工智能發揮積極作用。此次,“OpenAI”的科學家艾德蘭·艾克菲特、朱斯特·赫伊津哈及團隊,提出了有效探索面臨的兩個主要障礙,并設計了一類算法來解決這些障礙。
研究人員表示,“Go-Explore”可以對環境進行全面探索,同時構建一個檔案庫來記住它去過的地方,確保自己不會忘記通往有望成功的期中階段或是最終勝利(獎勵)的路線。其在雅達利經典游戲中的得分,超過了人類玩家和先進的人工智能系統,研究人員用這類算法,解決了之前未能解決的2600個雅達利游戲,驗證了這類算法的潛力。“Go-Explore”在算法挑戰《蒙特祖馬的復仇》中的得分是之前的4倍,在另一個算法挑戰《瑪雅人的冒險》中的得分也超過了人類玩家的平均水平。而相對的,此前的算法一分都拿不到。
“Go-Explore”算法還能完成一個模擬機器人任務,在這項任務中,它必須用機械臂把東西撿起來并放到4個架子中的一個架子上,其中兩個架子被關在兩扇門的后面。
研究人員指出,記住并回到有望成功的探索區域的簡單原則是一種強大、通用的探索方法。他們認為最新的算法有望應用于機器人、語言理解和藥物設計。(記者張夢然)
網站首頁 |網站簡介 | 關于我們 | 廣告業務 | 投稿信箱
Copyright © 2000-2020 www.fnsyft.com All Rights Reserved.
中國網絡消費網 版權所有 未經書面授權 不得復制或建立鏡像
聯系郵箱:920 891 263@qq.com
亚洲国产另类久久久精品| 亚洲欧美黑人猛交群| 大桥未久亚洲无av码在线| 亚洲国产精品网站久久| 日韩va亚洲va欧洲va国产| 亚洲精品字幕在线观看| 国产成人麻豆亚洲综合无码精品| 亚洲国产精品一区二区九九| 亚洲AV无码成H人在线观看| 国产精品国产亚洲区艳妇糸列短篇 | 亚洲jjzzjjzz在线观看| 亚洲中字慕日产2020| 久久国产亚洲精品| 亚洲欧美日韩中文无线码| 亚洲第一街区偷拍街拍| 日本亚洲高清乱码中文在线观看| 午夜亚洲乱码伦小说区69堂| 亚洲成在人线在线播放无码| 黑人粗长大战亚洲女2021国产精品成人免费视频 | 亚洲JLZZJLZZ少妇| 爱爱帝国亚洲一区二区三区| 日韩成人精品日本亚洲| 亚洲精品无码专区久久同性男| 亚洲中文字幕伊人久久无码| 亚洲色精品vr一区二区三区| 亚洲av无码片在线播放| 中文字幕亚洲综合久久| 亚洲丝袜中文字幕| 亚洲丁香婷婷综合久久| 亚洲国产一级在线观看 | 色老板亚洲视频免在线观| 亚洲熟妇丰满xxxxx| 国产精品亚洲专区一区| 国产成人亚洲精品91专区手机| 亚洲精品无码久久久久sm| 亚洲精品私拍国产福利在线| 亚洲国产成人久久三区| 亚洲人成网站999久久久综合| 亚洲AV无码一区二区三区国产| 最新国产AV无码专区亚洲| 亚洲国产老鸭窝一区二区三区 |