首頁  ?  科學  ?  科學探索

無需調控而勝任不同任務 這種AI更接近人類思考方式

2019-12-04 08:47:42

來源: 科技日報

  紐約大學心理學與認知科學教授馬庫斯最近和人工智能企業“深層思維”(DeepMind)杠上了。繼前不久在推特(Twitter)上質疑美國通用人工智能研究組織OpenAI的解魔方機械手之后,近日他又對“深層思維”新推出的《星際爭霸2》智能體“阿爾法星”(AlphaStar)進化版提出六大質疑。此次,他的質疑點并不是游戲表現本身,而是指向了更高的層面:未來通用智能研究的意義。

  近年最酷成果都來自深度強化學習

  此次OpenAI推出的解魔方機器手,并不是像以往一樣使用專業算法來解決某一個特定任務(如果換一個任務,還需要重新編程),而是通過某種學習方法,對機器人進行訓練,讓機械手具備類人手的解決問題的能力。但馬庫斯卻認為這個成果描述有誤導,更恰當的描述應該是“用強化學習操縱魔方”或者是“用靈巧的機器人手操縱物體的進展”。

  “馬庫斯過于強調‘用強化學習操縱魔方’有點挑剔字眼,其實OpenAI魔方機器手和‘深層思維’發布的《星際爭霸2》智能體‘阿爾法星’進化版都使用了深度強化學習技術。深度強化學習是目前公認的在現有技術中最有可能實現通用人工智能的技術。”天津大學智能與計算學部軟件學院副教授郝建業解釋說,目前機器學習有三大分支,監督學習、非監督學習和強化學習,深度學習屬于監督學習里目前最主流的一類技術。深度強化學習是深度學習與強化學習的融合,是將深度神經網絡整合到強化學習框架當中。

  “近幾年,深度強化學習發展迅猛,它在處理復雜、多方面和決策問題方面顯示出巨大的潛力。目前深度強化學習技術主要應用在一些游戲、比賽中。”郝建業介紹,2016年,谷歌的“阿爾法圍棋”(AlphaGo)擊敗了世界頂級圍棋選手李世石、柯潔,轟動一時,成為人工智能領域的一個里程碑。“阿爾法圍棋”的核心就在于使用了深度強化學習算法,使得計算機能夠通過自對弈的方式不斷提升棋力。此后又有臉書(Facebook)在DOTA2游戲中打敗了頂級職業選手;CMU團隊研發的德州撲克AI冷撲大師輕松擊敗頂級玩家。

  此外,“深層思維”還運用深度強化學習優化了數據中心的耗能;谷歌則利用深度強化學習完成深度神經網絡的自動架構搜索,提出了AutoML服務,借此將機器學習作為一種服務推廣到千家萬戶。在我國,對于深度強化學習技術的應用也不少,阿里、騰訊、百度等國內團隊將深度強化學習應用到搜索、推薦、營銷、派單和路徑規劃等實際問題的決策中。

  最有可能實現通用人工智能的技術

  人工智能發展到現在的高度,技術上較大的功臣應該屬于深度學習算法。深度學習利用多層神經網絡,從海量的數據中學習,從而實現對未來的預測,并使人工智能系統越來越智能。目前我們應用的安防監控、自動駕駛、語音識別、百度地圖等都是深度學習技術在圖像視覺、語音識別、自然語言理解等領域的應用。

  而強化學習也是目前機器學習領域的熱門技術,與基于已知標簽訓練模型的監督學習不同,強化學習能夠在沒有計算機的明確指示下,像人一樣實現自主學習。當達到一定的學習量之后,強化學習系統就能夠預測出正確的結果。“強化學習的基本思想是,學習在不同環境和不同狀態下,哪種行為能夠使得預期利益最大化。”郝建業介紹,新版“阿爾法星”智能體就采用了強化學習的自對戰技術,其學習過程不需要數據標注,而是由獎勵函數進行主導。智能體獲得獎勵得分或贏得一場比賽,它會得到積極的反饋,智能體就會根據對戰的成績好壞,來調整行為動作。這猶如嬰兒學走路,會根據產生的結果好壞來調整行為動作。

  目前對通用人工智能的定義主要有兩個特點,一是端對端的學習,二是任務自適應,?無需人類參與調控而勝任不同的任務。深度強化學習可以將深度學習的感知能力和強化學習的決策能力相結合,直接根據輸入的信息進行控制,是一種更接近人類思維方式的人工智能技術。在與世界的正常互動過程中,強化學習會通過試錯法利用獎勵來學習,這跟自然學習過程非常相似。比如單手解魔方機器手,它可能需要利用深度學習的識圖技術等看到魔方,而后還需強化學習的模型讓機器手在不斷的試錯過程中自主學習。在強化學習中,可以使用較少的訓練信息,這樣做的優勢是信息更充足,而且不受監督者技能限制。深度強化學習朝構建對世界擁有更高級理解的自主系統又邁出了一步,這也是為什么說深度強化學習是目前公認的在現有技術中最有可能實現通用人工智能的技術。

  未來通用人工智能還需依托腦科學發展

  “雖然說深度強化學習技術最有可能實現通用人工智能,但是并不能說就一定能夠實現,我們離真正的通用人工智能還是有很大差距的。”郝建業表示,深度學習和強化學習結合的時候,對現實情況的枚舉就變成首先需要對現實情況進行模式識別,然后進行有限模式的枚舉,從而減少計算的壓力,但是所需的數據將比其他機器學習算法要大得多。如果將場景擴展到多智能體的深度強化學習,那么需要的數據和算力是呈指數級上升的,目前還沒有平臺能夠提供強化學習所需要的海量數據,無法窮舉現實中可能遇到的種種復雜情況。這種數據需求在很多現實領域中都是無法實現的。

  舉例說明,比如強化學習需要大量的試錯,如果把單手解魔方機器手應用到做飯的現實場景,那么它可能會把食材弄一地,也可能把一整袋鹽倒到鍋中,還有可能引起火災。因此通過試錯學習的模式,在現實場景中是無法實現的。

  此外,深度學習和強化學習都是機器學習領域中最難調試成功的,它的成功案例其實不算很多,但是一旦推出,都會引起轟動。并且,這是一個連隨機種子都會大大影響學習效果的模型框架。同樣的模型,訓練10次可能7次是失敗的,3次是成功的。還有一點,深度強化學習極其容易過擬合到智能體當前交互的環境中,所以環境稍有改變,之前看起來表現出色的智能體,很可能就會犯低級錯誤。

  “人類認識事物的時候,一般都是通過數據進行因果推理和判斷,才得出相應的解決方案。而目前的人工智能系統卻并不能實現這種因果推導。”郝建業表示,可能未來通用人工智能的發展,還需要依托于腦科學的發展,目前我們對人腦的認知還處于非常初級的階段。大腦對事物的認知過程、解決問題的過程以及思考的能力等機制還都不清楚,因此,目前人工智能的發展,離這種真正能模擬人類智能思考的通用人工智能還有很長的路要走。

  • 相關閱讀
  • 當心!揮手照片可能泄露指紋信息

      你流傳到網上的照片、視頻,若被拿來做人臉識別,極有可能被解鎖;揮手的照片,也有可能泄露指紋信息……在12月6日—8日召開的第15屆信息安全與密碼學國際會議上,有專家接受記者采訪時表示,面部身份驗證、...

    時間:12-09
  • “飛線充電”隱患大

      如今很多農村家庭都購置了電動車,但電動車的充電問題也隨之凸顯。電動車大多體量大、質量重,有的帶著車篷進不了屋,加之家里原先布設的線路也沒考慮到要給電動車充電,所以沒有安裝專門的線路和插座。于是...

    時間:12-09
  • 山里娃上網學編程

      王麗是云南省滄源佤族自治縣勐董鎮芒回完全小學的四年級學生,前不久,她報名參加了學校新組建的編程興趣小組。從來沒接觸過編程的她又好奇又興奮,端坐在電腦前,一直盯著屏幕,努力用編程工具設計著一個卡...

    時間:12-09
  • 上海軟件業營收將破萬億元

      據悉,前三季度,上海軟件和信息服務業營業收入7267.78億元,增長11.2%;其中,軟件產業收入4110.61億元,增長11.2%;互聯網信息服務業營業收入2360.94億元,增長16.5%。預計今年上海軟件和信息服務業有望晉...

    時間:12-09
  • 青蒿素制劑再獲突破

      近日,上海復星醫藥(集團)股份有限公司研制的雙氫青蒿素磷酸哌喹分散片、雙氫青蒿素磷酸哌喹片通過世界衛生組織藥品預認證(WHO-PQ)。其中,雙氫青蒿素磷酸哌喹分散片為首個適用于兒童的雙氫青蒿素磷酸哌...

    時間:12-09
  • 遙望太陽 珍愛地球

      經歷了漫長時光后,太陽逐漸接近生命的盡頭。它的光芒開始增強,體積開始膨脹,表面逐漸接近原本距離太陽表面1.5億公里的地球軌道,并將它吞沒。這一幕并非杞人憂天,而是根據我們已知物理規律所得到的嚴謹科...

    時間:12-09
  • 我國激光測距技術實現重大突破

      8日,記者從華中科技大學和中山大學聯合舉辦的第六屆天琴空間科學任務研討會上獲悉,自今年6月以來,“天琴計劃”科研團隊已經多次成功實現了地月距離的激光測量,并在國內首次得到月球上全部5個激光反射鏡的...

    時間:12-09
  • 無需眼鏡就能看 能聽還能“摸”的3D影像來了

      由好萊塢影星凱特·溫斯萊特和威廉·達福擔任配音的裸眼3D視效動畫片《尼斯大冒險》將于年底上映,預計成為迎接2020年的跨年親子動畫首選。   《尼斯大冒險》采用“實景拍攝+三維特效”的方式制作,雖然是...

    時間:12-09
  • 我國首套柔性OLED機器人成功應用

      隨著智能手機、曲面電視等智能電子設備趨向更加輕薄的OLED顯示屏,全球的顯示器生產廠家紛紛加大研發力度,加緊布局“下一代屏幕技術”的產業化進程。日前,由新松機器人自主研發的我國首套柔性OLED機器人在...

    時間:12-09
  • 工信部:警惕利用“攜號轉網”詐騙

      全國“攜號轉網”日前正式啟動了,這為用戶持有原手機號碼自由選擇運營商提供了便利,受到廣大消費者的普遍好評。不過,也有不法分子利用“攜號轉網”剛剛啟動、有人還不太清楚規則的空子,“鉆研”新的電信...

    時間:12-06
免責聲明:本網對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網站轉載圖片、文字之類版權申明,本網站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網站將在第一時間及時刪除。
主站蜘蛛池模板: 国产真实乱子伦精品视频| 色偷偷人人澡人人爽人人模| 女老丝袜脚摩擦阳茎视频| 久久婷婷五月综合97色一本一本| 美美女高清毛片视频免费观看| 在线播放黄色片| 一级黄色在线播放| 日韩AV无码久久精品免费| 免费一级特黄欧美大片勹久久网| 超碰aⅴ人人做人人爽欧美| 国产精品亚洲аv无码播放| 中文天堂最新版www官网在线| 暖暖免费观看日本版| 亚洲国产视频一区| 老司机亚洲精品影视www| 国产嫩草影院在线观看| chinesevideo普通话对白| 最新69国产成人精品视频69| 亚洲欧美日韩国产vr在线观| 色综合天天综合网国产成人网| 国产欧美日韩亚洲一区二区三区| 91精品欧美产品免费观看| 女人18毛片一级毛片在线| 东京热无码一区二区三区av| 无遮挡一级毛片视频| 亚洲狠狠婷婷综合久久蜜芽| 粗大白浊受孕h鞠婧祎小说| 四虎在线永久精品高清| 视频在线免费观看资源| 国产女人水真多18毛片18精品 | 欧美午夜小视频| 亚洲欧美综合在线天堂| 爽爽影院在线看| 免费国产成人手机在线观看| 精品综合久久久久久888蜜芽| 国产一级理仑片日本| 3d动漫精品一区二区三区| 在线看片你懂的| ass日本大乳pics| 女人18水真多毛片免费观看| 一级毛片免费播放男男|