前沿拓展:
深度搜
深度搜是專業(yè)的搜索知識的搜索引擎。搜索到的內(nèi)容沒有雜亂無章的**,報道,博客,和門戶網(wǎng)頁等內(nèi)容。
5 月 28 日,機器之心全球機器智能峰會(GMIS 2017)進入第二天,全天議程中最受關注的是多位重要嘉賓出席的領袖峰會,包括《人工智能:一種現(xiàn)代方法》的作者 Stuart Russell、第四范式聯(lián)合創(chuàng)始人兼首席科學家楊強、科大訊飛執(zhí)行總裁兼消費者事業(yè)群總裁胡郁、阿爾伯塔大學教授及計算機圍棋頂級專家 Martin Müller、Element AI 聯(lián)合創(chuàng)始人 Jean-Sebastien Cournoyer 等。
下午,大會迎來又一位引人關注的學者。阿爾伯塔大學計算機科學教授,計算機圍棋專家 Martin Müller 發(fā)表了主題為《深度學習時代的啟發(fā)式搜索》的演講。昨天,AlphaGo 與柯潔的系列比賽剛剛結束,而此前大會其他嘉賓在演講中也紛紛提到了這場比賽。Martin 作為 AlphaGo 開發(fā)者們的導師,對計算機圍棋及其背后的技術進行了深度解讀。
作為計算機圍棋研究的先驅,Martin Müller 教授所帶領的團隊在博弈樹搜索和規(guī)劃的蒙特卡洛方法、大規(guī)模并行搜索和組合博弈論方面頗有建樹。在此前 AlphaGo 與柯潔烏鎮(zhèn)人機交鋒的比賽期間,機器之心曾與他共同觀戰(zhàn)。圍棋程序 AlphaGo 的設計研發(fā)的 David Silver 和黃士杰(Aja Huang)(分別是 DeepMind AlphaGo 發(fā)表在 Nature 上的論文的兩位并列第一作者)都曾師從于他。
「啟發(fā)式搜索不是搜索引擎式的搜索,」Martin 說道?!冈谡鎸嵡闆r下,由于可能性過多,很多時候你是不能搜索全部信息的。在圍棋中,這種情況尤為突出。」
多年來,人工智能研究者們一直以攻克各類游戲為目標,因為這些任務規(guī)則簡單,可以為真實世界的應用鋪平道路。人工智能研究者們不僅在國際象棋上,也在跳棋、雙陸棋等棋盤游戲中有過很多研究。在圍棋之前,人工智能領域的一個里程碑**是 IBM 的「深藍」擊敗世界國際象棋冠軍卡斯帕羅夫(剛剛過去 20 周年)。在 20 年前,IBM 的系統(tǒng)已經(jīng)使用了深度搜索與并行計算,大大提升了效率。
在棋類游戲中,最引人注目的自然是被認為最具復雜性的圍棋了。深度學習是近幾年來科技界火熱的話題,但它并不是人工智能的全部?!溉绻阒魂P注深度學習,那你就會錯過很多東西,」Martin 說道。
AlphaGo 的學習過程是線下的。它通常是先發(fā)展出若干神經(jīng)網(wǎng)絡以待比賽中使用。蒙特卡洛樹搜索(MCTS)是其主要的決策算法,用于決定一局比賽中每一步棋。MCTS 結合了博弈樹搜索、機器學習到的知識和模擬的全局游戲來決定每一步。這些知識中最重要的部分是上面提到的深度神經(jīng)網(wǎng)絡。其中有一個網(wǎng)絡(策略網(wǎng)絡)選擇搜索中最有希望的落子位置,另一個網(wǎng)絡(價值網(wǎng)絡)可以評估其在搜索中遇到的數(shù)千乃至數(shù)百萬個棋盤局面。
在獲取棋局信息后,AlphaGo 的策略網(wǎng)絡會探索哪些位置具備潛在價值,在分配的搜索時間結束時,模擬過程中被系統(tǒng)最繁瑣考察的位置將成為 AlphaGo 的最終選擇。在經(jīng)過先期的全盤探索和過程中對最佳落子的不斷揣摩后,高效的算法與強大的計算能力實現(xiàn)了超越人類的直覺判斷。
除了備受關注的圍棋以外,阿爾伯塔大學在計算機德州撲克等方面的研究也處于領先地位。在今年 1 月,阿爾伯塔大學、捷克布拉格查理大學和捷克理工大學共同發(fā)布了論文《DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker》,展示了他們在人工智能打德州撲克方面的研究。在論文中,研究人員表示 DeepStack 已經(jīng)在無限制撲克(No-Limit Poker)游戲上達到了專家級的水平。
大多數(shù)棋盤游戲都屬于完美信息(perfect information)游戲,針對它們的研究難以應用到真實世界中;而撲克是一個典型的不完美信息(imperfect information)游戲,一直以來都是人工智能領域內(nèi)的一個挑戰(zhàn)。DeepStack 是適用于德州撲克這種不完美信息環(huán)境的新算法。
DeepStack 結合了回歸推理來處理信息不對稱性,還結合了分解(decomposition)來將計算集中到相關的決策上,以及一種形式的關于任意牌的直覺——該直覺可以使用深度學習進行自我玩牌而自動學習到。在一項涉及到數(shù)十位參與者和 44000 手撲克的研究中,DeepStack 成為了世界上第一個在一對一無限制德州撲克(heads-up no-limit Texas hold’em)上擊敗了職業(yè)撲克玩家的計算機程序。
撲克游戲的狀態(tài)可以被分成玩家的私有信息(兩張牌面朝下的手牌)和公共狀態(tài)(包括牌面朝上的牌和玩家采取的**動作序列)。游戲中的公開狀態(tài)的可能序列構成一個公開樹(public tree),其中每一個公開狀態(tài)都有一個相關的公開子樹(public subtree)。
HUNL 中公開樹的一部分。紅色和天藍色的邊表示玩家動作。綠色邊表示公開的公共牌。帶有**的葉節(jié)點表示游戲結束,其中,如果一個玩家根據(jù)之前的動作和玩家手牌的聯(lián)合分布而棄牌或做出決定,那么收益就可能是固定的。
DeepStack 架構概覽(見 a)。對于每一個公開狀態(tài),DeepStack 都要重新計算它需要的動作,這會用到一個深度有限的向前預測——其中子樹值(subtree value)會通過一個訓練好的深度神經(jīng)網(wǎng)絡 Neural net(見 b)來計算,該深度神經(jīng)網(wǎng)絡 Neural net 是比賽前通過隨機生成的撲克情境(見 c)來訓練的。Martin 表示,它的成功之處在于第一次將啟發(fā)式搜索應用于不完美信息游戲中,并獲得成功。
啟發(fā)式方法雖然已經(jīng)在多種應用中獲得成功,但仍然面臨一些挑戰(zhàn)。「在自動駕駛、醫(yī)療等性命攸關的應用上,人類不能允許深度學習和啟發(fā)式搜索可能出現(xiàn)的小概率偏差,」Martin 說道?!高@意味著我們還有很長一段路要走。我們目前還面臨著兩個挑戰(zhàn),如何把啟發(fā)式搜索和精準的確切法聯(lián)結在一起;以及當不知道全局規(guī)則的時候,如何讓機器解決問題。」
啟發(fā)式學習經(jīng)歷過三四十年的發(fā)展,它是 AlphaGo 背后的動力,也可以在未來應用于其他領域。「通過與深度學習相結合,同時有了新算法與硬件,啟發(fā)式學習可以讓計算機系統(tǒng)學會真正的知識,」Martin 說道?!杆茏屛覀兊乃阉髯兊酶佑行В軌蜃層嬎銠C幫助我們做出越來越好的決策。」
拓展知識:
深度搜
第一將手機屏幕打開,輸入密碼解鎖;
2、第二用手指將手機屏幕劃到有文件管理的一頁;
3、打開文件管理,第二選擇分類瀏覽功能,這樣手機文件就可以進行分類瀏覽,文檔文件,壓縮包文件,安卓包文件,照片,視頻都可以分類瀏覽;
4、分類成功后,點擊視頻文件,在視頻文件即可查找到所要的視頻;
5、如果沒有找到,也可以點擊搜索,輸入視頻名字即可查找到所需視頻。
前沿拓展:
深度搜
深度搜是專業(yè)的搜索知識的搜索引擎。搜索到的內(nèi)容沒有雜亂無章的**,報道,博客,和門戶網(wǎng)頁等內(nèi)容。
5 月 28 日,機器之心全球機器智能峰會(GMIS 2017)進入第二天,全天議程中最受關注的是多位重要嘉賓出席的領袖峰會,包括《人工智能:一種現(xiàn)代方法》的作者 Stuart Russell、第四范式聯(lián)合創(chuàng)始人兼首席科學家楊強、科大訊飛執(zhí)行總裁兼消費者事業(yè)群總裁胡郁、阿爾伯塔大學教授及計算機圍棋頂級專家 Martin Müller、Element AI 聯(lián)合創(chuàng)始人 Jean-Sebastien Cournoyer 等。
下午,大會迎來又一位引人關注的學者。阿爾伯塔大學計算機科學教授,計算機圍棋專家 Martin Müller 發(fā)表了主題為《深度學習時代的啟發(fā)式搜索》的演講。昨天,AlphaGo 與柯潔的系列比賽剛剛結束,而此前大會其他嘉賓在演講中也紛紛提到了這場比賽。Martin 作為 AlphaGo 開發(fā)者們的導師,對計算機圍棋及其背后的技術進行了深度解讀。
作為計算機圍棋研究的先驅,Martin Müller 教授所帶領的團隊在博弈樹搜索和規(guī)劃的蒙特卡洛方法、大規(guī)模并行搜索和組合博弈論方面頗有建樹。在此前 AlphaGo 與柯潔烏鎮(zhèn)人機交鋒的比賽期間,機器之心曾與他共同觀戰(zhàn)。圍棋程序 AlphaGo 的設計研發(fā)的 David Silver 和黃士杰(Aja Huang)(分別是 DeepMind AlphaGo 發(fā)表在 Nature 上的論文的兩位并列第一作者)都曾師從于他。
「啟發(fā)式搜索不是搜索引擎式的搜索,」Martin 說道?!冈谡鎸嵡闆r下,由于可能性過多,很多時候你是不能搜索全部信息的。在圍棋中,這種情況尤為突出。」
多年來,人工智能研究者們一直以攻克各類游戲為目標,因為這些任務規(guī)則簡單,可以為真實世界的應用鋪平道路。人工智能研究者們不僅在國際象棋上,也在跳棋、雙陸棋等棋盤游戲中有過很多研究。在圍棋之前,人工智能領域的一個里程碑**是 IBM 的「深藍」擊敗世界國際象棋冠軍卡斯帕羅夫(剛剛過去 20 周年)。在 20 年前,IBM 的系統(tǒng)已經(jīng)使用了深度搜索與并行計算,大大提升了效率。
在棋類游戲中,最引人注目的自然是被認為最具復雜性的圍棋了。深度學習是近幾年來科技界火熱的話題,但它并不是人工智能的全部?!溉绻阒魂P注深度學習,那你就會錯過很多東西,」Martin 說道。
AlphaGo 的學習過程是線下的。它通常是先發(fā)展出若干神經(jīng)網(wǎng)絡以待比賽中使用。蒙特卡洛樹搜索(MCTS)是其主要的決策算法,用于決定一局比賽中每一步棋。MCTS 結合了博弈樹搜索、機器學習到的知識和模擬的全局游戲來決定每一步。這些知識中最重要的部分是上面提到的深度神經(jīng)網(wǎng)絡。其中有一個網(wǎng)絡(策略網(wǎng)絡)選擇搜索中最有希望的落子位置,另一個網(wǎng)絡(價值網(wǎng)絡)可以評估其在搜索中遇到的數(shù)千乃至數(shù)百萬個棋盤局面。
在獲取棋局信息后,AlphaGo 的策略網(wǎng)絡會探索哪些位置具備潛在價值,在分配的搜索時間結束時,模擬過程中被系統(tǒng)最繁瑣考察的位置將成為 AlphaGo 的最終選擇。在經(jīng)過先期的全盤探索和過程中對最佳落子的不斷揣摩后,高效的算法與強大的計算能力實現(xiàn)了超越人類的直覺判斷。
除了備受關注的圍棋以外,阿爾伯塔大學在計算機德州撲克等方面的研究也處于領先地位。在今年 1 月,阿爾伯塔大學、捷克布拉格查理大學和捷克理工大學共同發(fā)布了論文《DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker》,展示了他們在人工智能打德州撲克方面的研究。在論文中,研究人員表示 DeepStack 已經(jīng)在無限制撲克(No-Limit Poker)游戲上達到了專家級的水平。
大多數(shù)棋盤游戲都屬于完美信息(perfect information)游戲,針對它們的研究難以應用到真實世界中;而撲克是一個典型的不完美信息(imperfect information)游戲,一直以來都是人工智能領域內(nèi)的一個挑戰(zhàn)。DeepStack 是適用于德州撲克這種不完美信息環(huán)境的新算法。
DeepStack 結合了回歸推理來處理信息不對稱性,還結合了分解(decomposition)來將計算集中到相關的決策上,以及一種形式的關于任意牌的直覺——該直覺可以使用深度學習進行自我玩牌而自動學習到。在一項涉及到數(shù)十位參與者和 44000 手撲克的研究中,DeepStack 成為了世界上第一個在一對一無限制德州撲克(heads-up no-limit Texas hold’em)上擊敗了職業(yè)撲克玩家的計算機程序。
撲克游戲的狀態(tài)可以被分成玩家的私有信息(兩張牌面朝下的手牌)和公共狀態(tài)(包括牌面朝上的牌和玩家采取的**動作序列)。游戲中的公開狀態(tài)的可能序列構成一個公開樹(public tree),其中每一個公開狀態(tài)都有一個相關的公開子樹(public subtree)。
HUNL 中公開樹的一部分。紅色和天藍色的邊表示玩家動作。綠色邊表示公開的公共牌。帶有**的葉節(jié)點表示游戲結束,其中,如果一個玩家根據(jù)之前的動作和玩家手牌的聯(lián)合分布而棄牌或做出決定,那么收益就可能是固定的。
DeepStack 架構概覽(見 a)。對于每一個公開狀態(tài),DeepStack 都要重新計算它需要的動作,這會用到一個深度有限的向前預測——其中子樹值(subtree value)會通過一個訓練好的深度神經(jīng)網(wǎng)絡 Neural net(見 b)來計算,該深度神經(jīng)網(wǎng)絡 Neural net 是比賽前通過隨機生成的撲克情境(見 c)來訓練的。Martin 表示,它的成功之處在于第一次將啟發(fā)式搜索應用于不完美信息游戲中,并獲得成功。
啟發(fā)式方法雖然已經(jīng)在多種應用中獲得成功,但仍然面臨一些挑戰(zhàn)?!冈谧詣玉{駛、醫(yī)療等性命攸關的應用上,人類不能允許深度學習和啟發(fā)式搜索可能出現(xiàn)的小概率偏差,」Martin 說道?!高@意味著我們還有很長一段路要走。我們目前還面臨著兩個挑戰(zhàn),如何把啟發(fā)式搜索和精準的確切法聯(lián)結在一起;以及當不知道全局規(guī)則的時候,如何讓機器解決問題?!?/p>
啟發(fā)式學習經(jīng)歷過三四十年的發(fā)展,它是 AlphaGo 背后的動力,也可以在未來應用于其他領域。「通過與深度學習相結合,同時有了新算法與硬件,啟發(fā)式學習可以讓計算機系統(tǒng)學會真正的知識,」Martin 說道?!杆茏屛覀兊乃阉髯兊酶佑行В軌蜃層嬎銠C幫助我們做出越來越好的決策?!?/p>
拓展知識:
深度搜
第一將手機屏幕打開,輸入密碼解鎖;
2、第二用手指將手機屏幕劃到有文件管理的一頁;
3、打開文件管理,第二選擇分類瀏覽功能,這樣手機文件就可以進行分類瀏覽,文檔文件,壓縮包文件,安卓包文件,照片,視頻都可以分類瀏覽;
4、分類成功后,點擊視頻文件,在視頻文件即可查找到所要的視頻;
5、如果沒有找到,也可以點擊搜索,輸入視頻名字即可查找到所需視頻。
原創(chuàng)文章,作者:九賢生活小編,如若轉載,請注明出處:http:///36451.html