人工智慧研發這一塊,無論是今世還是前世,無論是硬體還是軟體條件,目前國內都是遠遠落後於國外的。
當下國內人工智慧水平,尤其是遊戲ai的智慧水平,還停留在“監督學習”階段。
所謂“監督學習”,即是指人類出題,告訴ai正確的答案,並賦予相應的對策的學習方式,類似於中小學填鴨式教育。
反映到遊戲應用場景裡,就是那種識別看到人類玩家後,人機會主動進行攻擊,最多再加一些設定,比如hp小於30%時,會自己找掩體躲避,當敵人躲在某處時間過長時,會扔一顆手雷過去。
但這些都是很死板的程式判斷,嚴格來說還不具備人工智慧的特點,並不是真正意義上的人工智慧。
&n用專門設計的計算機,就下贏了國際象棋冠軍。
當然了,那會兒所謂的計算機也不能稱之為ai,之所以能下贏國際象棋冠軍,採用的是暴力破解方法,也就是窮舉法,把所有可能的下法全部計算一遍,然後對比人類的棋譜,選擇最優解。
也就是所謂的“大力出奇跡”。
但是到了圍棋這裡,沒法再這樣窮舉了。
力量再大,終有極限,圍棋的可能性走法,遠超宇宙中全部原子之和,即使用目前最牛逼的超算,也要算幾萬年,在量子計算機成熟之前,電子計算機幾無可能勝任這樣的任務。
於是,程式設計師給阿爾法狗多加了一層演算法:先計算哪裡需要計算,哪裡需要忽略,然後再有針對性地計算。
通俗點說,就是計算機具有了學習能力,能夠感知、判斷並完成決策,這便具備了ai的基本特徵。
不過,機器的學習方式,和人類有著質的不同,人透過觀察少數特徵,就能推及多數未知,也就是具有“舉一反三”的能力。
但機器不行,它必須不斷地試錯排除,不斷地識別計算,才能得出結果。
而且在這個學習過程中,需要三個基本條件:演算法、算力、資料。
演算法就是計算方法,也可以稱之為計算模型,比如識別一隻狗和識別一段人類語音,其演算法是不同的,應用場景不同演算法就不同,這需要程式設計師進行相應的設計和最佳化。
但有了演算法,沒有算力和資料,ai也無法進行學習。
就如同“巧婦難為無米之炊”,演算法是食譜,算力就是烹飪工具,資料則是食材,光懂得烹飪方法,沒有烹飪工具和食材,一樣無法烹飪出美味的佳餚。
所以要想在人工智慧方面有所建樹,最根本的就是要解決演算法、算力和資料這三個基本條件。
目前國際上人工智慧技術研發進展緩慢,主要就是受制於算力和資料,不過這方面恰好是沸騰的優勢。
經過多年佈局,目前這三個基本條件及其外延條件,儘管與國外還無法相提並論,但在國內已經基本具備,所以人工智慧技術研發上,方傑認為是時候發一下力了。
首先演算法方面,說白了就是兩個分支條件:程式開發人才和演算法訓練平臺。
人才這一塊國內目前並不缺,沸騰研究院、中科院自動化研究所、華為、騰訊等,在相關領域本來就有大量的科研人才。
而這次發力,方傑還直接拿錢把在海外工作的不少華裔專家砸回到了國內來。
至於演算法平臺,那可是老本行,不就是遊戲麼,這方面沸騰集團擁有天然優勢。
ai的學習,就是透過遊戲進行學習的。
當然,ai遊戲與人類遊戲,稍稍有點區別,即針對性更強,目的不是為了讓ai從遊戲裡獲得成就感,而是為了使其學習進步,並幫助人類完成各種工作任務。
比如紅白機時機就有一款非常簡單的遊戲:打方塊。
其遊戲玩法是玩家左右滑動控制一個具有彈力的短板,接球並反彈小球,消除遊戲介面上方一排排的小方塊,消掉所有方塊就能通關遊戲,並以此獲得成就感。
如果將這款遊戲用作ai訓練平臺,透過特定的演算法和強化學習,ai就會從一開始完全接不住球,到後來不光能接住球,還能準確計算出小球的反彈角度,消掉上方所有方塊。
甚至經過一段時間的訓練和學習,ai還能找到最優的通關方式。
比如先精準消掉左上角的幾個方塊,打通所有方塊的上方路徑,然後再把小球打進去,讓小球在方塊陣的上方,在牆壁與方塊陣之間來回反覆反彈,每趟能連擊消除幾十個方塊,大大提高了通關速度,並且獲得更多的連擊分數加成。
這樣的遊戲思路和技術,可能只有高玩才能想到和做到,到了這一步,ai在打方塊這款遊戲裡的技術水平,顯然已經超過了普通玩家,其學習方式,就不是“監督學習”了,而是“強化學習”,ai擁有了自主學習的能力。
同樣的方式,如果將ai放入其他遊戲,或者說不同演算法模型裡不斷地的學習總結,那麼一樣也能訓練培養出能力極強的ai出來。
從本質上看,培養教導ai,其實與教育小孩沒有太大區別。
那麼反過來說,透過遊戲進行寓教於樂學習,才是人類小時候最佳的教育學習方式,將遊戲視為洪水猛獸,是不可取的,在教育方法上,自我強化學習也要比填鴨式“監督學習”效果更好。
演算法問題解決了,接下來就要滿足算力和資料的條件。