AI讓幾子人類才能穩贏?騰訊「絕藝」讓二子,柯潔還是輸了

AI讓幾子人類才能穩贏?騰訊「絕藝」讓二子,柯潔還是輸了

這兩天,世界圍棋第一人柯潔的心情可能不太美妙。1月17日,在棋聖戰八強比賽中,柯潔不敵另外一位棋手范廷鈺,失去了爭奪80萬冠軍獎金的資格。同一天晚上,在野狐圍棋平台上,挑戰圍棋人工智慧程序「絕藝指導A」,但只對弈了77手,便直接認輸了。

對於圍棋人工智慧來說,能戰勝人類棋手,已經不是新鮮事。但這一次,在「絕藝」與柯潔的對戰過程中,存在讓子(讓二子,相當於黑貼6目半)的情況,因此也創造了頂級職業圍棋手,在讓子棋中第一次負於圍棋人工智慧的情況。

柯潔與「絕藝」對戰被讓二子

柯潔告負也引發了另一個討論:未來人機大戰的懸念,是否會變成人工智慧讓几子,人類才能穩贏。

柯潔被讓二子,77手告負

在當天野狐圍棋平台的挑戰中,柯潔先贏下羋昱廷九段。心情大好的他,面對網友們的期待:「和絕藝指導A下一盤」,欣然應允,向「絕藝指導A」發出對局邀請。更讓人驚訝的是,這一次,柯潔放下了身段,接受了讓子,先在棋盤中放下了兩顆黑子。

這樣的行為經過網際網路的傳播後,引發聯動效應。柯潔「迷弟」古力九段第一時間在自己的社交賬號上表示:「這必須看啊。」

古力微信截圖

只可惜,比賽結果讓看熱鬧的圍觀群眾失望了。開局,柯潔執黑主動在右上角引誘白棋沖斷,激戰不斷。對殺過程中,雙方下到60手後,白棋一手猝不及防的「打二還一」奠定了優勢。對弈到77手時,或許是對自己的表現太過失望,柯潔直接認輸。

在柯潔落敗一個小時後,連笑九段跟進挑戰,但結果並沒有反轉,247手後,連笑中盤告負。

柯潔微博截圖

挑戰失敗後,1月19日,柯潔在自己的微博賬號上表達了心情:「以後請叫我佛系棋手... 」,並貼出微信對話截圖稱:「後面虧了一大堆,突然一生氣就認輸了。」

柯潔微信截圖

圍棋AI的進步:強在哪裡?

那麼,這次在野狐圍棋平台上的讓子挑戰,為何能引發圍棋界如此大的轟動,和以往正常對弈情況下的人機比賽有哪些不同之處?

在回答上述問題前,我們可以回顧下「絕藝」的成長過程。「絕藝」是騰訊AI Lab於2016年初開始研發的圍棋人工智慧程序。2017年相繼在「UEC杯」和「AI龍星戰」等世界計算機圍棋大賽上斬獲冠軍。在2017年11月,「絕藝」在騰訊圍棋對頂尖職業棋手取得59連勝,並讓二子戰勝「絕藝」UEC版,以60連勝完成版本升級。2017年12月,在海南三亞舉辦的「絕藝挑戰賽」上,絕藝戰勝騰訊圍棋錦標賽的冠軍童夢成六段和亞軍連笑九段。2018年1月9日,「絕藝」開始讓二子對決職業棋手的行程。

據騰訊AI Lab介紹,此次與柯潔等職業棋手對弈的「絕藝」挑戰賽版,參考了2017年10月公開的AlphaGo Zero論文,並在實踐中做出了改進。這個版本使用了40 block dual-resnet模型,以老版本的絕藝為基礎進行強化學習,自對弈了數百萬棋局,在有限的資源和時間內,通過把強化學習和監督學習相結合來加速訓練,快速提升了棋力。

在正常的人機對弈情況下,一開始雙方贏的概率相同。但人工智慧以贏棋為目標,當系統顯示的勝率很高時,人工智慧系統會出現下哪裡都能贏的情況,它們有時候可選擇贏得不多的走法。

但在讓子的情況下,一開始,圍棋人工智慧就處在勝率過低的情況。對於這一點,騰訊AI Lab這樣解釋:以絕藝海南挑戰賽版本為例,這是一個分先版本的人工智慧程序,如果要求其以讓二子開始對局,則初始勝率為7%(讓三子則初始勝率1%,讓四子則初始勝率0.1%)。並且實力越強的版本,下讓子棋時的初始勝率就越低,因為程序在下棋時會假設對手跟自己一樣。

「初始勝率過低將導致AI不能發揮出真正的實力,這也是現在絕藝讓二子還不能全勝的原因。我們最近在嘗試優化演演演算法,來解決勝率過低帶來的負面影響,爭取以後在讓子棋里有更好的表現。」 騰訊AI Lab稱。

AlphaGo已如此強大,大陸圍棋AI的研究意義又在哪?

自AlphaGo橫空出世,它在圍棋領域就所向披靡。在完成了戰勝李世石、柯潔兩位世界頂級棋手後,不斷自我進化,無師自通,變成了最強的AlphaGo Zero,成為「圍棋之神」。此後,AlphaGo還推出了圍棋教學工具,「反哺」人類。

完成這一列「大神」級別的操作後,DeepMind公司終於宣布會暫停人工智慧在圍棋領域裡的研究,將精力轉向其他方向。那麼為什麼騰訊還要繼續選擇更新「絕藝」呢?

首先,騰訊董事長馬化騰曾經公開說過,「絕藝」代表著騰訊AI工程化的能力。

其次,騰訊AI lab主任張潼也在多個場合表示,騰訊AI lab主要有三個研究方向,分別是遊戲AI、社交AI、內容AI。顯然,這三個方向緊扣騰訊目前已有的業務和產品,而「絕藝」屬於遊戲AI的一部分。投入對「絕藝」的研發,也符合騰訊AI in All的戰略。

另外,騰訊AI lab還表示,「絕藝」也是騰訊推進前沿科技賦能國粹文化的代表。讓子棋是人類通過人工智慧不斷探索圍棋邊界的範例。人工智慧的每一次進步,都是人類智慧的進步。回顧「絕藝」從研發到成長的過程中,始終與柯潔、古力等世界棋壇高手密切交流與切磋,還開發了指導棋、棋賽講解等功能,不僅幫助提升棋力,也深受廣大棋迷喜愛和關注。未來,騰訊將繼續加大對圍棋AI的研究與投入,打造世界級圍棋AI能力與推廣,更在AI上推進深度學習等前沿AI科技的研究與應用。