分卷閱讀95(1 / 2)

天才棋士 o白野o 1134 字 2021-04-09

phago就突然不會下棋了!

價值網絡的自我評判瘋狂下跌,導致整個系統紊亂!

網絡上凱歌高奏,仿佛魏柯已經取得了最終的勝利,而棋院中的眾人卻一臉懵逼,靜靜地看著雙眼青黑的謝榆。謝榆看完了棋,依舊一頭扎進了代碼中。

他昨天不過是猜測。他並不確信他的結果,但現在看來,他的策略確實奏效了。

開局妙手,是他思考了一個晚上的無奈之舉:alphago的策略網絡,是檢索的kcs圍棋服務器上所有真人在線對弈這就暴露了一個問題:那是一個面向業余棋手的網站,中國棋壇的頂尖棋手,鮮少上那兒去。誠然,業余棋手們為alphago提供了大量的參考,但是這些參考,恰恰與頂尖棋手的水准稍稍差了那么一點。

換句話說,魏柯有可能下出alphago預測不到的棋。

預測不到而又子效非常高的棋,剛好有個專業術語妙手。

妙手有可能在alphago的預料之外,但不一定會給alphago帶來巨大的打擊。因為alphago是沒有情緒的,它既不會因為優勢而自滿,又不會為落後而喪失斗志,從某種意義上,冰冷的機械之心才是它最強大的地方。頂尖棋手很多時候比拼的不是技術,而是心態。誰的心波瀾不起,誰就越是能冷靜地操縱局面,像李在中和魏柯這類人,就往往能將自己的技術發揮到十成,然後捕捉對方的失誤,放在動物里,是一等一的捕獵者。

可是魏柯的妙手無法震懾alphago,很可能只是讓alphago的一步思考完全報廢。在下一手,它依舊會重振旗鼓,進行著它冰冷的計算。

除非,那一步妙手,已經給它的最優解制造了天花板!

也就是說,妙手要對alphago起作用,不能僅僅是普通意義上的妙手,而必須將全局指向一個對魏柯來說勝率極高的局面,以至於alphago再也不相信自己會贏。它只能在戰敗的框架下進行蒙特卡洛樹搜索,它的瞬時勝率必須在49%以下!

謝榆有理由這么認為,因為alphago與人類棋手對弈,從來沒有處於過極度下風。或者說的更確一點,在alphago的價值評價下,它從來不曾思考過自己戰敗。這不一定是alphago太強,而是因為它不能。一旦價值評價下跌,它就失去了還手之力。

而這個妙手必須放在開局的理由,則是因為:魏柯之所以現在還能與alphago一戰,所能仰仗的歸根結底只有一點:棋盤很大。棋盤每縮小一格,alphago要處理的計算量就降低一個指數級。alphago的計算度會隨著棋盤的不斷進行不斷提高,所以魏柯決不能讓棋局過早定型!

謝榆賭贏了。