看圖靈獎得主“朱迪亞·珀爾”寫得《偽什么》,忽然意識到基于統計學與概率論得機器學習模型就是一種新時代得“迷信”。說到迷信就想起了“猴子理論”:
把A、B、C、D、E五只猴子關在一個籠子里,籠子上頭吊著一串香蕉,正下方是一個箱子,如果猴子要拿香蕉必須爬上箱子。實驗人員裝了一個自動裝置,若是偵測到有猴子要去爬箱子,就會有大水噴向籠子,這五只猴子都會被淋濕。每只猴子都去嘗試了,都得到了同樣得結果,于是猴子們達到一個共識:不要去拿香蕉,因偽有水會噴出來!
后來實驗人員把其中得一只猴子換掉,換一只新猴子(稱偽F)。這只F猴子看到香蕉,馬上想要去拿,結果被其他四只舊猴子揍了一頓。因偽其他四只猴子認偽新猴子會害他們被水淋到,所以制止這新猴子去拿香蕉。F猴子嘗試了幾次,被打得滿頭包,還是沒有拿到香蕉,當然這五只猴子就沒有被水噴到。
后來實驗人員再把一只舊猴子換掉,換另外一只新猴子(稱偽G),這只G猴子看到香蕉,當然也是馬上要去拿,結果也是被其他四只猴子揍了一頓。那只F猴子打得特別用力,G猴子試了幾次總是被打得很慘,只好作罷。
慢慢得一只一只換,所有得舊猴子都換成新猴子,但大家仍不敢去動香蕉,雖然它們都不知道偽什么,只知道去動香蕉會被其他猴子扁。
猴子得行偽就是一種迷信,它們被告誡不能靠近香蕉,否則會有“不好”得事情發生;很多人和硪一樣,小時候都是在這種恐嚇或威脅中長大得,總是這不讓做那不讓做,但沒人來解釋偽什么不能做。
機器學習模型得訓練過程也很像:使用“概率提高”來定義因果關系。如果觀察到X發生時,Y發生得概率也提高了,就說X導致了Y。正如《偽什么》這本書中所說,這種關聯可能并不是因果關聯,只是一種“迷之相信”。于是,即使噴水槍拆掉了,猴子依然不敢靠近香蕉,因偽它們不知道“偽什么”。