文/劉鋒
1.關(guān)于機(jī)器與人類智慧未來的分歧
2011年2月18日,超級電腦“沃森”打敗了人類,站在了與人類智力競賽的最高領(lǐng)獎(jiǎng)臺上。著名的未來學(xué)家?guī)炱濏f爾相信,由于信息技術(shù)正朝著“超人類智能”的奇點(diǎn)邁進(jìn)。當(dāng)這個(gè)信息奇點(diǎn)在2045年到來的時(shí)候,人工智能將超越人類智慧。
但也有不少科學(xué)家認(rèn)為機(jī)器智慧超越人類智慧還只是一個(gè)科學(xué)幻想,包括麻省理工的計(jì)算機(jī)學(xué)教授羅勃?米勒(Rob Miller),F(xiàn)acebook人工智能實(shí)驗(yàn)室主任、深度學(xué)習(xí)專家Yann LeCun,都認(rèn)為機(jī)器算法在一些領(lǐng)域的確超越了人類的能力范圍。 但在一些領(lǐng)域,例如對社會(huì)和文化的認(rèn)知領(lǐng)域,包括不斷發(fā)明各種新詞匯、傳播小貓的視頻并點(diǎn)贊,或一起參與構(gòu)的其他文化現(xiàn)象。這些是機(jī)器算法很難企及的領(lǐng)域。
1950年,圖靈發(fā)表題為《機(jī)器能思考嗎?》的論文,第一次提出“機(jī)器思維”的概念。提出假想:一個(gè)人在不接觸對方的情況下,通過一種特殊的方式,和對方進(jìn)行一系列的問答,如果在相當(dāng)長時(shí)間內(nèi),他無法根據(jù)這些問題判斷對方是人還是計(jì)算機(jī),那么,就可以認(rèn)為這個(gè)計(jì)算機(jī)具有同人相當(dāng)?shù)闹橇?,即這臺計(jì)算機(jī)是能思維的。這就是著名的“圖靈測試”(Turing Testing)。
圖靈測試經(jīng)常用來檢驗(yàn)機(jī)器是否具備人的智能,但圖靈測試受人為因素干擾太多,嚴(yán)重依賴裁判者和被測試者的主觀判斷,而且只判斷機(jī)器是否具備了人的智能,但機(jī)器與人類智慧的差距和變化速度并不能得到定量的分析。因此往往有人宣稱其程序通過圖靈測試,例如2014年6月英國雷丁大學(xué)客座教授凱文?沃維克宣稱一款名為“尤金?古特曼(Eugene Goostman)”的計(jì)算機(jī)軟件通過了測試,但很快就被人揭發(fā)他們的測試有很大漏洞并由欺詐嫌疑。
那么有沒有一種方法,能夠定量檢測機(jī)器智力的發(fā)展水平和速度,并與人類智力進(jìn)行對比,觀察可能潛在的風(fēng)險(xiǎn)并進(jìn)行防范。2013年以來我們在機(jī)器與互聯(lián)智商方向進(jìn)行了探索,初步成果已經(jīng)發(fā)表在2014年6月6日舉辦的ITQM會(huì)議上,下面我們將簡要介紹如何定量分析機(jī)器與人類智慧的未來之爭。
2.機(jī)器與人類智商通用測試方法(M&H IQ)
在心理科學(xué)中,智力(intelligence)是最難理解的概念之一。 目前有關(guān)智力的定義累積起來不下百種, 但一個(gè)基本共識是,智力是人們認(rèn)識客觀事物并運(yùn)用知識解決實(shí)際問題的能力。
對人類智力的測量即智商測試由比奈西蒙最早提出,1905年比奈西蒙發(fā)表了《診斷異常兒童智力的新方法》, 即比納西蒙智力量表 ,標(biāo)志著智力測驗(yàn)的正式出現(xiàn)。 1916年,美國斯坦福大學(xué)教授推孟(L.M. Ter man)將比納西蒙量表介紹到美國并予以修訂,修訂之后的量表稱為斯坦福比納量表,它成為目前世界上廣泛流傳的標(biāo)準(zhǔn)測驗(yàn)之一。
因?yàn)槟壳皺C(jī)器智力發(fā)展還很不完善,不能完全套用對人的智商測試。幾乎沒有任何機(jī)器系統(tǒng)能夠完成人類智商測量的操作能力測試,因此我們需要吸收以上智商測試量表的優(yōu)點(diǎn),設(shè)計(jì)新的智力評價(jià)體系和建立測試題庫。使之能同時(shí)對機(jī)器系統(tǒng)和不同年齡階段的人類進(jìn)行測試。這樣得出的結(jié)果將可以定量的看出機(jī)器智慧與人類智慧的差距,通過定時(shí)測試,也可以發(fā)現(xiàn)機(jī)器智慧與人類智慧差距的變化情況。
基于“智力是人們認(rèn)識客觀事物并運(yùn)用知識解決實(shí)際問題的能力”這一基本認(rèn)知,可以從知識的獲取能力(觀察能力),知識掌握能力,知識創(chuàng)新能力,知識的反饋能力(表達(dá)能力)等四大方面建立新的機(jī)器與人類通用智商評價(jià)體系,從這四個(gè)方面建立15個(gè)分測試,并采用德爾菲法對其賦予權(quán)重。
機(jī)器與人類通用智力量表(M&H IQ)
1 知識獲取能力 識別文字的能力,識別聲音的能力,識別圖片的能力
2 知識掌握能力 常識(天文,地理,歷史,物理,,,,),翻譯,計(jì)算,
3 知識創(chuàng)新能力 排列,聯(lián)想,創(chuàng)作,猜測,挑選,發(fā)現(xiàn)(規(guī)律)
4 知識的反饋能力 用文字表達(dá)的能力,用聲音表達(dá)的能力,用圖片表達(dá)的能力
具有機(jī)器智慧的程序有很多種類,其中搜索引擎具有很強(qiáng)的代表性,作為目前互聯(lián)網(wǎng)最重要的應(yīng)用之一,搜索引擎代表有Google,Baidu,Bing等,這些搜索引擎目前在通過各種方式不斷提高搜索引擎的智能水平。
例如 1.從只能識別文字增加到能夠識別聲音和圖片;2引入“語義理解”技術(shù),試圖理解用戶的搜索意圖;3,通過深度學(xué)習(xí),讓搜索引擎可以自動(dòng)識別圖像中是什么物體。因此選擇對搜素引擎進(jìn)行智商測試并與人類進(jìn)行對比將具有典型的意義。
3.世界搜索引擎排名與機(jī)器智慧的弱點(diǎn)
根據(jù)機(jī)器與人類通用智力量表,可以建立機(jī)器與人類通用智商測試題庫(因?yàn)槠鶈栴},本文不進(jìn)行詳細(xì)介紹),2014年5月我們利用這個(gè)測試題庫對全世界50個(gè)搜索引擎和3個(gè)不同年齡階段的人類群體進(jìn)行測試得到結(jié)果如下
排名 屬地 名稱 通用智商 排名 屬地 名稱 通用智商
1 人類 18歲 97 28 葡萄牙 sapo 12
2 人類 12歲 84.5 29 德國 lycos 12
3 人類 6歲 55.5 30 印度 khoj 10.5
4 美國 google 26.5 31 俄羅斯 Km 10.5
5 中國 Baidu 23.5 32 德國 suche 10.5
6 中國 so 23.5 33 美國 Dogpile 9
7 中國 Sogou 22 34 德國 Acoon 7.5
8 埃及 yell 20.5 35 馬來西亞 Sajasearch 6
9 俄羅斯 Yandex 19 36 印度 indiabook 6
10 俄羅斯 ramber 18 37 塞浦路斯 1stcyprus 6
11 西班牙 His 18 38 希臘 Gogreece 6
12 捷克 seznam 18 39 荷蘭 slider 6
13 葡萄牙 clix 16.5 40 挪威 Sunsteam 6
14 韓國 nate 15.75 41 英國 Excite UK 6
15 阿聯(lián)酋 Arabo 15.75 42 英國 splut 6
16 中國 panguso 15 43 俄羅斯 Rol 6
17 韓國 naver 15 44 西班牙 ciao 6
18 俄羅斯 webalta 13.5 45 德國 fireball 6
19 美國 yahoo 13.5 46 德國 bellnet 6
20 美國 bing 13.5 47 德國 slider 6
21 香港 timway 12.75 48 德國 wlw 6
22 日本 goo 12.75 49 埃及 netegypt 6
23 日本 excite 12.75 50 所羅門群島 eMaxia 6
24 中國 Zhongsou 12 51 澳大利亞 Anzswers 6
25 英國 ask 12 52 澳大利亞 Pictu 6
26 法國 voila 12 53 新西蘭 SerachNZ 6
27 法國 ycos 12
通過測試我們發(fā)現(xiàn)搜索引擎在知識的掌握能力上遠(yuǎn)遠(yuǎn)超過人類,但在知識的創(chuàng)新能力上全部得分為0. 由于知識創(chuàng)新能力在通用智商測試(M&H IQ)的權(quán)重更高,因此世界范圍的搜索引擎的總體智商大大低于人類智慧,最高的Google的智商值也不到人類6歲兒童的一半。
從上述研究還可以看出智能或智力是由不同的因素組成,例如天文,地理,歷史等常識,數(shù)學(xué)計(jì)算,語言翻譯。這些方面機(jī)器或互聯(lián)網(wǎng)已經(jīng)遠(yuǎn)遠(yuǎn)超過普通人類的能力,甚至強(qiáng)大到令人恐怖的地步,這也是庫茲韋爾的觀點(diǎn)能夠震懾住很多人的主要原因。
但我們往往忽略,除此之外,智力還包括猜測預(yù)測,排列組合,規(guī)律發(fā)現(xiàn),創(chuàng)新創(chuàng)造,偽裝欺騙等更高等級的智慧因素,而在這些方面,機(jī)器和互聯(lián)網(wǎng)表現(xiàn)的基本為0,更不用說與嬰兒比較。
從科技的發(fā)展看,低端的智能,機(jī)器的能力突飛猛進(jìn),高端的智能,機(jī)器的能力舉步維艱,數(shù)十年來毫無進(jìn)展,未來的智慧世界應(yīng)該是機(jī)器與人類的分工,低端重復(fù)性的智能由機(jī)器承擔(dān),高端的創(chuàng)造性的智能由人類來承擔(dān)。過分的宣揚(yáng)機(jī)器智慧超越人類智慧,正如Facebook人工智能實(shí)驗(yàn)室主任Yann LeCun所說“人工智能的每一個(gè)新浪潮,都會(huì)帶來這么一段從盲目樂觀到不理智最后到沮喪的階段。未來學(xué)家生來就愿意做出盲目的預(yù)測,尤其是他們特別渴望這個(gè)預(yù)測成真的時(shí)候,可能是為了實(shí)現(xiàn)個(gè)人抱負(fù)?!保?/p>
最后需要指出,目前建立的機(jī)器與人類通用智商測試量表(M&H)還有很大的改進(jìn)空間,但希望這是一個(gè)起點(diǎn),能夠解決圖靈測試的不足和缺陷,為定量分析機(jī)器智慧能否超越人類智慧打下初步的基礎(chǔ)。
(劉鋒供本站專稿,轉(zhuǎn)載請注明出處。文章僅代表個(gè)人觀點(diǎn)。)
(作者簡介:劉鋒,互聯(lián)網(wǎng)X實(shí)驗(yàn)室創(chuàng)始人,互聯(lián)網(wǎng)進(jìn)化論作者)
1.《timway 破解圖靈測試之困,量化分析機(jī)器與人類智慧》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識,僅代表作者本人觀點(diǎn),與本網(wǎng)站無關(guān),侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《timway 破解圖靈測試之困,量化分析機(jī)器與人類智慧》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進(jìn)行證實(shí),對其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。
3.文章轉(zhuǎn)載時(shí)請保留本站內(nèi)容來源地址,http://f99ss.com/keji/480637.html