迎接大數(shù)據(jù)思維新模式--《智能時(shí)代》讀書(shū)筆記
天有不測(cè)風(fēng)云。今年6月6日北京把新冠肺炎防控等級(jí)由二級(jí)下調(diào)到三級(jí)沒(méi)幾天,病毒突然從新發(fā)地農(nóng)產(chǎn)品批發(fā)市場(chǎng)竄出,把北京的防控級(jí)別又拽回二級(jí)。8日我們從北京飛回老家鄉(xiāng)下山里想涼快幾天,哪知11日深夜當(dāng)?shù)鼐旌歪t(yī)務(wù)人員根據(jù)機(jī)票信息追蹤到家里,把我們拉去50公里外的縣醫(yī)院做核酸檢測(cè),然后天天兩次上門(mén)測(cè)體溫,自我隔離14天。借此機(jī)會(huì),看了幾本書(shū),中信出版社的《智能時(shí)代》是其中之一。作者是大數(shù)據(jù)科普作家吳軍博士,他已經(jīng)出版過(guò)好幾本有關(guān)大數(shù)據(jù)的科普著作。作者在書(shū)中,用通俗易懂的語(yǔ)言,對(duì)大數(shù)據(jù)和機(jī)器智能對(duì)未來(lái)的影響進(jìn)行了比較充分的揭示,文字振聾發(fā)聵,諸如“數(shù)據(jù)密集型科學(xué)”“機(jī)械思維”“大數(shù)據(jù)思維”等等新觀點(diǎn),讓人來(lái)了次頭腦風(fēng)暴。作者是大數(shù)據(jù)科學(xué)家,又曾經(jīng)是數(shù)據(jù)服務(wù)商高管,在書(shū)中,夾敘夾議中既有科學(xué)理論,又有實(shí)踐經(jīng)驗(yàn)。讀起來(lái)無(wú)晦澀之困,有通俗之感。作者闡述了大數(shù)據(jù)科學(xué)發(fā)展的前因后果,概述了科學(xué)研究發(fā)展經(jīng)歷的四個(gè)范式:一是描述自然現(xiàn)象的實(shí)驗(yàn)科學(xué);二是以牛頓定律等為代表的理論科學(xué);三是模擬復(fù)雜現(xiàn)象的計(jì)算科學(xué);四是目前的數(shù)據(jù)密集型科學(xué)。第四個(gè)范式是大數(shù)據(jù)時(shí)代的決定性因素,會(huì)與以前的每一階段工業(yè)革命一樣,給經(jīng)濟(jì)社會(huì)帶來(lái)巨大變遷。作者認(rèn)為,雖然數(shù)據(jù)在上面四個(gè)科學(xué)階段都存在,但只有今天,隨著互聯(lián)網(wǎng)的寬帶化和移動(dòng)電子設(shè)備技術(shù)的應(yīng)用,數(shù)據(jù)量的爆炸性增長(zhǎng)和科學(xué)家們對(duì)數(shù)據(jù)的深度挖掘分析,才形成以大數(shù)據(jù)為特征的數(shù)據(jù)密集型科學(xué)。
“數(shù)據(jù)密集型科學(xué)”推動(dòng)思維革命
書(shū)里提出了“數(shù)據(jù)密集型科學(xué)”概念,說(shuō)它將推動(dòng)人類(lèi)的思維革命。為了說(shuō)明這點(diǎn),作者讓我們重溫了科學(xué)技術(shù)引導(dǎo)人類(lèi)經(jīng)濟(jì)社會(huì)進(jìn)步的歷史。世界經(jīng)濟(jì)發(fā)展史上的每一次技術(shù)革命,都是圍繞著一個(gè)核心技術(shù)展開(kāi)的。第一次工業(yè)革命是蒸汽機(jī),第二次工業(yè)革命是電氣化,第三次工業(yè)革命是計(jì)算機(jī)和半導(dǎo)體芯片為主的信息化,第四次是大數(shù)據(jù)和機(jī)器智能引領(lǐng)的智能革命。作者預(yù)言,這第四次革命將會(huì)徹底改變我們當(dāng)下所有人的生活。其標(biāo)志是人類(lèi)思維方式的革命性變革。傳統(tǒng)上人類(lèi)決策是靠邏輯推理,而大數(shù)據(jù)和機(jī)器智能不是靠邏輯推理,而是靠大數(shù)據(jù)和智能算法幫助我們決策。這不可避免地會(huì)對(duì)未來(lái)經(jīng)濟(jì)產(chǎn)生巨大影響。書(shū)里對(duì)過(guò)去商業(yè)模式的歷史變遷總結(jié)了三條:一是技術(shù)革命導(dǎo)致新的商業(yè)模式誕生;二是生產(chǎn)過(guò)剩,需求拉動(dòng)經(jīng)濟(jì)增長(zhǎng)的模式不可逆轉(zhuǎn);三是商業(yè)模式既有繼承性又有創(chuàng)新性。第一次工業(yè)革命導(dǎo)致了產(chǎn)品需要靠展示推銷(xiāo)才能賣(mài)出去;第二次工業(yè)革命導(dǎo)致廣告業(yè)興起,展示的推銷(xiāo)方式變成了廣告,并導(dǎo)致了商業(yè)鏈的出現(xiàn);第三次工業(yè)革命是信息革命使商業(yè)鏈得到發(fā)展,服務(wù)業(yè)的重要性凸顯。以“數(shù)據(jù)密集型科學(xué)”為指導(dǎo)思想的大數(shù)據(jù)時(shí)代,毫無(wú)疑問(wèn)會(huì)推動(dòng)現(xiàn)存商業(yè)模式的改變,大數(shù)據(jù)和機(jī)器智能將是第四次工業(yè)革命。蒸汽機(jī)、電氣化、信息化是這樣,大數(shù)據(jù)時(shí)代將仍然會(huì)是這樣,這是經(jīng)濟(jì)發(fā)展的規(guī)律。這種變化是革命性的震撼人心的。為了讓讀者更直觀感性地認(rèn)識(shí)這一點(diǎn),作者在書(shū)中與我們一起回顧了2017年5月23-27日那場(chǎng)智能機(jī)器人戰(zhàn)勝世界段位高手的圍棋比賽。智能機(jī)器人以三比零戰(zhàn)勝人類(lèi)頂尖棋手靠的就是大數(shù)據(jù)和計(jì)算機(jī)算法。從經(jīng)濟(jì)角度思考這場(chǎng)圍棋比賽。那就是大數(shù)據(jù)和智能機(jī)器人將會(huì)對(duì)現(xiàn)存經(jīng)濟(jì)模式產(chǎn)生深刻而廣泛的影響。作者分析了機(jī)器人取勝的原因:其一,它的采用的是機(jī)器學(xué)習(xí)與神經(jīng)系統(tǒng)科學(xué)結(jié)合的學(xué)習(xí)算法;其二,它在強(qiáng)大的云計(jì)算系統(tǒng)中,通過(guò)統(tǒng)計(jì)模型在極短時(shí)間內(nèi)學(xué)習(xí)分析了幾千萬(wàn)盤(pán)圍棋棋譜和比賽巨量數(shù)據(jù)后,獲得了不同局勢(shì)下該如何行棋有一個(gè)比人類(lèi)更為準(zhǔn)確的估計(jì),尋找出了比基礎(chǔ)棋譜更好的大數(shù)據(jù)棋路。這一點(diǎn)是人類(lèi)大腦無(wú)論如何也無(wú)法完成的。機(jī)器智能里面有兩個(gè)關(guān)鍵的技術(shù)是人腦無(wú)法獲得的。第一個(gè)關(guān)鍵技術(shù)是把棋盤(pán)上當(dāng)前的狀態(tài)變成一個(gè)獲勝概率的數(shù)學(xué)模型,是完全靠數(shù)據(jù)訓(xùn)練出來(lái)的。第二個(gè)關(guān)鍵技術(shù)是啟發(fā)式搜索算法。作者認(rèn)為下圍棋這個(gè)看似智能型的問(wèn)題,從本質(zhì)上講,是一個(gè)大數(shù)據(jù)和算法的問(wèn)題。在機(jī)器人的背后,是數(shù)據(jù)中心強(qiáng)大的服務(wù)器集群,它們獲得智能的方法不是和我們?nèi)艘粯涌窟壿嬐评,而更多的是利用大?shù)據(jù)。因此,思維方式上的邏輯推理一霸天下的歷史或?qū)⒏膶?xiě)。
“機(jī)械思維”將靠后站
“機(jī)械思維”是一種靠邏輯推理的思維方式。如果機(jī)器人利用邏輯推理和圍棋手對(duì)弈,是戰(zhàn)勝不了人類(lèi)的,但它另辟蹊徑,用大數(shù)據(jù)把人類(lèi)頂級(jí)棋手干下去了。智能機(jī)器人在下棋時(shí)沒(méi)有用機(jī)械思維思考。作者認(rèn)為,機(jī)械思維是前三個(gè)工業(yè)革命的科學(xué)方法論。它們和因果關(guān)系息息相關(guān)。由因根據(jù)三段論推出果的邏輯推理方式。作者認(rèn)為,機(jī)械思維是過(guò)去三個(gè)多世紀(jì)里人類(lèi)總結(jié)出的最重要的思維方式是現(xiàn)代文明的基礎(chǔ)。西方把機(jī)械思維歸功于牛頓的科學(xué)方法論。內(nèi)容包括:第一,世界變化的規(guī)律是確定的;第二,世界變化的規(guī)律不僅可以被認(rèn)識(shí),而且可用簡(jiǎn)單的公式或語(yǔ)言描述清楚;第三,這些規(guī)律放之四海而皆準(zhǔn)。機(jī)械思維方式導(dǎo)致了工業(yè)革命。從牛頓時(shí)代開(kāi)始接下來(lái)的三個(gè)多世紀(jì)里,人類(lèi)越來(lái)越習(xí)慣于用機(jī)械思維描述一切、抽象一切:即抽象個(gè)體然后進(jìn)行標(biāo)準(zhǔn)化,形成了用一個(gè)通用的方案來(lái)解決所有問(wèn)題的方法論。作者認(rèn)為,工業(yè)革命是牛頓提供了方法論即機(jī)械思維,而瓦特則是利用機(jī)械思維方法論發(fā)明了蒸汽機(jī),開(kāi)啟西方工業(yè)革命大門(mén)。因此,瓦特蒸汽機(jī)的成功不僅是技術(shù),更重要的是機(jī)械思維方法論的成功。從牛頓開(kāi)始,人類(lèi)社會(huì)進(jìn)步在很大程度上得益于機(jī)械思維,但是到了計(jì)算機(jī)信息時(shí)代,機(jī)械思維的局限性也越來(lái)越明顯。人們發(fā)現(xiàn)世界本身存在著很大的不確定性。作者認(rèn)為,機(jī)械思維的核心思想可以概括成確定性、或者可預(yù)測(cè)性和因果關(guān)系。它導(dǎo)致了人類(lèi)歷史上很多重大的發(fā)明和發(fā)現(xiàn)。尋找因果關(guān)系是機(jī)械思維的一個(gè)特征,但事實(shí)上,人類(lèi)找到真正的因果關(guān)系是一件很難的事,里面運(yùn)氣的成分很大。機(jī)械思維具有兩面性——善于把握確定性而難以解決不確定性問(wèn)題。由于數(shù)據(jù)之間的相關(guān)性在某種程度上可以取代原來(lái)的因果關(guān)系,可以幫助我們得到我們想知道的答案。由于近30年來(lái)互聯(lián)網(wǎng)寬帶和移動(dòng)通信設(shè)備的迅速發(fā)展,由此而產(chǎn)生的海量數(shù)據(jù)和計(jì)算機(jī)算法,改變了機(jī)械思維300多年的習(xí)慣思維。大數(shù)據(jù)和計(jì)算機(jī)算法的結(jié)合不可避免地產(chǎn)生出“大數(shù)據(jù)思維”。因此“人機(jī)大戰(zhàn)”中,機(jī)器人才能戰(zhàn)勝人類(lèi)頂尖棋手。
“大數(shù)據(jù)思維”引領(lǐng)新時(shí)代
“大數(shù)據(jù)思維”,可以幫助人們解決機(jī)械思維狀態(tài)下不能解決的一些問(wèn)題。人機(jī)大戰(zhàn)中機(jī)器人的取勝說(shuō)明,未來(lái)是可預(yù)測(cè)的,不確定是可以轉(zhuǎn)化為確定。因此,大數(shù)據(jù)思維在新的工業(yè)革命中將引領(lǐng)新時(shí)代。作者認(rèn)為,大數(shù)據(jù)的基礎(chǔ)是數(shù)據(jù)和信息的收集和匯聚,它們?nèi)呒扔新?lián)系又有區(qū)別。
談數(shù)據(jù)前,作者講了數(shù)字和數(shù)據(jù)的聯(lián)系和區(qū)別。他認(rèn)為,數(shù)字僅是數(shù)據(jù)非常小的一部分,數(shù)據(jù)的范疇比數(shù)字要大得多,但它們是有聯(lián)系的;ヂ(lián)網(wǎng)上的文字、圖片和視頻等都是數(shù)據(jù);醫(yī)院里包括醫(yī)學(xué)影像在內(nèi)的所有檔案也是數(shù)據(jù);公司的各種設(shè)計(jì)圖紙也是數(shù)據(jù);出土文物上的文字、圖示也都是數(shù)據(jù)。人類(lèi)發(fā)明了文字,并記錄了人類(lèi)活動(dòng)并留傳后世,形成文明的傳承。以語(yǔ)言和文字形式存在的內(nèi)容是全世界各種信息處理中最重要的數(shù)據(jù),在20世紀(jì)90年代互聯(lián)網(wǎng)興起之后,數(shù)據(jù)的獲取變得非常容易。
接著作者區(qū)別了數(shù)據(jù)和信息。作者認(rèn)為,數(shù)據(jù)和信息還是稍有不同。信息是關(guān)于世界、人和事的描述,它比數(shù)據(jù)來(lái)得抽象。人的大腦是一個(gè)信息源,從思考到找到合適的語(yǔ)句,再通過(guò)發(fā)音說(shuō)出來(lái),是一個(gè)編碼的過(guò)程,經(jīng)過(guò)媒介如聲道、空氣、電話線和揚(yáng)聲器等傳播到聽(tīng)眾耳朵里,是經(jīng)過(guò)了一個(gè)長(zhǎng)長(zhǎng)的信道的信息傳播問(wèn)題,最后聽(tīng)話人把它聽(tīng)懂,是一個(gè)解碼的過(guò)程。隨著人類(lèi)的進(jìn)步以及處理數(shù)據(jù)和信息的能力不斷增強(qiáng),人類(lèi)從數(shù)據(jù)中獲取有用信息的本事就越來(lái)越大,對(duì)數(shù)據(jù)和信息進(jìn)行處理后,人類(lèi)就可以獲得知識(shí)。知識(shí)比信息更高一個(gè)層次,也更加抽象,它具有系統(tǒng)性的特征。而數(shù)據(jù)是知識(shí)的基礎(chǔ)。只有善用數(shù)據(jù),我們才能得到數(shù)據(jù)背后的信息。數(shù)據(jù)中隱藏的信息和知識(shí)是客觀存在的,但是只有具有相關(guān)領(lǐng)域?qū)I(yè)知識(shí)的人才能將它們挖掘出來(lái)。人類(lèi)文明的進(jìn)程是伴隨著獲取數(shù)據(jù)——分析數(shù)據(jù)——建立模型——預(yù)測(cè)未知。雖然數(shù)據(jù)在文明進(jìn)程中具有重大作用,但過(guò)去數(shù)據(jù)的作用常常被人們忽視。這里面有兩個(gè)原因,首先是由于過(guò)去數(shù)據(jù)量不足,積累大量的數(shù)據(jù)所需要的時(shí)間太長(zhǎng)。其次,數(shù)據(jù)和所想獲得的信息之間的聯(lián)系通常是間接的,它要通過(guò)不同數(shù)據(jù)之間的相關(guān)性才能體現(xiàn)出來(lái)。
最后作者區(qū)別了數(shù)據(jù)和大數(shù)據(jù)。前面已經(jīng)說(shuō)到數(shù)據(jù)的概念是指所有輸入到計(jì)算機(jī)并被計(jì)算機(jī)程序處理的符號(hào)的介質(zhì)的總稱(chēng)。大數(shù)據(jù)則不僅僅是數(shù)據(jù)體量大并能及時(shí)獲得,同時(shí)還具有多維度、多樣性;全面性、完備性等特征。從現(xiàn)象中、觀察中總結(jié)出數(shù)據(jù),匯總數(shù)據(jù)并運(yùn)用數(shù)據(jù),是衡量人類(lèi)文明發(fā)展水平之一。隨人類(lèi)進(jìn)步以及處理數(shù)據(jù)和信息的能力不斷增強(qiáng),人類(lèi)從數(shù)據(jù)中獲取有用信息的本事就越來(lái)越大,這就是大數(shù)據(jù)應(yīng)用的基礎(chǔ)。數(shù)據(jù)在計(jì)算機(jī)時(shí)代記錄了人類(lèi)的行為,靠計(jì)算機(jī)去發(fā)掘、分析而得出人類(lèi)沒(méi)有寫(xiě)明的,存在于多次重復(fù)的行為中的數(shù)據(jù)。這樣的行為,光有數(shù)據(jù)做不到,只有計(jì)算機(jī)也難成,只有兩者結(jié)合才能事成。這個(gè)加入計(jì)算機(jī)算法的數(shù)據(jù)稱(chēng)之為大數(shù)據(jù)。計(jì)算機(jī)信息技術(shù)和電子移動(dòng)設(shè)備使得我們可以從足夠多的數(shù)據(jù)中發(fā)現(xiàn)各種事物的相關(guān)性并把握事物發(fā)展的軌跡,并依靠大數(shù)據(jù)來(lái)提高對(duì)未來(lái)不確定性把控能力。采用大數(shù)據(jù)的方法能夠使計(jì)算機(jī)的智能水平大大提高,替代人類(lèi)智能解決不了的許多問(wèn)題。決定今后20年經(jīng)濟(jì)發(fā)展的是大數(shù)據(jù)和由之而來(lái)的智能革命。因此,從方法論的層面上看,大數(shù)據(jù)與三百年前產(chǎn)生的機(jī)械思維一樣,在大數(shù)據(jù)和機(jī)器智能大規(guī)模運(yùn)用的情況下,會(huì)形成一種全新的思維模式即大數(shù)據(jù)思維,從而完成思維模式的一次革命。
大數(shù)據(jù)思維會(huì)帶來(lái)什么?
按照大數(shù)據(jù)思維模式,我們做事情的方式方法需要從根本上改變;仡櫄v史,展望未來(lái),大數(shù)據(jù)引發(fā)的智能革命將是以一種全新的方式展開(kāi)。蒸汽機(jī)、電氣化等技術(shù)革命都是生產(chǎn)力單點(diǎn)突破,從而帶動(dòng)社會(huì)全面變革,今天的大數(shù)據(jù)正面臨這樣一個(gè)突破,大數(shù)據(jù)和機(jī)器智能的普及會(huì)帶來(lái)新一輪經(jīng)濟(jì)社會(huì)生活的全面變革。大數(shù)據(jù)思維所具有的解決不確定性的能力可以為經(jīng)濟(jì)社會(huì)發(fā)展有所作為。在大數(shù)據(jù)思維指導(dǎo)下,數(shù)據(jù)科學(xué)家可以把過(guò)去解決不了的問(wèn)題,變成大數(shù)據(jù)問(wèn)題來(lái)處理。溫故而知新。作者說(shuō),在歷史上,一項(xiàng)技術(shù)帶動(dòng)整個(gè)社會(huì)的變革通常遵循一個(gè)公式,即現(xiàn)有產(chǎn)業(yè)+新技術(shù)=新產(chǎn)業(yè)。第一次工業(yè)革命是:現(xiàn)有產(chǎn)業(yè)+蒸汽機(jī)=新產(chǎn)業(yè);第二次工業(yè)革命是:現(xiàn)有產(chǎn)業(yè)+電氣化=新產(chǎn)業(yè);第三次工業(yè)革命是:現(xiàn)有產(chǎn)業(yè)+摩爾定律=新產(chǎn)業(yè);第四次工業(yè)革命將是:用兩個(gè)公式簡(jiǎn)單概括,現(xiàn)有產(chǎn)業(yè)+大數(shù)據(jù)=新產(chǎn)業(yè),現(xiàn)有產(chǎn)業(yè)+機(jī)器智能=新產(chǎn)業(yè)。大數(shù)據(jù)思維將帶來(lái)一場(chǎng)新技術(shù)革命。大數(shù)據(jù)思維的核心是通過(guò)數(shù)據(jù)之間相關(guān)性的演算分析,取代機(jī)械思維下的因果推理,但大數(shù)據(jù)思維和原有的機(jī)械思維并非完全對(duì)立,它更多的是對(duì)后者的補(bǔ)充。是對(duì)邏輯思維辦不到的事情提供有益的補(bǔ)充,消除事物的不確定性,從而解決問(wèn)題。大數(shù)據(jù)和機(jī)器智能將從供給側(cè)推動(dòng)許多新產(chǎn)業(yè)的誕生,帶動(dòng)產(chǎn)業(yè)升級(jí)換代,滿足人類(lèi)社會(huì)多樣化、個(gè)性化需求,導(dǎo)致我們整個(gè)社會(huì)的升級(jí)和變遷。
這本書(shū)給我們提了個(gè)醒,即將到來(lái)的大數(shù)據(jù)時(shí)代,無(wú)論國(guó)家還是個(gè)人都應(yīng)該建立大數(shù)據(jù)思維方式。跟上去則適者生存,掉下來(lái)則淘汰沒(méi)落。凡事預(yù)則立,不預(yù)則廢。據(jù)普華永道預(yù)測(cè),到2030年,大數(shù)據(jù)和人工智能將為全世界國(guó)內(nèi)生產(chǎn)總值貢獻(xiàn)15.7萬(wàn)億美元。數(shù)據(jù)是開(kāi)發(fā)高級(jí)神經(jīng)系統(tǒng)的必要條件,有數(shù)據(jù)才有可能更好地理解語(yǔ)言、識(shí)別物體并提出有用的見(jiàn)解。中國(guó)是世界第一制造大國(guó),同時(shí)還擁有8-9億網(wǎng)民、10億以上的智能手機(jī)使用者,它們產(chǎn)生的海量數(shù)據(jù)是世界獨(dú)一無(wú)二的,這樣的數(shù)據(jù)背景為大數(shù)據(jù)和機(jī)器智能在中國(guó)發(fā)展提供了巨大的優(yōu)勢(shì)條件。基于這種數(shù)據(jù)優(yōu)勢(shì),我們?cè)诘谒拇喂I(yè)革命中存在非常大的彎道超車(chē)機(jī)會(huì)。目前,在大數(shù)據(jù)和機(jī)器智能領(lǐng)域,中國(guó)與世界先進(jìn)水平距離已縮短,有些方面還略微領(lǐng)先,比如金融移動(dòng)支付等。因勢(shì)利導(dǎo)地用大數(shù)據(jù)思維完成中國(guó)新經(jīng)濟(jì)模式的變革是有完全可能的。在這種背景下讀讀《智能時(shí)代》一書(shū),可以幫助我們更好理解即將到來(lái)的大數(shù)據(jù)思維新時(shí)代。
姜 洋
2020年6月22日