迎接大數(shù)據(jù)思維新模式--《智能時代》讀書筆記
天有不測風(fēng)云。今年6月6日北京把新冠肺炎防控等級由二級下調(diào)到三級沒幾天,病毒突然從新發(fā)地農(nóng)產(chǎn)品批發(fā)市場竄出,把北京的防控級別又拽回二級。8日我們從北京飛回老家鄉(xiāng)下山里想涼快幾天,哪知11日深夜當(dāng)?shù)鼐旌歪t(yī)務(wù)人員根據(jù)機票信息追蹤到家里,把我們拉去50公里外的縣醫(yī)院做核酸檢測,然后天天兩次上門測體溫,自我隔離14天。借此機會,看了幾本書,中信出版社的《智能時代》是其中之一。作者是大數(shù)據(jù)科普作家吳軍博士,他已經(jīng)出版過好幾本有關(guān)大數(shù)據(jù)的科普著作。作者在書中,用通俗易懂的語言,對大數(shù)據(jù)和機器智能對未來的影響進行了比較充分的揭示,文字振聾發(fā)聵,諸如“數(shù)據(jù)密集型科學(xué)”“機械思維”“大數(shù)據(jù)思維”等等新觀點,讓人來了次頭腦風(fēng)暴。作者是大數(shù)據(jù)科學(xué)家,又曾經(jīng)是數(shù)據(jù)服務(wù)商高管,在書中,夾敘夾議中既有科學(xué)理論,又有實踐經(jīng)驗。讀起來無晦澀之困,有通俗之感。作者闡述了大數(shù)據(jù)科學(xué)發(fā)展的前因后果,概述了科學(xué)研究發(fā)展經(jīng)歷的四個范式:一是描述自然現(xiàn)象的實驗科學(xué);二是以牛頓定律等為代表的理論科學(xué);三是模擬復(fù)雜現(xiàn)象的計算科學(xué);四是目前的數(shù)據(jù)密集型科學(xué)。第四個范式是大數(shù)據(jù)時代的決定性因素,會與以前的每一階段工業(yè)革命一樣,給經(jīng)濟社會帶來巨大變遷。作者認(rèn)為,雖然數(shù)據(jù)在上面四個科學(xué)階段都存在,但只有今天,隨著互聯(lián)網(wǎng)的寬帶化和移動電子設(shè)備技術(shù)的應(yīng)用,數(shù)據(jù)量的爆炸性增長和科學(xué)家們對數(shù)據(jù)的深度挖掘分析,才形成以大數(shù)據(jù)為特征的數(shù)據(jù)密集型科學(xué)。
“數(shù)據(jù)密集型科學(xué)”推動思維革命
書里提出了“數(shù)據(jù)密集型科學(xué)”概念,說它將推動人類的思維革命。為了說明這點,作者讓我們重溫了科學(xué)技術(shù)引導(dǎo)人類經(jīng)濟社會進步的歷史。世界經(jīng)濟發(fā)展史上的每一次技術(shù)革命,都是圍繞著一個核心技術(shù)展開的。第一次工業(yè)革命是蒸汽機,第二次工業(yè)革命是電氣化,第三次工業(yè)革命是計算機和半導(dǎo)體芯片為主的信息化,第四次是大數(shù)據(jù)和機器智能引領(lǐng)的智能革命。作者預(yù)言,這第四次革命將會徹底改變我們當(dāng)下所有人的生活。其標(biāo)志是人類思維方式的革命性變革。傳統(tǒng)上人類決策是靠邏輯推理,而大數(shù)據(jù)和機器智能不是靠邏輯推理,而是靠大數(shù)據(jù)和智能算法幫助我們決策。這不可避免地會對未來經(jīng)濟產(chǎn)生巨大影響。書里對過去商業(yè)模式的歷史變遷總結(jié)了三條:一是技術(shù)革命導(dǎo)致新的商業(yè)模式誕生;二是生產(chǎn)過剩,需求拉動經(jīng)濟增長的模式不可逆轉(zhuǎn);三是商業(yè)模式既有繼承性又有創(chuàng)新性。第一次工業(yè)革命導(dǎo)致了產(chǎn)品需要靠展示推銷才能賣出去;第二次工業(yè)革命導(dǎo)致廣告業(yè)興起,展示的推銷方式變成了廣告,并導(dǎo)致了商業(yè)鏈的出現(xiàn);第三次工業(yè)革命是信息革命使商業(yè)鏈得到發(fā)展,服務(wù)業(yè)的重要性凸顯。以“數(shù)據(jù)密集型科學(xué)”為指導(dǎo)思想的大數(shù)據(jù)時代,毫無疑問會推動現(xiàn)存商業(yè)模式的改變,大數(shù)據(jù)和機器智能將是第四次工業(yè)革命。蒸汽機、電氣化、信息化是這樣,大數(shù)據(jù)時代將仍然會是這樣,這是經(jīng)濟發(fā)展的規(guī)律。這種變化是革命性的震撼人心的。為了讓讀者更直觀感性地認(rèn)識這一點,作者在書中與我們一起回顧了2017年5月23-27日那場智能機器人戰(zhàn)勝世界段位高手的圍棋比賽。智能機器人以三比零戰(zhàn)勝人類頂尖棋手靠的就是大數(shù)據(jù)和計算機算法。從經(jīng)濟角度思考這場圍棋比賽。那就是大數(shù)據(jù)和智能機器人將會對現(xiàn)存經(jīng)濟模式產(chǎn)生深刻而廣泛的影響。作者分析了機器人取勝的原因:其一,它的采用的是機器學(xué)習(xí)與神經(jīng)系統(tǒng)科學(xué)結(jié)合的學(xué)習(xí)算法;其二,它在強大的云計算系統(tǒng)中,通過統(tǒng)計模型在極短時間內(nèi)學(xué)習(xí)分析了幾千萬盤圍棋棋譜和比賽巨量數(shù)據(jù)后,獲得了不同局勢下該如何行棋有一個比人類更為準(zhǔn)確的估計,尋找出了比基礎(chǔ)棋譜更好的大數(shù)據(jù)棋路。這一點是人類大腦無論如何也無法完成的。機器智能里面有兩個關(guān)鍵的技術(shù)是人腦無法獲得的。第一個關(guān)鍵技術(shù)是把棋盤上當(dāng)前的狀態(tài)變成一個獲勝概率的數(shù)學(xué)模型,是完全靠數(shù)據(jù)訓(xùn)練出來的。第二個關(guān)鍵技術(shù)是啟發(fā)式搜索算法。作者認(rèn)為下圍棋這個看似智能型的問題,從本質(zhì)上講,是一個大數(shù)據(jù)和算法的問題。在機器人的背后,是數(shù)據(jù)中心強大的服務(wù)器集群,它們獲得智能的方法不是和我們?nèi)艘粯涌窟壿嬐评,而更多的是利用大?shù)據(jù)。因此,思維方式上的邏輯推理一霸天下的歷史或?qū)⒏膶憽?/p>
“機械思維”將靠后站
“機械思維”是一種靠邏輯推理的思維方式。如果機器人利用邏輯推理和圍棋手對弈,是戰(zhàn)勝不了人類的,但它另辟蹊徑,用大數(shù)據(jù)把人類頂級棋手干下去了。智能機器人在下棋時沒有用機械思維思考。作者認(rèn)為,機械思維是前三個工業(yè)革命的科學(xué)方法論。它們和因果關(guān)系息息相關(guān)。由因根據(jù)三段論推出果的邏輯推理方式。作者認(rèn)為,機械思維是過去三個多世紀(jì)里人類總結(jié)出的最重要的思維方式是現(xiàn)代文明的基礎(chǔ)。西方把機械思維歸功于牛頓的科學(xué)方法論。內(nèi)容包括:第一,世界變化的規(guī)律是確定的;第二,世界變化的規(guī)律不僅可以被認(rèn)識,而且可用簡單的公式或語言描述清楚;第三,這些規(guī)律放之四海而皆準(zhǔn)。機械思維方式導(dǎo)致了工業(yè)革命。從牛頓時代開始接下來的三個多世紀(jì)里,人類越來越習(xí)慣于用機械思維描述一切、抽象一切:即抽象個體然后進行標(biāo)準(zhǔn)化,形成了用一個通用的方案來解決所有問題的方法論。作者認(rèn)為,工業(yè)革命是牛頓提供了方法論即機械思維,而瓦特則是利用機械思維方法論發(fā)明了蒸汽機,開啟西方工業(yè)革命大門。因此,瓦特蒸汽機的成功不僅是技術(shù),更重要的是機械思維方法論的成功。從牛頓開始,人類社會進步在很大程度上得益于機械思維,但是到了計算機信息時代,機械思維的局限性也越來越明顯。人們發(fā)現(xiàn)世界本身存在著很大的不確定性。作者認(rèn)為,機械思維的核心思想可以概括成確定性、或者可預(yù)測性和因果關(guān)系。它導(dǎo)致了人類歷史上很多重大的發(fā)明和發(fā)現(xiàn)。尋找因果關(guān)系是機械思維的一個特征,但事實上,人類找到真正的因果關(guān)系是一件很難的事,里面運氣的成分很大。機械思維具有兩面性——善于把握確定性而難以解決不確定性問題。由于數(shù)據(jù)之間的相關(guān)性在某種程度上可以取代原來的因果關(guān)系,可以幫助我們得到我們想知道的答案。由于近30年來互聯(lián)網(wǎng)寬帶和移動通信設(shè)備的迅速發(fā)展,由此而產(chǎn)生的海量數(shù)據(jù)和計算機算法,改變了機械思維300多年的習(xí)慣思維。大數(shù)據(jù)和計算機算法的結(jié)合不可避免地產(chǎn)生出“大數(shù)據(jù)思維”。因此“人機大戰(zhàn)”中,機器人才能戰(zhàn)勝人類頂尖棋手。
“大數(shù)據(jù)思維”引領(lǐng)新時代
“大數(shù)據(jù)思維”,可以幫助人們解決機械思維狀態(tài)下不能解決的一些問題。人機大戰(zhàn)中機器人的取勝說明,未來是可預(yù)測的,不確定是可以轉(zhuǎn)化為確定。因此,大數(shù)據(jù)思維在新的工業(yè)革命中將引領(lǐng)新時代。作者認(rèn)為,大數(shù)據(jù)的基礎(chǔ)是數(shù)據(jù)和信息的收集和匯聚,它們?nèi)呒扔新?lián)系又有區(qū)別。
談數(shù)據(jù)前,作者講了數(shù)字和數(shù)據(jù)的聯(lián)系和區(qū)別。他認(rèn)為,數(shù)字僅是數(shù)據(jù)非常小的一部分,數(shù)據(jù)的范疇比數(shù)字要大得多,但它們是有聯(lián)系的。互聯(lián)網(wǎng)上的文字、圖片和視頻等都是數(shù)據(jù);醫(yī)院里包括醫(yī)學(xué)影像在內(nèi)的所有檔案也是數(shù)據(jù);公司的各種設(shè)計圖紙也是數(shù)據(jù);出土文物上的文字、圖示也都是數(shù)據(jù)。人類發(fā)明了文字,并記錄了人類活動并留傳后世,形成文明的傳承。以語言和文字形式存在的內(nèi)容是全世界各種信息處理中最重要的數(shù)據(jù),在20世紀(jì)90年代互聯(lián)網(wǎng)興起之后,數(shù)據(jù)的獲取變得非常容易。
接著作者區(qū)別了數(shù)據(jù)和信息。作者認(rèn)為,數(shù)據(jù)和信息還是稍有不同。信息是關(guān)于世界、人和事的描述,它比數(shù)據(jù)來得抽象。人的大腦是一個信息源,從思考到找到合適的語句,再通過發(fā)音說出來,是一個編碼的過程,經(jīng)過媒介如聲道、空氣、電話線和揚聲器等傳播到聽眾耳朵里,是經(jīng)過了一個長長的信道的信息傳播問題,最后聽話人把它聽懂,是一個解碼的過程。隨著人類的進步以及處理數(shù)據(jù)和信息的能力不斷增強,人類從數(shù)據(jù)中獲取有用信息的本事就越來越大,對數(shù)據(jù)和信息進行處理后,人類就可以獲得知識。知識比信息更高一個層次,也更加抽象,它具有系統(tǒng)性的特征。而數(shù)據(jù)是知識的基礎(chǔ)。只有善用數(shù)據(jù),我們才能得到數(shù)據(jù)背后的信息。數(shù)據(jù)中隱藏的信息和知識是客觀存在的,但是只有具有相關(guān)領(lǐng)域?qū)I(yè)知識的人才能將它們挖掘出來。人類文明的進程是伴隨著獲取數(shù)據(jù)——分析數(shù)據(jù)——建立模型——預(yù)測未知。雖然數(shù)據(jù)在文明進程中具有重大作用,但過去數(shù)據(jù)的作用常常被人們忽視。這里面有兩個原因,首先是由于過去數(shù)據(jù)量不足,積累大量的數(shù)據(jù)所需要的時間太長。其次,數(shù)據(jù)和所想獲得的信息之間的聯(lián)系通常是間接的,它要通過不同數(shù)據(jù)之間的相關(guān)性才能體現(xiàn)出來。
最后作者區(qū)別了數(shù)據(jù)和大數(shù)據(jù)。前面已經(jīng)說到數(shù)據(jù)的概念是指所有輸入到計算機并被計算機程序處理的符號的介質(zhì)的總稱。大數(shù)據(jù)則不僅僅是數(shù)據(jù)體量大并能及時獲得,同時還具有多維度、多樣性;全面性、完備性等特征。從現(xiàn)象中、觀察中總結(jié)出數(shù)據(jù),匯總數(shù)據(jù)并運用數(shù)據(jù),是衡量人類文明發(fā)展水平之一。隨人類進步以及處理數(shù)據(jù)和信息的能力不斷增強,人類從數(shù)據(jù)中獲取有用信息的本事就越來越大,這就是大數(shù)據(jù)應(yīng)用的基礎(chǔ)。數(shù)據(jù)在計算機時代記錄了人類的行為,靠計算機去發(fā)掘、分析而得出人類沒有寫明的,存在于多次重復(fù)的行為中的數(shù)據(jù)。這樣的行為,光有數(shù)據(jù)做不到,只有計算機也難成,只有兩者結(jié)合才能事成。這個加入計算機算法的數(shù)據(jù)稱之為大數(shù)據(jù)。計算機信息技術(shù)和電子移動設(shè)備使得我們可以從足夠多的數(shù)據(jù)中發(fā)現(xiàn)各種事物的相關(guān)性并把握事物發(fā)展的軌跡,并依靠大數(shù)據(jù)來提高對未來不確定性把控能力。采用大數(shù)據(jù)的方法能夠使計算機的智能水平大大提高,替代人類智能解決不了的許多問題。決定今后20年經(jīng)濟發(fā)展的是大數(shù)據(jù)和由之而來的智能革命。因此,從方法論的層面上看,大數(shù)據(jù)與三百年前產(chǎn)生的機械思維一樣,在大數(shù)據(jù)和機器智能大規(guī)模運用的情況下,會形成一種全新的思維模式即大數(shù)據(jù)思維,從而完成思維模式的一次革命。
大數(shù)據(jù)思維會帶來什么?
按照大數(shù)據(jù)思維模式,我們做事情的方式方法需要從根本上改變;仡櫄v史,展望未來,大數(shù)據(jù)引發(fā)的智能革命將是以一種全新的方式展開。蒸汽機、電氣化等技術(shù)革命都是生產(chǎn)力單點突破,從而帶動社會全面變革,今天的大數(shù)據(jù)正面臨這樣一個突破,大數(shù)據(jù)和機器智能的普及會帶來新一輪經(jīng)濟社會生活的全面變革。大數(shù)據(jù)思維所具有的解決不確定性的能力可以為經(jīng)濟社會發(fā)展有所作為。在大數(shù)據(jù)思維指導(dǎo)下,數(shù)據(jù)科學(xué)家可以把過去解決不了的問題,變成大數(shù)據(jù)問題來處理。溫故而知新。作者說,在歷史上,一項技術(shù)帶動整個社會的變革通常遵循一個公式,即現(xiàn)有產(chǎn)業(yè)+新技術(shù)=新產(chǎn)業(yè)。第一次工業(yè)革命是:現(xiàn)有產(chǎn)業(yè)+蒸汽機=新產(chǎn)業(yè);第二次工業(yè)革命是:現(xiàn)有產(chǎn)業(yè)+電氣化=新產(chǎn)業(yè);第三次工業(yè)革命是:現(xiàn)有產(chǎn)業(yè)+摩爾定律=新產(chǎn)業(yè);第四次工業(yè)革命將是:用兩個公式簡單概括,現(xiàn)有產(chǎn)業(yè)+大數(shù)據(jù)=新產(chǎn)業(yè),現(xiàn)有產(chǎn)業(yè)+機器智能=新產(chǎn)業(yè)。大數(shù)據(jù)思維將帶來一場新技術(shù)革命。大數(shù)據(jù)思維的核心是通過數(shù)據(jù)之間相關(guān)性的演算分析,取代機械思維下的因果推理,但大數(shù)據(jù)思維和原有的機械思維并非完全對立,它更多的是對后者的補充。是對邏輯思維辦不到的事情提供有益的補充,消除事物的不確定性,從而解決問題。大數(shù)據(jù)和機器智能將從供給側(cè)推動許多新產(chǎn)業(yè)的誕生,帶動產(chǎn)業(yè)升級換代,滿足人類社會多樣化、個性化需求,導(dǎo)致我們整個社會的升級和變遷。
這本書給我們提了個醒,即將到來的大數(shù)據(jù)時代,無論國家還是個人都應(yīng)該建立大數(shù)據(jù)思維方式。跟上去則適者生存,掉下來則淘汰沒落。凡事預(yù)則立,不預(yù)則廢。據(jù)普華永道預(yù)測,到2030年,大數(shù)據(jù)和人工智能將為全世界國內(nèi)生產(chǎn)總值貢獻15.7萬億美元。數(shù)據(jù)是開發(fā)高級神經(jīng)系統(tǒng)的必要條件,有數(shù)據(jù)才有可能更好地理解語言、識別物體并提出有用的見解。中國是世界第一制造大國,同時還擁有8-9億網(wǎng)民、10億以上的智能手機使用者,它們產(chǎn)生的海量數(shù)據(jù)是世界獨一無二的,這樣的數(shù)據(jù)背景為大數(shù)據(jù)和機器智能在中國發(fā)展提供了巨大的優(yōu)勢條件;谶@種數(shù)據(jù)優(yōu)勢,我們在第四次工業(yè)革命中存在非常大的彎道超車機會。目前,在大數(shù)據(jù)和機器智能領(lǐng)域,中國與世界先進水平距離已縮短,有些方面還略微領(lǐng)先,比如金融移動支付等。因勢利導(dǎo)地用大數(shù)據(jù)思維完成中國新經(jīng)濟模式的變革是有完全可能的。在這種背景下讀讀《智能時代》一書,可以幫助我們更好理解即將到來的大數(shù)據(jù)思維新時代。
姜 洋
2020年6月22日