“大數(shu)據”似乎在一(yi)夜之間闖入了任何一(yi)個關于互聯網未來(lai)的(de)討論,成為一(yi)個炙(zhi)手可熱無所不(bu)包的(de)概念。但它(ta)是否真如許多IT行家們(men)所言,將成為信息技術(shu)領域(yu)又(you)一(yi)片蘊藏無限潛能(neng)的(de)處女地?還是只(zhi)是軟硬件(jian)巨頭們(men)為了賣(mai)出更多產品而吹出的(de)一(yi)個美麗泡沫(mo)?
正在大連(lian)舉(ju)行的(de)2013夏(xia)季(ji)達沃斯開(kai)辟(pi)專場(chang)(chang),以“大數據概念是否被過度炒作”為題,請四位(wei)嘉賓分(fen)成正反兩(liang)方(fang),展開(kai)一場(chang)(chang)激(ji)辯。穿梭于各場(chang)(chang)彬(bin)彬(bin)有(you)禮的(de)“清談會”之間的(de)聽者(zhe)們,步(bu)入這場(chang)(chang)辯論(lun)時(shi),無不感(gan)到意(yi)外之喜,目擊(ji)到一場(chang)(chang)有(you)趣又有(you)料的(de)意(yi)見交鋒。
持正(zheng)方(fang)觀(guan)(guan)點(dian)(dian),即(ji)“大(da)數據已被過度炒(chao)作(zuo)”觀(guan)(guan)點(dian)(dian)的,出人意料(liao)地,是四(si)位(wei)嘉賓中(zhong)更年輕、更接(jie)近“技術宅(zhai)男”的兩位(wei),其中(zhong)一位(wei)是美國(guo)Kaggle公司(si)總裁兼首席科學(xue)家JeremyHoward,另一位(wei)是加(jia)納MPedigree網(wang)絡公司(si)總裁Bright Simons。持反方(fang)觀(guan)(guan)點(dian)(dian),為大(da)技術時代的到來歡呼(hu)的,一位(wei)是北京大(da)學(xue)光(guang)華管理學(xue)院新(xin)媒體營(ying)銷(xiao)研究中(zhong)心(xin)副主任蘇萌,另一位(wei)是日本(ben)(ben)政治家、內(nei)閣成員山本(ben)(ben)一太。
在辯論之前,主(zhu)持(chi)人(ren)先作(zuo)了一次現(xian)場調查(cha),同意“大數據是(shi)過度炒作(zuo)”的聽眾稍占(zhan)上風,占(zhan)比54.5%。聽眾被(bei)告(gao)知(zhi),在辯論結束(shu)后還會(hui)再來一輪投(tou)票,四位(wei)嘉賓的任(ren)務就是(shi)盡可能留住(zhu)支持(chi)者,讓對方(fang)陣(zhen)營倒戈。
辯論(lun)開(kai)(kai)始(shi),正方嘉賓、科(ke)學(xue)家(jia)Howard起(qi)身(shen)(shen)走近聽(ting)眾席,一(yi)句話亮明觀點:數據(ju)不在(zai)多,而在(zai)怎么用。他(ta)(ta)提出“一(yi)臺電腦論(lun)”,即科(ke)學(xue)家(jia)們(men)研究所需的數據(ju),最(zui)好用一(yi)臺電腦就能裝下,否則數據(ju)處理會過于繁瑣(suo),無(wu)助于解決(jue)問題。他(ta)(ta)結(jie)合自身(shen)(shen)經驗說,隨著數據(ju)量(liang)的增大(da),研究的準確(que)性(xing)一(yi)開(kai)(kai)始(shi)會隨之上升,但很快就會趨(qu)平。
“舉(ju)個例子(zi),如果(guo)我(wo)們(men)把所有《星球大戰》鐵桿粉絲的數(shu)據拿來研究,就一定(ding)能準確地判斷(duan)出(chu)他(ta)們(men)中誰(shui)會喜(xi)歡《魔(mo)戒(jie)》嗎?我(wo)們(men)發現并非(fei)如此。”
反方嘉賓、北大的蘇(su)萌教授起身應(ying)戰(zhan)。他(ta)請大家原諒(liang),“為(wei)了更流暢地表達觀點,我還(huan)是用中文”,引來聽眾理解(jie)的笑聲。他(ta)說,大數(shu)據(ju)(ju)剛剛露出冰山(shan)一角,在金融、零售(shou)等領(ling)域的運用上(shang),還(huan)遠未釋放它的潛(qian)能(neng)。這有(you)三個原因:一是因為(wei)不(bu)同(tong)機構間的數(shu)據(ju)(ju)還(huan)未真(zhen)正流動起來,目前(qian)還(huan)只是數(shu)據(ju)(ju)“孤島”;二是完整的生態產業(ye)鏈還(huan)未形成,盡管通過行為(wei)數(shu)據(ju)(ju)分析(xi)已能(neng)夠分辨出一個消(xiao)費者的喜(xi)好,但從供應(ying)到購買的鏈條還(huan)沒(mei)建成;三是因為(wei)數(shu)據(ju)(ju)分析(xi)人才仍然極(ji)度匱乏。
他說(shuo),15年前,很(hen)多人(ren)認(ren)(ren)為(wei)互(hu)聯(lian)網是(shi)泡(pao)沫(mo)(mo),今天證明互(hu)聯(lian)網沒被高估,5年前,很(hen)多人(ren)認(ren)(ren)為(wei)電子商務是(shi)泡(pao)沫(mo)(mo),但今天中國已經(jing)有3億人(ren)的電商市場,我們還有什么理由說(shuo)大數(shu)據只是(shi)泡(pao)沫(mo)(mo)呢?聽眾席上點頭(tou)頻頻,現(xian)實顯然(ran)頗具說(shuo)服力。
正(zheng)方(fang)嘉賓,來自非洲加納的(de)Simons急于扳回(hui)局(ju)面,拋出一(yi)個引(yin)人思索(suo)的(de)問(wen)題(ti):“請問(wen),我們現在真的(de)有(you)什(shen)么問(wen)題(ti),是靠大(da)數(shu)據才能解決(jue),而靠現在技術解決(jue)不了的(de)?”
他(ta)說,大數據不(bu)僅分散了人(ren)們的注意(yi)力,甚至是(shi)“危(wei)險”的,因為(wei)海量數據意(yi)味著決策(ce)制定將更(geng)加“集權化(hua)”,而(er)科學(xue)本身(shen)是(shi)應當(dang)以人(ren)為(wei)本,強調(diao)自主性的。他(ta)以多年前他(ta)在一家英國銀(yin)行開(kai)(kai)戶的經(jing)歷作為(wei)例子:一開(kai)(kai)始他(ta)與銀(yin)行客戶經(jing)理面(mian)對面(mian)聊天,對方(fang)認為(wei)他(ta)完全符合開(kai)(kai)戶條件,可當(dang)把他(ta)的所有信(xin)息輸入電腦之后,電腦卻拒絕了他(ta)的開(kai)(kai)戶申請,而(er)他(ta)至今不(bu)知道(dao)自己為(wei)什(shen)么被(bei)拒。
“大數據意味著人們將不(bu)再運用自(zi)己(ji)的智慧、問(wen)真正(zheng)該問(wen)的問(wen)題(ti),”Simons說。“最(zui)后我想(xiang)說,小(xiao)才是美。”
聽(ting)眾們顯然(ran)有所觸動(dong),天平似乎又(you)重新傾斜。
最后(hou)出(chu)場的(de)是(shi)反方(fang)辯手、日(ri)本(ben)(ben)內閣大臣山本(ben)(ben)一太。曾是(shi)搖(yao)滾(gun)音樂人的(de)他十分懂得調動氣氛,鄭重宣稱,由(you)于(yu)強敵當前,所以(yi)也決定臨時(shi)變更(geng)計(ji)劃(hua),改用(yong)日(ri)語,再度引來笑(xiao)聲。他為支持(chi)大數據(ju)(ju)拿出(chu)的(de)“殺手锏”是(shi)——東京申(shen)(shen)奧成功的(de)“奧秘”。他說,日(ri)本(ben)(ben)民眾(zhong)最初(chu)對申(shen)(shen)辦奧運的(de)支持(chi)率只(zhi)有不到(dao)60%,但日(ri)本(ben)(ben)政府(fu)成功利用(yong)社交媒體和(he)數據(ju)(ju)分析,向公眾(zhong)傳遞(di)支持(chi)申(shen)(shen)奧的(de)訊息,最終將(jiang)支持(chi)率提升到(dao)80%以(yi)上。另外,在(zai)自然災害頻發(fa)的(de)日(ri)本(ben)(ben),大數據(ju)(ju)也早已(yi)在(zai)防災減災上發(fa)揮(hui)作用(yong)。
兩(liang)輪交鋒下來,賽程過半,雙(shuang)方似乎勢均力(li)敵(di)。主持人接著請(qing)聽(ting)眾(zhong)來挑戰雙(shuang)方辯(bian)手。
一位聽眾挑戰正方,說,你們認為大數據過(guo)于龐(pang)雜紛繁,反(fan)而(er)解(jie)決不(bu)了問題(ti),那是(shi)不(bu)是(shi)說,當處理數據的計(ji)算(suan)工具(ju)變得(de)足夠好時,大數據就(jiu)會(hui)變得(de)有用?
一位插畫師在辯論現場所作,用圖文方式概括了正反兩方觀點
科學家Howard重復了“一臺(tai)電腦(nao)論”,強調數據不是越多(duo)越好(hao),而是恰到好(hao)處(chu)才好(hao),但似(si)乎(hu)沒能拿出更(geng)有說服力的論據。
一位(wei)聽(ting)眾挑戰反方(fang),問(wen):眼下的(de)(de)大(da)(da)數(shu)據熱,是由(you)真(zhen)實的(de)(de)需(xu)求驅動的(de)(de)嗎(ma)?還是IT企業的(de)(de)噱頭?決策(ce)制定真(zhen)的(de)(de)要靠(kao)大(da)(da)數(shu)據嗎(ma)?
蘇萌教授一語中的(雖然似(si)乎有些偷換概(gai)念):“不(bu)靠(kao)數據,難道(dao)靠(kao)直覺(jue)嗎?”
一位聽眾再次挑戰反方:幾年前愛(ai)沙尼亞(ya)遭到黑客攻(gong)擊(ji),由于該(gai)國(guo)政府部門和私營部門的數據集(ji)中存放(fang),網絡(luo)攻(gong)擊(ji)導致該(gai)國(guo)幾乎全面癱瘓,這個(ge)事件是(shi)不是(shi)說明,大(da)數據會讓網絡(luo)安全變(bian)得更加(jia)脆弱?
山(shan)本回答:的(de)確如此,但各國都(dou)已(yi)高度重視網絡安全(quan),技術進步也會讓(rang)這個問題找(zhao)到答案。
蘇萌最后總結道:所(suo)有新鮮(xian)事物(wu)都需要(yao)一定(ding)的(de)(de)泡沫,才(cai)能(neng)吸引到更(geng)多的(de)(de)投資(zi)和關(guan)注,最終(zhong)才(cai)能(neng)讓真正好的(de)(de)東西(xi)沉淀(dian)下來。
辯(bian)論結(jie)束,主持(chi)人再度請現場聽眾投票,反方成功逆轉(zhuan),支持(chi)率上升(sheng)到57.1%。蘇萌與(yu)山本興奮(fen)地(di)擊(ji)掌(zhang)歡呼。
這場短(duan)短(duan)的交鋒,顯然只(zhi)是大(da)數據(ju)之爭(zheng)的一個微(wei)小(xiao)縮影,也無法給出是或(huo)非的答案,但足以激發聽(ting)眾的思考。正(zheng)如Howard在發表“失敗感言”時(shi)所說,“我們(men)并非反對數據(ju),只(zhi)是反對大(da)而(er)無當的數據(ju),數據(ju)本身當然非常(chang)重要”。人類已(yi)經并將繼續產生(sheng)日益龐大(da)的數據(ju),或(huo)許不論(lun)我們(men)接受(shou)與否,大(da)數據(ju)時(shi)代(dai)都已(yi)到來。如何利用(yong)它(ta)造福人類,才是最為關鍵的問題。