數(shù)據(jù)科學(xué)家可能成為2015年最熱門(mén)職業(yè)
摘要:有報(bào)告稱(chēng),數(shù)據(jù)科學(xué)家的平均年薪為11.9萬(wàn)美元,而程序員的平均年薪為6.5萬(wàn)美元,差距由此可見(jiàn)。數(shù)據(jù)科學(xué)家在美國(guó)非?;?,不僅谷歌、亞馬遜等高科技公司需要數(shù)據(jù)科學(xué)家,那些非高科技公司沃爾瑪?shù)纫残枰?/p>
你擅長(zhǎng)數(shù)學(xué),會(huì)用Python編程,而且還對(duì)某個(gè)行業(yè)了如指掌?
如果你擁有這樣的技能集,那你就有可能當(dāng)上數(shù)據(jù)科學(xué)家。而如果你當(dāng)上了數(shù)據(jù)科學(xué)家,那你的日子就可以過(guò)得風(fēng)風(fēng)光光了——LinkedIn的最新投票結(jié)果顯示,“統(tǒng)計(jì)分析和數(shù)據(jù)挖掘” 是2014年最大的求職法寶。美國(guó)招聘網(wǎng)站Glassdoor的報(bào)告稱(chēng),數(shù)據(jù)科學(xué)家的平均年薪為118709美元(約合人民幣737550元),而程序員的平均年薪為64537美元(約合人民幣400974元)。麥肯錫公司的一份研究預(yù)測(cè)稱(chēng),到2018年,在“具有深入分析能力的人才”方面,美國(guó)可能面臨著14萬(wàn)到19萬(wàn)的缺口,而“可以利用大數(shù)據(jù)分析來(lái)做出有效決策的經(jīng)理和分析師” 缺口則會(huì)達(dá)到150萬(wàn)。該領(lǐng)域目前異?;鸨?,紐約大學(xué)數(shù)據(jù)科學(xué)中心課程的負(fù)責(zé)人羅伊-洛倫斯(Roy Lowrance)表示,現(xiàn)在可能已經(jīng)到了巔峰期。“也許存在著泡沫,” 他說(shuō)。 “無(wú)論什么事情,一旦變得這樣火爆,之后就肯定就會(huì)冷下來(lái)?!辈贿^(guò),紐約大學(xué)希望在未來(lái)幾年里擴(kuò)大數(shù)據(jù)科學(xué)課程的招生規(guī)模,把學(xué)生人數(shù)從40名增加到60名。本學(xué)年還有五個(gè)月才會(huì)結(jié)束,但50%到75%的學(xué)生已經(jīng)找到了比較理想的工作。為什么該領(lǐng)域會(huì)變得如此火爆?琳達(dá)-博奇(Linda Burtch)是芝加哥的獵頭公司博奇工程的董事總經(jīng)理,她表示,盡管像谷歌、亞馬遜、Netflix和Uber這樣的高科技公司都有自己的數(shù)據(jù)科學(xué)團(tuán)隊(duì),但那些非高科技公司,比如Neiman Marcus、沃爾瑪、Clorox和Gap,它們現(xiàn)在也需要使用這方面的人才,“很多公司都在物色數(shù)據(jù)科學(xué)家,”她說(shuō)。這些公司希望,數(shù)據(jù)科學(xué)專(zhuān)業(yè)人才可以挖掘新的信息,來(lái)幫助公司開(kāi)源節(jié)流。IBM負(fù)責(zé)大數(shù)據(jù)業(yè)務(wù)的副總裁Anjul Bhambhri表示,航空航天制造商Pratt & Whitney現(xiàn)在可以預(yù)測(cè)出飛機(jī)發(fā)動(dòng)機(jī)何時(shí)需要進(jìn)行維護(hù),準(zhǔn)確率達(dá)到97%,這可以幫助它更加有效地開(kāi)展業(yè)務(wù)。雖然IBM在本月剛剛推出了基于云計(jì)算的Watson Analytics免費(fèi)增值工具,但是,為了分析非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)科學(xué)家常常不得不親自動(dòng)手編寫(xiě)專(zhuān)門(mén)的軟件程序,這正是數(shù)據(jù)科學(xué)家必須掌握編程技巧的一個(gè)原因。學(xué)校教育洛倫斯說(shuō),數(shù)據(jù)科學(xué)家需要具備三項(xiàng)基本技能:數(shù)學(xué)/統(tǒng)計(jì)、計(jì)算機(jī)能力、在特定業(yè)務(wù)領(lǐng)域的知識(shí)。紐約大學(xué)數(shù)據(jù)科學(xué)中心希望招收至少具備其中一種技能的學(xué)生,然后培養(yǎng)他們掌握其他技能,讓學(xué)生到畢業(yè)的時(shí)候,可以獨(dú)當(dāng)一面負(fù)責(zé)處理數(shù)據(jù)工作。 “在學(xué)習(xí)過(guò)程中,他們要做一些數(shù)據(jù)科學(xué)項(xiàng)目,這些項(xiàng)目需要他們用到這三種技能,”他說(shuō)。但是,如果你想成為一名數(shù)據(jù)科學(xué),也不一定非得去大學(xué)讀書(shū)才行。從今年9月開(kāi)始,一家名為梅蒂斯(Metis)的公司開(kāi)始在紐約舉辦為期十二周的數(shù)據(jù)科學(xué)訓(xùn)練營(yíng),費(fèi)用為1.4萬(wàn)美元。報(bào)名的人非常之多,入學(xué)競(jìng)爭(zhēng)相當(dāng)激烈。梅蒂斯公司的聯(lián)合創(chuàng)始人杰森-莫斯(Jason Moss)說(shuō),大約有一半的學(xué)生都擁有碩士或博士學(xué)位。第一期訓(xùn)練營(yíng)在12月初結(jié)束。莫斯說(shuō),不過(guò)幾周, 15名學(xué)生中就有6名拿到了聘用通知?!拔也徽J(rèn)為訓(xùn)練營(yíng)可以替代大學(xué)教育,”莫斯說(shuō)?!坝?xùn)練營(yíng)可以提供一條捷徑,讓你以最快的速度找到一份工作,但大學(xué)的目的不在于此。但我也不認(rèn)為你必須上大學(xué)才能成為一名數(shù)據(jù)科學(xué)家,”他說(shuō)。“有一種人,他們天生具有好奇心,有勇氣,有決心,總想把事情理出頭緒,他們?cè)谶@一行可以干得很好?!盇nmol Rajpurohit是一名獨(dú)立的數(shù)據(jù)科學(xué)家兼顧問(wèn),他說(shuō),做這一行工作最重要的素質(zhì)就是能夠快速學(xué)習(xí)東西?!芭c專(zhuān)長(zhǎng)于任何特定編程語(yǔ)言相比,泛型編程技巧遠(yuǎn)遠(yuǎn)更加重要,”他說(shuō)。 “在如今這個(gè)時(shí)代,技術(shù)的發(fā)展突飛猛進(jìn),語(yǔ)言會(huì)很快過(guò)時(shí),新的語(yǔ)言則將迅速普及。因此,學(xué)東西很快的人,會(huì)比單獨(dú)領(lǐng)域的專(zhuān)家更有前途。”洛倫斯說(shuō),他認(rèn)為,在某些技能方面,訓(xùn)練營(yíng)和網(wǎng)上課程可以為學(xué)習(xí)者提供很大的幫助。但在另外一些方面,它們的作用就就相對(duì)有限了。紐約大學(xué)的數(shù)據(jù)科學(xué)課程有一個(gè)優(yōu)勢(shì),就是可以按照正確的先后順序來(lái)培養(yǎng)你的技能?!拔覀兊慕虒W(xué)順序可以讓你循序漸進(jìn)、融會(huì)貫通地掌握技能?!彼f(shuō)。數(shù)據(jù)科學(xué)家要做哪些事?游戲公司Playstudios的數(shù)據(jù)科學(xué)家喬恩-格林伯格(Jon Greenberg)說(shuō):“在日常工作中,我需要管理一系列控制面板,它們提供的信息可以讓公司知道,我們的生意到底做得怎么樣? 用戶(hù)在做什么事情?”格林伯格現(xiàn)在是一名經(jīng)理了,所以他編程的時(shí)候沒(méi)有以往那么多,但是他有時(shí)候仍然需要編程。通常來(lái)說(shuō),他把數(shù)據(jù)從Apache Hadoop的存儲(chǔ)器里調(diào)取出來(lái),在分析平臺(tái)Revolution R上運(yùn)行它,并對(duì)它進(jìn)行一些可視化處理。 “比如說(shuō),我們可以從中得知一部分用戶(hù)如何與新推出的功能互動(dòng),”他解釋說(shuō)。六年前,格林伯格拿到了統(tǒng)計(jì)學(xué)的碩士學(xué)位。他希望進(jìn)入政府部門(mén)工作,但卻驚訝地發(fā)現(xiàn),公司企業(yè)非常需要數(shù)據(jù)科學(xué)家。 “那個(gè)時(shí)候,數(shù)據(jù)科學(xué)領(lǐng)域還沒(méi)有現(xiàn)在這么火爆,,”他說(shuō)?,F(xiàn)在,他每天都能從獵頭那里收到一個(gè)電話(huà)或一封郵件。 “這種情況不只是發(fā)生在我身上,”他說(shuō)。“所有的數(shù)據(jù)科學(xué)家可能都是這樣?!睂?duì)于格林伯格來(lái)說(shuō),就業(yè)機(jī)會(huì)很好只是一個(gè)加分項(xiàng),因?yàn)樗緛?lái)就熱愛(ài)這一行。 “我認(rèn)為,要做數(shù)據(jù)科學(xué)工作,你必須得有分析頭腦才行,而且還得有好奇心,”他說(shuō)?!澳惚仨毜糜徐`活性和創(chuàng)造性,構(gòu)思出不同的方法來(lái)解決問(wèn)題?!边@項(xiàng)工作的唯一缺點(diǎn),格林伯格說(shuō),就是“清潔”數(shù)據(jù)(去掉那些沒(méi)有相關(guān)性的結(jié)果)需要花費(fèi)大量時(shí)間。“這部分任務(wù)并不是那么招人喜歡,你得花很多時(shí)間來(lái)做它?!彼f(shuō)。Rajpurohit說(shuō),他花了很多精力來(lái)清潔數(shù)據(jù)和做研究。 “我很大一部分時(shí)間都花在做研究上,因?yàn)槲医?jīng)常會(huì)遇到全新的問(wèn)題,因此,我需要研究特定領(lǐng)域最新文獻(xiàn),或者是找找專(zhuān)家,聽(tīng)聽(tīng)他們?cè)谶@方面的看法,”他說(shuō)?!氨M管數(shù)據(jù)科學(xué)這個(gè)名字和藝術(shù)毫不沾邊,但是你需要把藝術(shù)和科學(xué)很好地結(jié)合起來(lái)??茖W(xué)的部分很明顯——數(shù)學(xué),程序設(shè)計(jì)等等。但藝術(shù)部分是同樣重要——?jiǎng)?chuàng)造力,對(duì)語(yǔ)境有著深刻的理解。把這兩部分結(jié)合在一起,你就會(huì)變得善于解決問(wèn)題?!北M管如此,Rajpurohit也承認(rèn),數(shù)據(jù)科學(xué)并不像眼下很多人以為的那樣善良迷人。這個(gè)領(lǐng)域確實(shí)是在變得越來(lái)越重要,而且也出現(xiàn)了很多高薪機(jī)會(huì),但在數(shù)據(jù)科學(xué)家需要做的日常工作中,有很多其實(shí)都很枯燥。你是當(dāng)數(shù)據(jù)科學(xué)家的料嗎?每天花大量時(shí)間來(lái)編程,分析控制面板上的數(shù)據(jù),獲得相關(guān)信息,如果你對(duì)這樣的工作感興趣,那么你可能就適合干這一行。但如果你僅僅是想拿高工資,那么你可能就會(huì)覺(jué)得這樣的日子過(guò)起來(lái)苦不堪言。你要知道:真正適合干這一行的人,常常會(huì)在業(yè)余時(shí)間里編寫(xiě)程序,分析數(shù)據(jù),而他們這樣做只是為了自?shī)首詷?lè)。亞當(dāng)-弗洛葛爾(Adam Flugel)是博奇公司的數(shù)據(jù)科學(xué)招聘獵頭,他談到了最近遇到的一名候選人。此人擁有博士學(xué)位,今年秋天將去電藝公司(Electronic Arts)工作?!罢嬲屗摲f而出的是優(yōu)勢(shì)是,他在空閑時(shí)間也做這種事情,而且純粹就是為了好玩,”弗洛葛爾說(shuō)?!八嵌嗳嗽诰€(xiàn)游戲世界《坦克世界大戰(zhàn)》的玩家,領(lǐng)導(dǎo)著一個(gè)玩家團(tuán)隊(duì)。于是他編寫(xiě)了一個(gè)從游戲服務(wù)器抓取數(shù)據(jù)的程序,然后進(jìn)行數(shù)據(jù)分析,評(píng)估自己團(tuán)隊(duì)的表現(xiàn)。然后他利用這些信息來(lái)弄清應(yīng)該如何調(diào)整自己的戰(zhàn)略,應(yīng)該招收哪些類(lèi)型的成員,才能提升團(tuán)隊(duì)的整體表現(xiàn)?!彼?,如果你愛(ài)的并不是數(shù)據(jù)本身,而是它可以給你帶來(lái)的高薪,那么你會(huì)發(fā)現(xiàn),自己很難與那樣的人競(jìng)爭(zhēng)。但是博奇說(shuō),每個(gè)人都應(yīng)該學(xué)會(huì)熱愛(ài)數(shù)據(jù),即便只是為了自己事業(yè)前途著想,也該這樣做。 “十年之內(nèi),如果你不是數(shù)據(jù)大咖,你就別想升到‘首席XX官’的位置上”博奇說(shuō)。但是像史蒂夫-喬布斯、比爾-蓋茨那樣的情況又怎么解釋呢?他們擁有遠(yuǎn)見(jiàn)卓識(shí),并沒(méi)有陷入數(shù)據(jù)科學(xué)的細(xì)枝末節(jié)之中?!澳鞘?0年前的事了,”博奇說(shuō)。 “我說(shuō)的是未來(lái)10年?!?p/>