編者按:SharpestMinds聯(lián)合創(chuàng)始人Jeremie Harris分享了申請(qǐng)數(shù)據(jù)科學(xué)家職位的經(jīng)驗(yàn)。
我仍然記得我兄弟決定賣出他的比特幣的時(shí)刻。那是2017年,當(dāng)時(shí)我們?cè)谛前涂恕N覀兣龅搅艘粋€(gè)發(fā)傳單的中年婦女。傳單開(kāi)頭用黑體印著“比特幣:通向提前退休的道路”。
當(dāng)時(shí)我挺好奇的,就問(wèn)了她對(duì)加密貨幣市場(chǎng)的看法,結(jié)果發(fā)現(xiàn)她對(duì)比特幣以外的其他加密貨幣幾乎一無(wú)所知。以太坊?“從來(lái)沒(méi)聽(tīng)說(shuō)過(guò)。”萊特幣?“那是廉價(jià)版的比特幣,是吧?”
從經(jīng)驗(yàn)上說(shuō),如果毫無(wú)頭緒的中年婦女都在當(dāng)?shù)氐男前涂讼蚰阈麄髯钚碌募夹g(shù)趨勢(shì),你大概正接近不實(shí)宣傳的高峰,或者“泡沫”。
當(dāng)然這算不上什么新發(fā)現(xiàn)。每個(gè)人都同意,投資的時(shí)候如果你做的和其他所有人都一樣,那你不太可能得到多少回報(bào)。很奇怪的一點(diǎn)是,人們沒(méi)能在投資自身上應(yīng)用同一推理。
假設(shè)你想要應(yīng)聘數(shù)據(jù)科學(xué)家職位。如果你做的全是標(biāo)準(zhǔn)的“我想要成為一位數(shù)據(jù)科學(xué)家”事情,那么這就意味著你不應(yīng)該期望得到夢(mèng)想的工作。目前市場(chǎng)已經(jīng)充斥了初級(jí)水平的人員,因此,處于中位數(shù)水平的新手?jǐn)?shù)據(jù)科學(xué)家不太可能得到太多認(rèn)同。所以,你如果想要避免中位數(shù)的結(jié)果,為什么要做中位數(shù)的事?
問(wèn)題在于,大多數(shù)人開(kāi)始他們的數(shù)據(jù)科學(xué)之旅時(shí)不是這么想的。我在SharpestMinds工作的時(shí)候和數(shù)百名新手?jǐn)?shù)據(jù)科學(xué)家聊過(guò),其中大約80%的人告訴我的都差不多:
首先,他們學(xué)一些基礎(chǔ)(Python + sklearn + Pandas,也許還學(xué)點(diǎn)別的,比如SQL)
接著,他們參加了千篇一律的MOOC課程
他們讀了一些工作描述,擔(dān)心不符合條件
也許去參加另一門MOOC,也許開(kāi)始申請(qǐng)工作
沒(méi)有收到任何回音(或者,最好的情況下,參加了一些面試,全搞砸了)
變得很沮喪,考慮是不是去讀個(gè)碩士,或者再申請(qǐng)一些工作
到了抉擇的時(shí)刻了:該不該重復(fù)第2-7步直到發(fā)生了不同的事情?
如果這符合你的情況,那么很可能你也處在一個(gè)自我提升的泡沫中:你正在做所有其他人都在做的事,但期望得到不同的結(jié)果。你需要做一件事:停下來(lái)。
如果你期望超出平均水平的結(jié)果,那么你不能做平均水平的事情。但是,想要避免平均水平的事,你需要知道什么是平均水平的事。
這里是一些例子:如果你需要參加一個(gè)MOOC課程學(xué)習(xí)一些基礎(chǔ),那很好。但不要陷入MOOC螺旋:MOOC,從定義上來(lái)說(shuō),基本上都是為平均水平的人設(shè)計(jì)的。所以你并不會(huì)因?yàn)樯狭硕嚅TMOOC就成為一個(gè)突出的人。類似地,如果你的GitHub上有4到5個(gè)Jupyter notebook,內(nèi)容都是乏味的sklearn/Pandas/seaborn/Keras技術(shù)棧,不要再做一個(gè)新的了。
總的規(guī)則是:如果有一件事看起來(lái)是明顯的下一步,因?yàn)樗衅渌硕歼@么做,這是一件很好的不去做的事。相反,你需要找到其他人不做的事,并且盡快去做。
那是些什么樣的事情?根據(jù)我的經(jīng)歷,我想到5件:
復(fù)現(xiàn)論文。如果你是深度學(xué)習(xí)愛(ài)好者,這一點(diǎn)尤其重要。人們不做這事,因?yàn)檫@比獲取一個(gè)數(shù)據(jù)集,然后使用簡(jiǎn)單的人工神經(jīng)網(wǎng)絡(luò)或XGBoost進(jìn)行千篇一律的分類要難。在arXiv上找一篇和你的領(lǐng)域相關(guān)的最有趣的論文(最近的論文最理想),閱讀它,理解它。接著,復(fù)現(xiàn)它,可能是在一個(gè)新的數(shù)據(jù)集上復(fù)現(xiàn)。寫篇博客總結(jié)這次復(fù)現(xiàn)。
不要呆在舒適區(qū)。如果你開(kāi)始一個(gè)新項(xiàng)目,最好學(xué)習(xí)一些新框架/庫(kù)/工具。如果你正創(chuàng)建第6個(gè)Jupyter notebook,開(kāi)頭是df = pd.read_csv(filename),結(jié)尾是f1 = f1_score(y_true, y_pred),是時(shí)候改變你的策略了。
學(xué)習(xí)枯燥的東西。其他人不做這事,因?yàn)闆](méi)人喜歡枯燥的東西。但是,學(xué)習(xí)正確的Git流程,如何使用Docker,如何使用Flask搭建一個(gè)應(yīng)用,如何部署模型至AWS或Google Cloud,這些都是公司很盼望申請(qǐng)人具備的技能,但大多數(shù)申請(qǐng)人低估了這些技能的重要性。
做頭疼的事情。1) 爭(zhēng)取在當(dāng)?shù)氐臄?shù)據(jù)科學(xué)聚會(huì)上講篇論文。或者,最起碼,參加當(dāng)?shù)氐臄?shù)據(jù)科學(xué)聚會(huì)。2) 給LinkedIn上的人發(fā)冷消息。試著首先提供一些價(jià)值(“我剛發(fā)現(xiàn)了你網(wǎng)站上的一個(gè)筆誤”)。不要直接向他們請(qǐng)求一份工作。你的請(qǐng)求越具體越好(“我希望你能給我的博客文章一點(diǎn)反饋”)。你正試圖建立關(guān)系,拓展你的網(wǎng)絡(luò),那需要耐心。3) 參加會(huì)議和組織。4) 創(chuàng)辦一個(gè)學(xué)習(xí)小組。
做看起來(lái)瘋狂的事情。每個(gè)人都用UCI倉(cāng)庫(kù),或者使用某個(gè)股票數(shù)據(jù)集(沒(méi)勁)來(lái)創(chuàng)建他們的項(xiàng)目。別這么做。學(xué)習(xí)如何使用一個(gè)網(wǎng)頁(yè)抓取庫(kù),或者某個(gè)被低估的API創(chuàng)建自己的定制數(shù)據(jù)集。數(shù)據(jù)很難獲取,公司常常需要依靠工程師收集數(shù)據(jù)。你的目標(biāo)是成為那種癡迷數(shù)據(jù)科學(xué)的瘋子,如果工作需要,會(huì)自己創(chuàng)建該死的數(shù)據(jù)集。
這些策略都是一種在雇主每天面對(duì)的噪聲中突出自己的方法。它們都不是銀彈,但它們是在數(shù)據(jù)科學(xué)工作市場(chǎng)上得到更多認(rèn)同,成為更能干的數(shù)據(jù)科學(xué)家的萬(wàn)無(wú)一失的方法。
最后,記住,培養(yǎng)自己的技能是對(duì)自身的投資。那意味著適用于投資的經(jīng)濟(jì)學(xué)原則同樣適用于此:如果你想要突出的結(jié)果,那么你需要做突出的事情。
如果你對(duì)如何優(yōu)化自己的機(jī)器學(xué)習(xí)或數(shù)據(jù)科學(xué)軌跡存有疑問(wèn),我很樂(lè)意和你聊聊。在Twitter上給我(jeremiecharris)發(fā)DM :)
-
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122794 -
數(shù)據(jù)科學(xué)
+關(guān)注
關(guān)注
0文章
168瀏覽量
10489
原文標(biāo)題:想當(dāng)數(shù)據(jù)科學(xué)家,可別隨大流!
文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
地物光譜儀如何幫助科學(xué)家研究植被和土壤?

云天勵(lì)飛董事長(zhǎng)陳寧當(dāng)選深圳市青年科學(xué)家協(xié)會(huì)第十屆會(huì)長(zhǎng)

我國(guó)科學(xué)家制備出可控手性石墨烯卷
NVIDIA RAPIDS cuDF如何賦能AI加速數(shù)據(jù)科學(xué)
深開(kāi)鴻亮相“小小科學(xué)家”品牌發(fā)布暨科學(xué)探索研學(xué)營(yíng)開(kāi)營(yíng)活動(dòng)

AI 推動(dòng)未來(lái)科學(xué) 晶泰科技共襄未來(lái)科學(xué)大獎(jiǎng)周

西湖大學(xué):科學(xué)家+AI,科研新范式的樣本

華為自動(dòng)駕駛科學(xué)家陳亦倫投身具身智能創(chuàng)業(yè)
螞蟻集團(tuán)收購(gòu)邊塞科技,吳翼出任強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)室首席科學(xué)家
AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得
上海科學(xué)家精準(zhǔn)操控原子“人造”藍(lán)寶石 為低功耗芯片研制開(kāi)辟新路
科學(xué)家開(kāi)發(fā)出首臺(tái)可見(jiàn)光飛秒光纖激光器

受人眼啟發(fā)!科學(xué)家開(kāi)發(fā)出新型改良相機(jī)

評(píng)論