AI相關(guān)的算法崗位,競爭十分火熱,既內(nèi)卷又倒掛。
為幫助讀者在即將到來的2021春招中斬獲心儀offer,我們將整理一系列求職文章。
本文介紹騰訊、百度、滴滴三家大廠NLP算法的最新面試經(jīng)驗,其中前兩家公司給了ssp offer。
騰訊TEG實習
視頻一面
1、自我介紹
自我介紹即開場白需要提前準備并多次練習,內(nèi)容不用太多,言簡意賅地講清楚學校、專業(yè)、研究方向,概括介紹實習/論文/比賽等亮點即可,細節(jié)可以根據(jù)面試官的興趣再深入。
2、項目/實習經(jīng)歷
這部分主要根據(jù)簡歷上的實習/項目進行,可能會問背景、怎么做、為什么這樣做、最終結(jié)果、是否成功上線等,再深挖一些技術(shù)細節(jié),或順帶考察ML、DL等知識點。
由于校招同學沒有工作經(jīng)驗,所以項目和實習是展示自身能力的最好亮點(一堆CCF-A的大佬請忽略并接受我的膝蓋)。面試官可以從介紹中了解你的工程能力、抗壓能力、溝通能力、思維方式等等,如果吸引到面試官肯定能加分,要是面試官覺得索然無味估計面試也就到這兒了...
所以對于簡歷上的內(nèi)容要滾瓜爛熟,能知其然知其所以然最佳。如果問到簡歷上的內(nèi)容沒答上或吞吞嗚嗚,將非常打臉,造成硬傷(簡歷上自己寫的都不會,別的還用問嗎╮( ̄▽ ̄)╭)。
切忌在簡歷上洋洋灑灑地寫“熟悉Xgboost、SVM、Bayes、HMM、CRF、KNN、LR、CNN、Attention等算法”。是聽過名字就算熟悉?還是啃過源碼、理解背后原理?即便真的對這些算法理解透徹,最好也能結(jié)合例子來說明,而不是窮舉。
而對于沒有項目/實習/比賽經(jīng)歷的同學,這一部分時間只能由考察基礎(chǔ)算法來彌補了,這樣一來隨機性、難度都提升了不少;所以平時盡可能多積累這方面的經(jīng)驗,讓簡歷充實起來。
“項目 or 實習 or 比賽 or 論文”最好為真,這是底線。
3、介紹一個比賽
我從簡歷上3個比賽中,選擇了一個最有亮點的比賽,從數(shù)據(jù)、模型、提分trick三方面做了介紹。
4、如何實現(xiàn)知識蒸餾,loss怎么選擇
5、介紹TinyBert的工作原理
6-9考察機器學習基礎(chǔ)
6、LR是線性模型嗎,為什么?
7、梯度下降和隨機梯度下降的區(qū)別
8、GBDT和XGBoost的區(qū)別(至少3方面)
9、偏差和方差的區(qū)別
10-11考察深度學習基礎(chǔ)
10、怎么理解XLNet的,XLNet的輸入是什么?
11、一個二分類任務(wù),假設(shè)只有一個維度的特征,取值范圍是0~正無窮,如何實現(xiàn)二分類?
12、手撕代碼:兩個數(shù)組求交集
只能使用 list,如果要用其他數(shù)據(jù)結(jié)構(gòu)(比如字典)需要自己實現(xiàn);時間復雜度盡可能低。
騰訊一面難度中規(guī)中矩,量比較多但基本都在考察基礎(chǔ)。
關(guān)于手撕代碼,今年應(yīng)該是非常關(guān)鍵也是必做的環(huán)節(jié),很多公司直接將編程題作為通過面試與否的硬性指標。刷題要趁早!
電話二面
1、詢問兩個實習項目,詳細考察細節(jié)
2、介紹textcnn實現(xiàn)過程,池化時loss如何反向傳播
3、假如不用bert,一大堆文本有幾百萬個詞,直接訓練詞向量很困難,如何去做特征選擇
4、LSTM門控機制是怎樣的
5、LTSM主要解決了RNN什么問題,為什么能解決
6-9重點考察語言模型
6、介紹GPT2如何寫詩、寫對聯(lián)
7、GPT2如何圍繞一個主題/關(guān)鍵詞寫詩
8、ELMO、BERT、GPT模型彼此之間有什么區(qū)別
9、word2vec和ELMO主要有什么不同,為什么elmo效果更好
hr視頻面
1、詢問導師、實驗室的研究方向
2、智能客服系統(tǒng)中,你主要負責哪些模塊?
3、base在深圳能否接受,多久可以來實習?
面試結(jié)束后過了2天,成功收到TEG的offer call。
百度自然語言處理
視頻一面
1、手撕代碼:
給定一個字符串S和一個字符C。返回一個代表字符串S中每個字符到C的最短距離的數(shù)組。
# inputS="paddlepaddle",C='d'# output[2,1,0,0,1,2,2,1,0,0,1,2]
2、介紹簡歷上的2個項目和1個比賽
3、介紹bert和TinyBert
4、bert如何實現(xiàn)微調(diào)
5、fasttext的實現(xiàn)原理
6、文本匹配如何實現(xiàn)
7、手推信息增益、信息增益率、Gini指數(shù)公式
8、ngram如何過濾不合理的組合
9、還有什么想和我分享的?
面試官給了一個展現(xiàn)自我的機會,我介紹了一個最近在實驗室新做的項目(簡歷上沒有)。
視頻二面
1、手撕代碼:
word2vec負采樣具體怎么做的(知識點:累積概率分布、二分區(qū)間查找)
2、文本匹配怎么做
3、文本匹配不當分類來做,loss怎么設(shè)計?
4、bert在中文和英文場景下使用,有什么區(qū)別
5、介紹一下在開源組織CLUE的工作
6、假如給offer,什么時候能來實習
hr視頻面
聊個人特質(zhì)、看重公司哪些方面、個人職業(yè)規(guī)劃等
滴滴出行規(guī)劃
視頻一面
1、詳細介紹1個項目和1個比賽
面試官讓現(xiàn)場打開比賽鏈接查看排名和解決方案
2、手撕代碼:
因式分解
判斷年份是否為閏年
視頻二面
1、介紹1個項目
2、介紹transformer
3、介紹常用的聚類算法(KMeans、DBSCAN、Mean Shift)
4、介紹word2vec2種實現(xiàn)模型、區(qū)別以及和fasttext的區(qū)別
5、手撕代碼:并查集
視頻三面
1、介紹1個項目
2、手撕代碼:
兩個有序數(shù)組,求第k大,時間復雜度盡可能低(log(m+n))
總結(jié)
近兩年AI算法崗非常內(nèi)卷,加上疫情影響給找好工作都增加了難度。但身邊的朋友基本都在頭部大廠收獲了1+offer。實習和項目經(jīng)驗仍然很重要,ACL、NIPS等論文近些年在貶值。扎實的理論基礎(chǔ)和coding能力可以讓你進大廠后繼續(xù)保持足夠的競爭力。
手撕代碼是面試的一道坎,要早做準備。同時,盡可能把握住可以跳過筆試(大部分公司)的提前批面試。
祝大家在新的一年offer多多,好運連連。
責任編輯:xj
原文標題:騰訊、百度、滴滴最新NLP算法面經(jīng)
文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
百度
+關(guān)注
關(guān)注
9文章
2326瀏覽量
91831 -
騰訊
+關(guān)注
關(guān)注
7文章
1678瀏覽量
50141 -
自然語言處理
+關(guān)注
關(guān)注
1文章
628瀏覽量
14015 -
nlp
+關(guān)注
關(guān)注
1文章
490瀏覽量
22486
原文標題:騰訊、百度、滴滴最新NLP算法面經(jīng)
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
百度在AI領(lǐng)域的最新進展
上汽大眾與百度地圖達成戰(zhàn)略合作
百度成功點亮國內(nèi)首個昆侖芯三代萬卡集群
百度智能云點亮昆侖芯三代萬卡集群
百度百科啟動“繁星計劃”
百度正式回應(yīng)進軍短劇領(lǐng)域
百度世界2024大會發(fā)布創(chuàng)新產(chǎn)品:秒嗒與自由畫布
百度文心大模型日均調(diào)用量超15億
百度小度將發(fā)布AI智能眼鏡
百度云智大會開幕 三星攜手百度共探AI新機遇

評論