7月30日,2018騰訊廣告算法大賽決賽結(jié)果出爐:來自吉林大學(xué)、哈工大和北郵同學(xué)組建的“葛文強(qiáng)”隊(duì)奪得大賽冠軍,贏得30萬元獎(jiǎng)金!這次大賽賽題是Lookalike技術(shù),目的是幫助廣告主觸達(dá)最大化相似人群量級(jí),從而高效促進(jìn)營(yíng)銷目標(biāo)轉(zhuǎn)化。主辦方介紹,本屆參賽選手73%是學(xué)生團(tuán)隊(duì),C9院校參賽人數(shù)都超過了一百,競(jìng)爭(zhēng)非常激烈。
Lookalike,相似人群拓展的利器技術(shù),現(xiàn)在被騰訊廣告大賽玩出新水平。
7月30日,第二屆騰訊廣告算法大賽決賽舉辦,十支隊(duì)伍從超過2萬名選手中殺出重圍,進(jìn)入決賽現(xiàn)場(chǎng)。
決賽隊(duì)伍經(jīng)過高手過招、現(xiàn)場(chǎng)答辯之后,最終誕生出今年的冠軍“葛文強(qiáng)”隊(duì),獲得30萬獎(jiǎng)金等獎(jiǎng)勵(lì)。
除了冠軍選手外,騰訊公司副總裁、技術(shù)管理委員會(huì)主任王巨宏表示,本屆大賽參賽選手73%是學(xué)生團(tuán)隊(duì),C9院校都參加了算法大賽。
參賽選手云集的一個(gè)重要原因是騰訊海量資源開放。騰訊社交廣告總經(jīng)理羅征透露,這次大賽目的是提供一個(gè)平臺(tái),讓學(xué)生群體可以去體驗(yàn)騰訊做的算法應(yīng)用,去感受工業(yè)界需要解決哪些問題,同時(shí)也會(huì)為用戶和客戶帶來更多價(jià)值,把全鏈條的技術(shù)到應(yīng)用展示給大家。
有了騰訊的這些資源加持,今年的參賽者競(jìng)爭(zhēng)非常激烈。
“熬”戰(zhàn)20天拿下30萬獎(jiǎng)金,冠軍地位險(xiǎn)些被超驚出一身冷汗
本次獲得冠軍的“葛文強(qiáng)”隊(duì),三名成員分別來自吉林大學(xué)、北京郵電大學(xué)和哈爾濱工業(yè)大學(xué),并在初賽階段獲得第一名。
“葛文強(qiáng)”隊(duì)成員告訴新智元,他們?nèi)嗽诮M隊(duì)后,看了無數(shù)論文,并且有至少20天是每晚至少一人通宵盯數(shù)據(jù),最后終于以初賽第一的成績(jī)進(jìn)入復(fù)賽。
復(fù)賽之后的前兩周一切很順利,把持周冠軍的寶座。
但突然有一天,“葛文強(qiáng)”發(fā)現(xiàn)自己的分?jǐn)?shù)馬上要被超了,隊(duì)員當(dāng)時(shí)有點(diǎn)慌。
穩(wěn)住之后,“葛文強(qiáng)”把之前做過的一些模型,再通過一些精細(xì)化的處理,把第一保持到了最后。
本次大賽中,“葛文強(qiáng)”使用了兩個(gè)模型。
增強(qiáng)樹模型。核心是特征工程,特征工程分為六大塊,包括基礎(chǔ)特征編碼、單特征轉(zhuǎn)化率、雙交叉轉(zhuǎn)化率、三交叉轉(zhuǎn)化率、多值變長(zhǎng)特征降維、ID特征的(lda, nmf, svd) embedding向量。其中用戶特征與廣告特征的交叉轉(zhuǎn)換率的特征重要性最高。在轉(zhuǎn)化率的統(tǒng)計(jì)上面采用5折交叉統(tǒng)計(jì)配合貝葉斯平滑的方案。
神經(jīng)網(wǎng)絡(luò)ctr模型。核心是利用網(wǎng)絡(luò)結(jié)構(gòu)來代替手工特征交叉, 為此“葛文強(qiáng)”以一個(gè)DNN神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),融合了代表二階交叉的FM部分、FFM部分、無限交叉的mvm部分、基于游走的圖embedding等結(jié)構(gòu),形成了一個(gè)復(fù)雜網(wǎng)絡(luò)。并且在此基礎(chǔ)上加了注意力模型,取得了很好的效果。
此外,“葛文強(qiáng)”隊(duì)還贏得“人氣戰(zhàn)隊(duì)獎(jiǎng)”。
第二、三名分別是“三只小蜜蜂”、“SML_21”戰(zhàn)隊(duì),將10萬元及5萬元獎(jiǎng)勵(lì)收入囊中。“神魔咧”、“just-fighting”團(tuán)隊(duì)則抱走了另外兩座“人氣戰(zhàn)隊(duì)獎(jiǎng)”。
C9院校每所參與人數(shù)均過百,騰訊開放資源讓選手體驗(yàn)挑戰(zhàn)工業(yè)界難題
騰訊社交廣告總經(jīng)理羅征表示,早期學(xué)計(jì)算機(jī)算法,課本上的數(shù)據(jù)是“模擬的”數(shù)據(jù),即所謂做算法多是涉及證明。現(xiàn)在做算法在課本上的技巧可以應(yīng)用大量的數(shù)據(jù)集,但是也存在與工業(yè)界應(yīng)用的距離。
因此騰訊舉辦廣告算法大賽的目的是提供一個(gè)平臺(tái),讓學(xué)生群體都可以去體驗(yàn)騰訊如何做算法應(yīng)用,感受工業(yè)界需要解決哪些問題。
騰訊社交廣告總經(jīng)理羅征
羅征透露,這次大賽目的是通過使用脫敏數(shù)據(jù),將全鏈條技術(shù)到應(yīng)用展示給大家。
騰訊社交廣告基于成熟的算法技術(shù)能力,運(yùn)用Lookalike技術(shù),能在保證精準(zhǔn)的前提下,幫助廣告主觸達(dá)最大化相似人群量級(jí),讓品牌找到更多“對(duì)的人”,從而高效促進(jìn)營(yíng)銷目標(biāo)轉(zhuǎn)化。
羅征說,Lookalike在廣告主應(yīng)用中非常廣泛,并且對(duì)他們的效果影響非常大。今年將Lookalike作為賽題,除了有趣、好玩外,一個(gè)重要的原則是算法對(duì)廣告主有很大的影響力。
AI技術(shù)在全鏈條的應(yīng)用,Lookalike只是其中一塊。算法的應(yīng)用還可以體現(xiàn)在優(yōu)化人力配置上,比如廣告效果優(yōu)化和廣告審核這類目前投入非常多人力的地方,機(jī)器出錯(cuò)率比人類要低。
騰訊CDG人力資源中心負(fù)責(zé)人、騰訊集團(tuán)組織發(fā)展部總經(jīng)理艾蘭表示,算法不僅有商業(yè)價(jià)值,還有包括公益在內(nèi)更多應(yīng)用價(jià)值。
騰訊CDG人力資源中心負(fù)責(zé)人、騰訊集團(tuán)組織發(fā)展部總經(jīng)理艾蘭
騰訊公司副總裁、技術(shù)管理委員會(huì)主任王巨宏認(rèn)為,算法決定了前臺(tái)許多東西,這樣的比賽讓大家看到華麗的外表其實(shí)是由算法決定,算法帶來的不僅有商業(yè)價(jià)值,還有更多其他價(jià)值。互聯(lián)網(wǎng)巨頭的一個(gè)重要優(yōu)勢(shì)就是廣告,將來誰(shuí)能在廣告上做的好,就是要看算法。騰訊在產(chǎn)學(xué)研合作中有兩塊:一是做學(xué)術(shù)基礎(chǔ)研究,騰訊也希望有同學(xué)在這條路上深耕;二是對(duì)想做產(chǎn)業(yè)的同學(xué)來說,騰訊歡迎大家一起,讓更多的人體會(huì)到產(chǎn)品的價(jià)值。
騰訊公司副總裁、技術(shù)管理委員會(huì)主任王巨宏
王巨宏還透露了一組數(shù)字:參賽的73%是學(xué)生團(tuán)隊(duì),今年C9院校參與人數(shù)均超過100。王巨宏也歡迎參賽的學(xué)生參與到產(chǎn)業(yè)界中來,成為騰訊同事或者合作伙伴。
“未來,希望通過騰訊鏈接的服務(wù),讓更多的人體會(huì)到產(chǎn)品的價(jià)值,讓大眾享受到廣告帶來的快樂和幸福。”
詳解騰訊廣告另一大利器:大規(guī)模推薦技術(shù)
互聯(lián)網(wǎng)廣告是大規(guī)模AI技術(shù)應(yīng)用最重要的場(chǎng)景之一,不論谷歌、Facebook還是BAT,都在廣告業(yè)務(wù)中投入了大量的研究資源和人力,因?yàn)閺V告場(chǎng)景的很多技術(shù)創(chuàng)新都能直接轉(zhuǎn)換為商業(yè)收入。
騰訊社交廣告在Lookalike等大規(guī)模推薦技術(shù)方面,進(jìn)行了多年積累與探索,結(jié)合產(chǎn)品、運(yùn)營(yíng)推廣,共同驅(qū)動(dòng)社交廣告業(yè)務(wù)高速增長(zhǎng)。
騰訊社交廣告專家架構(gòu)師李長(zhǎng)城介紹,TSA的推薦引擎采用了業(yè)界主流的向量檢索方法(YouTube 2016年發(fā)表)。雖然在電商等結(jié)構(gòu)化場(chǎng)景,有一些新的方案提出并取得了不錯(cuò)的效果,在社交廣告這種非結(jié)構(gòu)化場(chǎng)景,結(jié)合對(duì)向量檢索中具體問題的優(yōu)化,該方案仍然獲得最好的效果。
騰訊社交廣告專家架構(gòu)師李長(zhǎng)城
向量檢索主要由兩部分組成:一是向量?jī)?nèi)積DNN,通過DNN學(xué)習(xí)用戶/廣告 embedding向量,兩者的內(nèi)積表示感興趣程度;二是近似最近鄰(ANN)檢索,通過ANN算法大幅縮短檢索時(shí)間,召回近似top N感興趣候選。向量檢索能夠以較低的性能開銷獲得近似全庫(kù)遍歷的檢索效果。實(shí)際應(yīng)用中,也存在很多問題需要優(yōu)化改進(jìn)。
李長(zhǎng)城介紹了騰訊社交廣告在推薦優(yōu)化中的幾項(xiàng)工作,包括ANN算法選取及細(xì)節(jié)改進(jìn)(HNSW優(yōu)化聚類分層及鄰居計(jì)算),ANN通過數(shù)學(xué)變換支持內(nèi)積度量,建模先驗(yàn)概率提升效果(內(nèi)積不是距離度量,近鄰檢索算法不能直接使用,通常會(huì)歸一化為cos,導(dǎo)致了相應(yīng)的效果損失),以及共用lookup embedding建立雙塔間的潛在特征關(guān)聯(lián),緩解向量?jī)?nèi)積DNN不能直接使用user-ad組合特征的問題。
除了模型算法,李長(zhǎng)城也概述了TSA在NLP基礎(chǔ)技術(shù)、大規(guī)模機(jī)器學(xué)習(xí)平臺(tái),超大規(guī)模稀疏DNN訓(xùn)練等方面的建設(shè)與創(chuàng)新。
騰訊社交廣告是國(guó)內(nèi)流量最大、場(chǎng)景最豐富、覆蓋人群最為廣泛的互聯(lián)網(wǎng)廣告平臺(tái)。在超大規(guī)模數(shù)據(jù)的支撐下,多種主流AI技術(shù)協(xié)同優(yōu)化,共同驅(qū)動(dòng)廣告業(yè)務(wù)高速發(fā)展,以及業(yè)界前沿技術(shù)的應(yīng)用與創(chuàng)新。
AI實(shí)時(shí)判斷用戶推薦廣告,騰訊推機(jī)器學(xué)習(xí)平臺(tái)TI-ML降低技術(shù)門檻
傳統(tǒng)的廣告判斷是以天為單位來做判斷,也可以勉強(qiáng)做到小時(shí)級(jí),但是終究比實(shí)時(shí)上效果要差。
在注意力經(jīng)濟(jì)下,用戶的廣告判斷對(duì)實(shí)時(shí)判斷的要求越來越高,需要在用戶點(diǎn)進(jìn)來的時(shí)候就判斷哪一條廣告適合用戶看,人類操作無法適應(yīng)這種實(shí)時(shí)性要求。羅征說,目前騰訊的微信、QQ、新聞等產(chǎn)品廣告中,已經(jīng)實(shí)現(xiàn)了實(shí)時(shí)判斷,用戶訪問到騰訊的產(chǎn)品時(shí)就會(huì)實(shí)時(shí)推薦。
算法越來越多的改變廣告的推薦形式和目標(biāo)。華揚(yáng)聯(lián)眾數(shù)字實(shí)驗(yàn)室總工程師張炎也在決賽演講中介紹了應(yīng)用數(shù)據(jù)模型和關(guān)聯(lián)分析如何連接用戶、媒體和廣告。
張炎說,華揚(yáng)聯(lián)眾采用Scoring 算法,將用戶分類,為計(jì)算廣告做人群精準(zhǔn)定位,并且用實(shí)時(shí)決策引擎提供數(shù)學(xué)模型。
華揚(yáng)聯(lián)眾數(shù)字實(shí)驗(yàn)室總工程師張炎
以汽車公司SUV營(yíng)銷為例,前期通過選擇廣告投放媒體,媒體準(zhǔn)備網(wǎng)頁(yè)內(nèi)容,UT部署腳本監(jiān)控用戶流量,Centrixlink使用賬戶信息在設(shè)備上提供初始標(biāo)簽。后期持續(xù)發(fā)掘最優(yōu)的廣告位置和用戶特征,利用Lookalike對(duì)用戶進(jìn)行評(píng)分,找到類似人群,實(shí)現(xiàn)精準(zhǔn)投放。
另外,AI在廣告審核中也發(fā)揮重要作用。比如廣告創(chuàng)意中的素材有版權(quán)歸屬問題,A廣告不能拿了B廣告的創(chuàng)意進(jìn)行抄襲,這種情況下,機(jī)器學(xué)習(xí)做自動(dòng)化搜索配對(duì),就能夠識(shí)別廣告抄襲行為,保護(hù)原創(chuàng)版權(quán)。
AI雖然能給企業(yè)特別是傳統(tǒng)企業(yè)帶來效率提升,但AI建模是一項(xiàng)技術(shù)門檻高,只有少數(shù)人掌握的技能。騰訊云AI基礎(chǔ)產(chǎn)品中心產(chǎn)品經(jīng)理郭律表示,優(yōu)質(zhì)的機(jī)器學(xué)習(xí)平臺(tái)能夠幫助企業(yè)降低獲得AI能力的門檻,提高建模效率。并以騰訊智能鈦機(jī)器學(xué)習(xí)生態(tài)服務(wù)平臺(tái)(TI-ML)為例進(jìn)行了深度解讀。
騰訊云AI基礎(chǔ)產(chǎn)品中心產(chǎn)品經(jīng)理郭律
TI-ML是基于騰訊云強(qiáng)大計(jì)算能力的一站式機(jī)器學(xué)習(xí)生態(tài)服務(wù)平臺(tái),能夠?qū)Ω鞣N數(shù)據(jù)源、組件、算法、模型和評(píng)估模塊進(jìn)行組合,使得算法工程師和數(shù)據(jù)科學(xué)家在其之上能夠方便地進(jìn)行模型訓(xùn)練、評(píng)估和預(yù)測(cè)。
智能鈦機(jī)器學(xué)習(xí)具有可視化操作界面的 TI-ONE 和具有命令行操作界面的 TI-Accelerator(TI-A),能夠滿足用戶不同的使用習(xí)慣。在部署方面,除公有云方式外,TI 也支持私有化部署。
AI除了服務(wù)企業(yè)與開發(fā)者外,還被應(yīng)用到公益領(lǐng)域。
泛化智能CEO&創(chuàng)始人王漢陽(yáng)在決賽現(xiàn)場(chǎng)展示了利用計(jì)算機(jī)視覺來發(fā)現(xiàn)華北豹的案例。
華北豹是唯一一種只生活在中國(guó)的大型貓科動(dòng)物。2005年,北京門頭溝最后一次出現(xiàn)華北豹的身影,現(xiàn)在北京已經(jīng)沒有適合華北豹的生活環(huán)境了。
紅外相機(jī)常用來發(fā)現(xiàn)華北豹等物種,它的紅外探頭通過溫度來感應(yīng)動(dòng)物,但問題在于受外界溫度變化影響,不能精準(zhǔn)拍攝目標(biāo)野生動(dòng)物,會(huì)拍很多沒有用的照片。
泛化智能通過利用計(jì)算機(jī)視覺來識(shí)別動(dòng)物,把之前動(dòng)物保護(hù)組織貓盟一周的時(shí)間縮短到1小時(shí),能達(dá)到98%的準(zhǔn)確率。目前,貓盟在華北發(fā)現(xiàn)超過29只華北豹。
至此,2018騰訊廣告算法大賽正式落下帷幕,騰訊社交廣告將持續(xù)探索前沿科技,不斷觸摸算法科技的未來,期待明年的算法大賽。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4804瀏覽量
102647 -
騰訊
+關(guān)注
關(guān)注
7文章
1678瀏覽量
50106
原文標(biāo)題:中國(guó)常春藤聯(lián)盟院校都參與,騰訊廣告算法大賽30萬大獎(jiǎng)出爐!
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
小馬智行與騰訊云達(dá)成戰(zhàn)略合作,打通微信等應(yīng)用Robotaxi入口
智能座艙還是廣告位?智駕時(shí)代的車載系統(tǒng)可以有廣告嗎?

電梯物聯(lián)網(wǎng)廣告機(jī):科技與生活的交融
騰訊AI助手“騰訊元寶”重大更新:支持深度思考功能
馬化騰:騰訊加大算力儲(chǔ)備,推進(jìn)AI探索
胡瀚接棒騰訊多模態(tài)大模型研發(fā)
騰訊申請(qǐng)注冊(cè)“騰訊云AI代碼助手”商標(biāo)
2024年全球廣告銷售額破萬億美元,谷歌、Meta和亞馬遜占四成
虛擬制作技術(shù)在廣告領(lǐng)域中的應(yīng)用與挑戰(zhàn)
OpenAI考慮將廣告引入AI產(chǎn)品,拓展收入來源
Arm成功將Arm KleidiAI軟件庫(kù)集成到騰訊自研的Angel 機(jī)器學(xué)習(xí)框架
騰訊申請(qǐng)注冊(cè)多枚“騰訊AI助手”商標(biāo)
CCF開源創(chuàng)新大賽決賽結(jié)果發(fā)布!OpenHarmony應(yīng)用開發(fā)賽道盡展風(fēng)采

大模型時(shí)代下的新一代廣告系統(tǒng)

評(píng)論