一份巧達科技的文件,透露出的數(shù)據(jù)問題,令人十分震驚。
日前,有消息稱招聘數(shù)據(jù)公司巧達科技被查封,全體員工被警方帶走。一位巧達科技前員工告訴燃財經(jīng)(ID:rancaijing),“(最近)陸續(xù)有HR等非核心員工回家,但核心高管依然失聯(lián)中。”多位業(yè)內(nèi)人士和律師認為,巧達科技出事可能與其未經(jīng)授權(quán)獲取和使用簡歷、“販賣”簡歷信息等涉嫌侵犯用戶隱私權(quán)、侵犯公民個人信息的行為有關(guān)。
公開資料顯示,巧達科技成立于2014年7月,號稱擁有中國最大的簡歷數(shù)據(jù)庫,其主要數(shù)據(jù)來源為大數(shù)據(jù)產(chǎn)品矩陣“喬大招”。喬大招旗下?lián)碛小皭刍锇椤薄ⅰ昂啔v時光機”等多款招聘產(chǎn)品。巧達科技在2014年11月獲得創(chuàng)新工場數(shù)百萬美元A輪融資,2017年1月獲得中信產(chǎn)業(yè)基金數(shù)千萬人民幣B輪融資。
燃財經(jīng)(ID:rancaijing)拿到一份巧達數(shù)據(jù)給客戶的商務(wù)合作BP(商業(yè)計劃書)。這份文件宣稱:巧達科技旗下有38個B端招聘產(chǎn)品、超過170萬招聘者用戶,巧達科技數(shù)據(jù)庫有2.2億自然人的簡歷、簡歷累計總數(shù)37億份。此外,巧達科技還有超過10億份通訊錄,并且掌握著與此相關(guān)的社會關(guān)系、組織關(guān)系、家庭關(guān)系數(shù)據(jù)。結(jié)合簡歷、通訊錄,以及外部獲取的超過千億條其他用戶數(shù)據(jù),巧達科技自稱擁有超過8億自然人的認知數(shù)據(jù)。也就是說,超過57%的中國人的信息都在巧達科技的數(shù)據(jù)庫里面。
根據(jù)文件介紹,巧達科技將這些數(shù)據(jù)用在教培、保險、招聘等行業(yè),某大型地產(chǎn)公司、某職業(yè)教育培訓(xùn)機構(gòu)、某分類信息網(wǎng)站和幾家招聘網(wǎng)站在這份文件里被列為典型案例。數(shù)據(jù)生意為巧達科技帶來了大量收入。2016年,巧達科技全年收入1.2億元,凈利潤4800萬元;2017年,巧達科技全年收入4.11億元,凈利潤1.86億元,凈利潤率超過45%。
王成予在向一位客戶介紹數(shù)據(jù)合規(guī)性時表示:巧達科技獲取的數(shù)據(jù)大部分為“非敏感數(shù)據(jù)”,且數(shù)據(jù)使用時會經(jīng)過脫敏處理。
但有律師認為,不論是通過自有渠道還是第三方渠道,沒有經(jīng)過用戶同意和違反用戶意愿的數(shù)據(jù)交易,都屬于擅自利用用戶信息并可能侵犯隱私。
燃財經(jīng)(ID:rancaijing)嘗試聯(lián)系王成予,向其證實文件里信息的真實性,但其電話長時間處于關(guān)機狀態(tài)。
要點速覽
在BP的管理團隊介紹中,其董事長并非工商信息中的王成予,而是由百度風(fēng)投管理合伙人齊玉杰擔(dān)任。
假如某APP提供某用戶手機號,巧達科技將其與自有的簡歷庫進行匹配,便能反饋給APP這個自然人包括年齡、性別、行業(yè)、職業(yè)、戶籍、收入、教育經(jīng)歷、工作經(jīng)歷、關(guān)系鏈等在內(nèi)的信息。巧達科技即使沒有掌握你的簡歷,它依然可以“算”出你的信息。
巧達科技宣稱通過2.2億+有簡歷的自然人、10億+通訊錄、100億+用戶識別ID組合和1000億+用戶綜合數(shù)據(jù),計算出了8億+,也就是可能涉及到57%的中國人的多維度數(shù)據(jù)。
巧達科技提供的多項服務(wù)都指向用戶個人,并且涉及在沒有用戶授權(quán)情況下對外許可,很可能涉及侵犯隱私。
高管多為百度出身:公司2017年凈賺1.86億元
根據(jù)工商信息,巧達科技(北京)有限公司(下稱巧達科技)成立于2014年7月,注冊資本1050萬人民幣,法定代表人為王成予。巧達科技登記有3名股東,其中王成予占股85.33%,劉煒占股12.19%,北京創(chuàng)新方舟科技有限公司占股2.48%。此外,王成予還擔(dān)任經(jīng)理和董事長。
燃財經(jīng)(ID:rancaijing)發(fā)現(xiàn),巧達科技將股權(quán)悉數(shù)質(zhì)押給北京邁可倫科技有限公司,該公司成立于2015年2月,公司類型為有限責(zé)任公司(臺港澳法人獨資),注冊資本1017.702萬美元,法定代表人、董事長、經(jīng)理亦為王成予。該公司唯一股東為2014年11月在香港成立的巧達數(shù)據(jù)集團有限公司。
巧達科技對外稱,自己是“一家專注于商業(yè)數(shù)據(jù)服務(wù)領(lǐng)域前瞻性產(chǎn)品設(shè)計和技術(shù)研發(fā)的公司”。核心團隊由“中國互聯(lián)網(wǎng)元老級產(chǎn)品經(jīng)理和技術(shù)極客”組成。PPT顯示,巧達科技在2014年11月獲得了來自創(chuàng)新工場的A輪融資,2016年2月獲得了來自齊玉杰和創(chuàng)新工場的A+輪融資,2017年1月,獲得了來自中信產(chǎn)業(yè)基金、驪悅金實、創(chuàng)新工場的B輪融資。
創(chuàng)新工場方面對外表示,其僅是巧達科技的財務(wù)投資人,從未參與任何公司運營,巧達科技也早已搬離工場。
在BP的管理團隊介紹中,其董事長并非工商信息中的王成予,而是由百度風(fēng)投管理合伙人齊玉杰擔(dān)任。其創(chuàng)始人“成予”曾任IBM WebSphere解決方案副總裁、百度早期產(chǎn)品部負責(zé)人、聯(lián)想FM365產(chǎn)品經(jīng)理;其聯(lián)合創(chuàng)始人沈毅曾任百度愛樂活技術(shù)副總裁、百度電子商務(wù)事業(yè)部技術(shù)總監(jiān)、百度有啊技術(shù)負責(zé)人。
此外,其他四位重要高管分別有在聯(lián)想、阿里、百度、普華永道等知名企業(yè)的從業(yè)經(jīng)驗。巧達科技旗下愛伙伴產(chǎn)品負責(zé)人劉博曾經(jīng)自詡不會侵犯用戶隱私,并稱巧達科技團隊COO劉煒曾是中國最大的在線法律服務(wù)平臺盈科律云的創(chuàng)始人,在法律方面把關(guān)格外嚴(yán)謹。
燃財經(jīng)(ID:rancaijing)就此聯(lián)系了齊玉杰的同事,對方稱,齊玉杰因身體原因已經(jīng)休假很長時間,并拒絕了燃財經(jīng)進一步聯(lián)系齊玉杰求證的請求。一位百度員工則告訴燃財經(jīng),巧達科技是齊玉杰去百度風(fēng)投任職之前就投資的公司,跟百度沒有關(guān)系。
該文件還展示了兩組十分引人注目的數(shù)據(jù)。截至2016年12月,巧達科技完成了全年1.2億元的營收,其中凈利潤4800萬元。一年后,其收入和凈利潤完成了成倍的增長,截至2017年12月,其全年收入4.11億元,凈利潤1.86億元。
巧達科技號稱擁有中國最大的簡歷數(shù)據(jù)庫,其自有的互聯(lián)網(wǎng)招聘工具便是“喬大招”,創(chuàng)始人為劉煒,法人為王成予,旗下?lián)碛小皭刍锇椤薄ⅰ昂啔v時光機”、“人才蛙”等10多款互聯(lián)網(wǎng)招聘相關(guān)產(chǎn)品。
另外,劉煒在明易互通信息技術(shù)(北京)有限公司擔(dān)任聯(lián)合創(chuàng)始人,該公司主營“快火箭”和“妙招網(wǎng)”兩款產(chǎn)品。
其中,曾在明易互通任職的葉錦生,是北京紛歷數(shù)據(jù)技術(shù)有限公司的執(zhí)行董事,“紛簡歷”是其主打產(chǎn)品。“紛簡歷”曾被知乎網(wǎng)友曝光稱,5600多萬份求職簡歷未經(jīng)當(dāng)事人允許便被非法兜售,導(dǎo)致個人信息嚴(yán)重泄露,致使不少當(dāng)事人收到大量騷擾電話。
令人驚訝的數(shù)據(jù)庫:2.2億自然人簡歷、10億通訊錄、100億用戶ID
BP顯示,巧達科技運營的是“以人為核心的大數(shù)據(jù)”,這其中的關(guān)鍵是自然人屬性。
因為傳統(tǒng)的用戶畫像靠行為來猜,依據(jù)的是上網(wǎng)特征、媒體及購物偏好、自定義標(biāo)簽等相對模糊的信息,很容易猜不準(zhǔn)。而巧達科技通過自然人數(shù)據(jù)還原,能夠精準(zhǔn)地進行用戶畫像。
巧達科技的簡歷來源包括38個B端招聘產(chǎn)品和超過170萬招聘者用戶。簡歷解析后自然人的原生數(shù)據(jù)能夠產(chǎn)生四項定位,包括角色畫像(生活角色、家庭角色、職務(wù)角色)、軌跡變化(收入范圍、消費趨勢、社會地位)、社會關(guān)系(同學(xué)、同事、同鄉(xiāng)、同行業(yè)、同職位)以及區(qū)域位置(生活區(qū)域、工作地點、教育培訓(xùn)),幾乎涵蓋了個人所有的數(shù)據(jù)維度。
自稱擁有中國最大的自然人簡歷庫,巧達科技手握2.2億自然人的簡歷,簡歷累計37億份。這也意味著,假如某APP提供某用戶手機號,巧達科技將其與自有的簡歷庫進行匹配,便能反饋給APP這個自然人包括年齡、性別、行業(yè)、職業(yè)、戶籍、收入、教育經(jīng)歷、工作經(jīng)歷、關(guān)系鏈等在內(nèi)的信息。
簡歷之外,巧達科技還通過自有產(chǎn)品獲取用戶授權(quán),以及第三方合作授權(quán)等方式,累積了超過10億“本機號不重復(fù)”的通訊錄。有了這10億通訊錄和2.2億自然人簡歷庫,加上聚類分析,巧達科技可以給有通訊錄數(shù)據(jù)但沒有簡歷數(shù)據(jù)的自然人進行畫像。也就是說,巧達科技即使沒有掌握你的簡歷,它依然可以“算”出你的信息。
拿到自然人的資料后,巧達科技可以通過通訊錄找到他的社會、組織、家庭關(guān)系,并進一步挖掘用戶信息。在此基礎(chǔ)上,將這些信息匹配平臺的簡歷庫,最終得出這些自然人及其周邊關(guān)系的收入水平、潛在需求、關(guān)系影響等要素。這些數(shù)據(jù)可以再進一步分成運營商數(shù)據(jù)、消費數(shù)據(jù)以及行為數(shù)據(jù),售與相關(guān)企業(yè)。
同時,公司將用戶數(shù)據(jù)與其郵箱、微博號、微信號、QQ等社交ID組合,通過多個識別ID關(guān)聯(lián)、多種設(shè)備關(guān)聯(lián)、跨平臺行為關(guān)聯(lián)、線上線下數(shù)據(jù)互通,打通自然人與ID的關(guān)系。
至此,巧達科技宣稱通過2.2億+有簡歷的自然人、10億+通訊錄、100億+用戶識別ID組合和1000億+用戶綜合數(shù)據(jù),計算出了8億+,也就是可能涉及到57%的中國人的多維度數(shù)據(jù)。
巧達科技稱認識用戶就可以預(yù)知未來,按照其業(yè)務(wù)邏輯,此話不僅不假,甚至十分恐怖。
掌握這么多信息,巧達科技將其應(yīng)用在數(shù)據(jù)運營、大數(shù)據(jù)執(zhí)法、教培、保險、招聘五大領(lǐng)域。
拿教培行業(yè)舉例,某職業(yè)教育培訓(xùn)機構(gòu)每日新增15萬線索號碼,但僅有手機號+簡單信息,面臨需求不明、付費率低、無效溝通增加成本、學(xué)員間轉(zhuǎn)介紹困難等問題。巧達科技則可以自動補全意向?qū)W員的資料信息,將學(xué)員線索按照關(guān)系分配給課程顧問,并且發(fā)現(xiàn)學(xué)員通訊錄中有培訓(xùn)需求的人。
據(jù)悉,該職業(yè)教育培訓(xùn)機構(gòu)已積累2億條咨詢號碼,但同樣面臨推薦錯誤形成騷擾、無法挖掘最大價值的困境。巧達科技則將公海里的號碼進行關(guān)系影響建模,再將課程學(xué)員號碼進行產(chǎn)品特征建模,最后進行匹配計算,得出潛在客戶的分級標(biāo)記,得出最適合每一位客戶的前幾位課程。
自詡“合法獲得”數(shù)據(jù),法律專家稱站不住腳
在這份BP中,單獨有5頁講述業(yè)務(wù)合規(guī)性。巧達科技稱,數(shù)據(jù)獲取于3個途徑:
1,自有招聘網(wǎng)站。巧達科技自稱合法取得,求職者用戶直接授權(quán),包括簡歷中敏感數(shù)據(jù)和非敏感數(shù)據(jù)。
2,招聘工具產(chǎn)品。巧達科技自稱合法取得,HR/獵頭用戶授權(quán),包括簡歷中敏感數(shù)據(jù)和非敏感數(shù)據(jù)。
3,第三方數(shù)據(jù)源。巧達科技自稱合法取得,合作方授權(quán),包括用戶ID組合,通訊錄,行為標(biāo)簽和偏好畫像。
獲得數(shù)據(jù)后,巧達科技將簡歷中敏感數(shù)據(jù)、用戶ID組合、通訊錄進行MD5脫敏,以及簡歷中非敏感數(shù)據(jù)、行為標(biāo)簽、偏好畫像,一并放入數(shù)據(jù)庫中。數(shù)據(jù)通過建模計算,結(jié)合用戶的認知引擎,最后提供給客戶。
法律專家、上海版權(quán)協(xié)會監(jiān)事林華認為,巧達科技聲稱的“合法性”在事實和法律上來說都是站不住腳的。“合法”的前提是要有當(dāng)事人的授權(quán),即使巧達是通過自有招聘入口獲取用戶簡歷,使用用戶信息也必須限于用戶投簡歷的目的范圍之內(nèi)。超過為用戶直接推薦工作機會之外的都是違反用戶意愿,屬于擅自利用用戶信息并可能侵犯隱私。
如果巧達是從第三方獲取用戶數(shù)據(jù),第三方本身不僅需要合法獲得用戶數(shù)據(jù)而且需要取得用戶對轉(zhuǎn)售簡歷的許可,這兩個條件缺乏其一都不合法,從而導(dǎo)致購買和再利用數(shù)據(jù)的行為不具有合法性。
即使巧達以合法方式取得用戶簡歷信息,對簡歷的使用也應(yīng)是另一個獨立行為。如果對匯總的用戶信息經(jīng)過數(shù)據(jù)脫敏,使信息不再和具體自然人而是和特定群體掛鉤,即只在統(tǒng)計學(xué)意義上利用不包含個人身份的用戶大數(shù)據(jù),法學(xué)上基本認同這種使用方式不涉及隱私權(quán)。
但巧達科技對用戶簡歷的使用應(yīng)當(dāng)不止于此,巧達科技提供的多項服務(wù)都指向用戶個人,并且涉及在沒有用戶授權(quán)情況下對外許可,很可能涉及侵犯隱私。
此前已有販賣簡歷被指控侵犯公民個人信息罪的先例。2017年,在求職網(wǎng)站智聯(lián)招聘工作的員工先后私自出售15萬份個人簡歷信息給“獵頭”余秋云,每份簡歷信息售價2-2.5元,余秋云再將信息加價賣給他人。上述員工被抓獲,公訴方指控三人犯侵犯公民個人信息罪。
一位行業(yè)人士告訴燃財經(jīng)(ID:rancaijing),做數(shù)據(jù)生意的公司都很“低調(diào)”,屬于“悶聲發(fā)大財”,巧達科技也不例外。據(jù)他介紹,巧達科技為HR或獵頭提供簡歷管理工具,并引導(dǎo)他們主動上傳自己手中的簡歷以免費換取其他簡歷,巧達科技由此獲得了大量的簡歷數(shù)據(jù)。
“數(shù)據(jù)交易行業(yè)里,簡歷數(shù)據(jù)屬于比較貴的數(shù)據(jù)。”該行業(yè)人士猜測,巧達科技很可能拿著手中免費得來的簡歷數(shù)據(jù)和擁有其他類型數(shù)據(jù)的數(shù)據(jù)公司進行了交換,從而拿到了通訊錄數(shù)據(jù)、消費數(shù)據(jù)等等其他數(shù)據(jù)。
多位行業(yè)人士告訴燃財經(jīng)(ID:rancaijing),數(shù)據(jù)行業(yè)的“水很深”,個人隱私被用來非法牟利的例子比比皆是。對于此類事件,燃財經(jīng)將持續(xù)關(guān)注。
-
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
54文章
11233瀏覽量
105596 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3901瀏覽量
65777 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8951瀏覽量
139483
原文標(biāo)題:獨家起底巧達科技:“玩轉(zhuǎn)”8億人數(shù)據(jù)的灰色生意
文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
EL3041 DIP-6 EVERLIGHT/億光雙向可控硅-EL3041光耦詳細參數(shù)
億緯鋰能擬5.79億元全資控股億緯動力
HarmonyOS NEXT 原生應(yīng)用開發(fā):社交通訊錄界面實現(xiàn)
云數(shù)據(jù)庫是哪種數(shù)據(jù)庫類型?
看點:中興通訊成交額達100億元 馬斯克推動星鏈擴張 訊飛醫(yī)療港交所上市
ChatGPT日均消息量破10億,周活躍用戶超3億
支持外擴sd卡功能的串口數(shù)據(jù)庫模塊
數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—通過拼接數(shù)據(jù)庫碎片恢復(fù)SQLserver數(shù)據(jù)庫

Oracle數(shù)據(jù)恢復(fù)—異常斷電后Oracle數(shù)據(jù)庫啟庫報錯的數(shù)據(jù)恢復(fù)案例

數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫出現(xiàn)823錯誤的數(shù)據(jù)恢復(fù)案例

評論