女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深入分析大數據的力量在哪里?

中山市物聯網協會 ? 作者:工程師之余 ? 2018-11-18 10:06 ? 次閱讀

大數據是這幾年的一項熱門技術。它和人工智能、云計算一起,已經成為大科技公司的技術標配。但是該如何理解大數據技術?這項技術對我們有什么影響?這些基本的問題,不少人卻并不清楚。

谷歌的數據科學家賽斯(賽斯·史蒂芬斯-大衛德維茨Seth Stephens-Davidowitz)寫了一本書《數據、謊言與真相》(Everybody Lies:Big Data,New Data ,and What the Internet Can Tell Us About Who We Really Are ),里面對這些問題給出了他的回答。

大數據這個名字本身會給人一種誤解,認為大數據的關鍵在于數據量很大。不過,賽斯說,數據集的大小經常被高估。其實所需要的數據集的大小,跟數據本身的效果、數據的真實程度等都有關。

舉個例子,一個火熱的爐子,你只需要碰到一次,就明白,熱爐子很危險,會燙傷你。但是,你可能需要喝幾千杯咖啡,才能確定,咖啡是否會讓你頭疼。原因就在于,熱爐子本身的效果強度很高,因此,只需要一項數據,就能顯現出結果。

賽斯在這本書里引用了大量人們在谷歌中搜索的數據。谷歌的數據之所以這么有價值,其實原因也不完全是因為谷歌能拿到的龐大的數據量,還因為,人們在自己的電腦上輸入關鍵詞、進行搜索時,都很誠實。他們不需要考慮社交壓力、周圍人的眼光等等。

用賽斯的話說,“你未必總是需要大數據,才能得出重要見解,你需要正確的數據。”大數據革命跟收集更多的數據無關,而是跟收集正確的數據有關。還是以谷歌為例。谷歌不是僅僅憑借著能夠比其他搜索引擎搜索到更多的內容,就成為世界上最大的搜索引擎公司,它憑借的是,可以搜索到更好的數據。這跟谷歌的算法有關。谷歌的算法,按照一個網頁被鏈接的數量來對搜索結果排序。

賽斯介紹了大數據的四種力量。這四種力量,也并不都同數據集本身的大小相關。

大數據的第一種力量是,提供了新類型的數據。比如,包括弗洛伊德在內的思想家,都會從性的角度,來解釋人類的很多行為。但是,這些思想家更多還是在觀念層面進行思考。而現在,大數據時代的研究者,有了一項讓那些過往思想家羨慕不已的數據:人們在互聯網上搜索和觀看色情作品的數據。這些獨特的數據來源,能夠讓研究者進入以前只能靠推理和猜測的領域。

大數據的力量在于,重新想象什么東西有資格成為數據,提供之前從來沒有收集過的信息,讓人們可以研究。

作者舉了一個例子。他曾經把2004年至2011年的失業率輸入到谷歌的數據挖掘工具Google Correlate中,結果發現,跟失業最相關的搜索,一個是***,另一個是蜘蛛紙牌。作者猜測,原因也很簡單,因為失業者會有很多空閑時間。所以,他就發現,“利用一些跟消遣相關的搜尋組合,就能追蹤失業率,而且是預測失業率最佳模式的一部分?!?/p>

大數據的第二種力量是,提供了誠實的數據。在數字時代出現之前,可想而知,由于考慮到社會壓力等因素,人往往會隱藏起來那些會讓自己難堪的想法。即使面對詢問,也不會坦誠相告。但是,在數字時代,雖然人們仍然會在現實生活中隱藏起一些真實想法,但是在互聯網上,尤其是可以匿名的網站上,人們往往會透露出自己的想法。

“大數據使我們終于可以看清人們真正想要什么和真正做了什么,而不是人們說自己要什么和做了什么?!?/p>

知名投資人彼得·蒂爾說過,偉大的企業建立在秘密之上??赡苁顷P于自然的秘密,也可能是關于人的秘密。人的秘密,指的是跟自己有關但自己卻不知道,或者不想讓別人知道的事。

舉個例子,流媒體公司奈飛,曾經讓用戶設置一個自己以后想看的電影播放列表。奈飛發現,用戶確實會把電影添加到這個列表中,但是,盡管奈飛會提醒用戶看這些電影,用戶卻很少真的去看。因為,人們說自己想要的,跟自己實際想要的不一致。

后來,奈飛不再要求用戶告訴自己他們想看什么電影,而是根據用戶點擊和觀看的數據建立一個模型,用模型來推測用戶想看什么電影。結果,用戶果然越來越頻繁地造訪奈飛,在上面看了越來越多的電影。所以,奈飛前數據科學家澤維爾·艾瑪特里安說:算法比你更了解你自己。

大數據的第三種力量是,讓我們可以把焦點放在人口中的一個很小的子集,去進行研究。

當然,這要求對小的子集,也有大數據量。打個比方,為了將照片的一小部分放大后還能看清楚,照片需要有很高的像素。同樣,為了能夠清楚放大檢視數據的小子集,每一個小子集中都需要大量的數據。比如,某一個球隊有多受1978年出生的男性的歡迎。只對幾千人進行的小調查,樣本根本不夠大,1978年出生的男性人數肯定不夠多。

這樣做的意義在什么地方呢?作者通過數據研究發現,是否成為一個球隊的粉絲,跟這個球隊在一個人特定年齡段的表現有關系。如果在一個人對運動最癡迷、最容易喜歡上某項運動的時間段,這個球隊的表現越好,那它獲得這個年齡段的球迷就越多。

而且,美國人政治觀點的形成也類似。很多美國人會在14歲到24歲這個關鍵時期,形成個人的政治偏好。其中,形成政治觀點最重要的年紀是18歲。受歡迎的共和黨總統或不受歡迎的民主黨總統,將影響很多年輕人成為共和黨人。反之亦然?!按髷祿试S我們有意義地放大檢視數據集的細部,獲取新的洞察?!?/p>

第四種力量是,允許研究者進行因果關系實驗。大數據可以允許研究者進行快速而且可控制的因果關系實驗,而不僅僅是相關性。

這種測試在很多互聯網公司被稱作是A/B測試。臉書(Facebook)每天能進行上千次A/B測試。所謂的A/B測試,指的是,在同一個時間維度,分別讓相似的兩組訪客隨機訪問這些版本,收集數據,來評估出用戶更喜歡的版本。比如,兩個標題,哪一個點擊量更高;放哪種類型的照片,更能讓用戶喜歡等等。

有一個網站的CEO說:“你不能假設任何事,必須針對每件事都進行測試才行”,“如果我們了解人性,根據我們的生活經驗就能判斷答案是什么,那么測試就不會有價值。但事實上,我們不了解人性,所以測試才這么有價值?!?/p>

這種方法,互聯網公司已經大量使用,而現在和將來,社會科學家也可以使用,從而把以往模糊的研究,變得更科學。以上就是谷歌數據科學家對于大數據擁有的四種力量的解釋,希望對你有啟發。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 云計算
    +關注

    關注

    39

    文章

    7972

    瀏覽量

    139375
  • 人工智能
    +關注

    關注

    1804

    文章

    48726

    瀏覽量

    246573
  • 大數據
    +關注

    關注

    64

    文章

    8952

    瀏覽量

    139497

原文標題:深度解析大數據,大數據的力量在哪里?

文章出處:【微信號:ZS-IOT,微信公眾號:中山市物聯網協會】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    深入分析LED電源損壞原因

     經常聽到業內有人抱怨說每次LED燈具壞了一看又是電源壞了,所以LED燈具里最不可靠的是電源,可能他說的是事實??墒且策€需要深入分析一下,LED電源損壞的原因。
    發表于 04-20 13:45 ?3714次閱讀

    深入分析運放的作用

    深入分析了4-20mA的運放選型、A/D基準電壓對測量精度影響等問題。
    的頭像 發表于 01-15 13:47 ?4354次閱讀
    <b class='flag-5'>深入分析</b>運放的作用

    Xilinx_FPGA_內部結構深入分析

    Xilinx_FPGA_內部結構深入分析存儲單元存儲單元可以配置為D觸發器,就是我們常說的FF,Xilinx稱之為FD;也可以配置為鎖存器,Xilinx稱之為LD。輸出和三態通路各有一對寄存器外加一
    發表于 08-02 22:48

    uCOS任務堆棧的深入分析(轉)

    uCOS任務堆棧的深入分析(轉)
    發表于 08-24 23:30

    深入分析Windows和Linux動態庫應用異同

    深入分析Windows和Linux動態庫應用異同 摘要:動態鏈接庫技術實現和設計程序常用的技術,在Windows和Linux系統中都有動態庫的概念,采用動
    發表于 10-22 11:36 ?1343次閱讀

    筆記本的結構深入分析

    筆記本的結構深入分析  電腦技術的應用為我們的生活和工作帶來了巨大改變,使我們的生活學習工作有了質的轉變。普通的用戶對電腦的了解一
    發表于 01-21 15:53 ?4449次閱讀

    如何深入分析電源電路技巧(二):駕馭噪聲電源

      隨著現在對更高效、更低成本電源解決方案需求的強調,電子發燒友網整合《如何深入分析電源電路》系列文章,就各種電源管理課題提出一些對您有幫助的小技巧。該專欄面向各
    發表于 06-08 14:15 ?2741次閱讀
    如何<b class='flag-5'>深入分析</b>電源電路技巧(二):駕馭噪聲電源

    大數據應用崛起 下一階段發展方向在哪里?

    時至今日,我們的數據管理能力日益提升,但數據分析能力則相對落后。盡管工具與流程皆已齊備,但仍然缺少充足的數據科學家人員。 大數據應用崛起 下一階段發展方向
    發表于 11-17 13:12 ?1063次閱讀

    了解多線程并深入分析CreateThread與_beginthreadex本質區別

    本文將帶領你與多線程作第一次親密接觸,并深入分析CreateThread與_beginthreadex的本質。
    的頭像 發表于 01-09 17:08 ?4725次閱讀
    了解多線程并<b class='flag-5'>深入分析</b>CreateThread與_beginthreadex本質區別

    人工智能和大數據對于教育來講,它的優勢到底在哪里

    其次,人工智能+教育的使用風險是什么?互聯網具有互聯性、虛擬性、開放性,大數據擁有情報性、統計性等,那么人工智能和大數據對于教育來講,它的優勢到底在哪里?如何在培養人才和管理方面發揮人工智能的優勢?應用的時候有沒有風險?
    的頭像 發表于 11-06 09:22 ?5376次閱讀

    深入分析MCU堆棧的作用 以及該如何設置堆棧大小

    深入分析MCU堆棧的作用,以及該如何設置堆棧大小
    的頭像 發表于 03-01 14:13 ?5523次閱讀
    <b class='flag-5'>深入分析</b>MCU堆棧的作用 以及該如何設置堆棧大小

    (轉)深入分析STM32單片機的RAM和FLASH

    (轉)深入分析STM32單片機的RAM和FLASH
    發表于 12-02 11:51 ?11次下載
    (轉)<b class='flag-5'>深入分析</b>STM32單片機的RAM和FLASH

    大數據應用在哪些方面?

    大數據時代,大量化,快速化,多樣化,價值化是其主要特征,那么基于上述特點,大數據應用范圍變得更加廣泛,那么大數據應用在哪些方面呢?畢竟只有知悉大數
    的頭像 發表于 02-08 10:33 ?5383次閱讀

    遠程工具在哪里打開?使用教程

    遠程工具在哪里打開?使用教程
    的頭像 發表于 05-15 18:09 ?1673次閱讀

    深入分析:大帶寬競爭形勢下同軸接入網的價值

    電子發燒友網站提供《深入分析:大帶寬競爭形勢下同軸接入網的價值.pdf》資料免費下載
    發表于 11-10 11:26 ?0次下載
    <b class='flag-5'>深入分析</b>:大帶寬競爭形勢下同軸接入網的價值