女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

幫助我們創建數據科學領域的下一代數據可視化工具

Tableau社區 ? 來源:Tableau社區 ? 作者:ANA CRISAN ? 2021-03-19 10:11 ? 次閱讀

數據科學在過去十年里蓬勃發展,改變了我們的商業模式,同時對于新一代的年輕人來說,提供了一個未來的職業方向。但在數據科學快速發展的同時,人們對它的理解也在逐步演變,這導致了不同的人對于如何更好地從數據中獲取洞察有了不同的觀點。對于我來說,數據科學的發展重塑了我的職業生涯,接下來我想深入研究數據科學是什么、數據科學的研究工作是什么以及數據科學家是誰等問題。我查閱了大量的文獻,將數據科學和數據科學家的各種研究和分析關聯匯總到一起,從而試圖來回答了這些問題。我在一篇題為 “Passing the Data Baton: A Retrospective Analysis on Data Science Work and Workers” 的研究出版物中說明了以上結果。

這項研究的部分動機是作為未來研究和開發的基礎,這樣我可能可以找到一個可視化分析工具還未滿足其需求的領域。而另一個動機是,我希望對十多年前我剛開始學習計算機科學時還不存在的這個領域進行自我反思和回顧。在這篇文章中,我總結了這篇研究論文的幾個關鍵收獲,并分享了這些發現將如何幫助我們創建數據科學領域的下一代數據可視化工具。

什么是數據科學?

數據科學對不同的人來說是不一樣的。對某些人來說,數據科學并不是什么新鮮事,只是統計技術的實際應用,并且已經存在了很長一段時間。對其他人來說,數據科學不僅需要統計方法的知識,而且還需要計算技術使這些方法得到應用。例如,一個數據科學家僅僅理解線性回歸是不夠的,他們還需要知道如何在大規模的數據中應用線性回歸——這不是傳統統計學教育的一部分。盡管如此,即使是那些認為數據科學不僅僅是應用統計學的人,也可能并不認為它是一件新事物。收集和分析數據的做法,長期以來一直是科學研究的一部分,例如生物學或物理學;許多人認為,數據科學只是經驗科學中對已經存在的研究的延伸。

eee32ca0-879b-11eb-8b86-12bb97331649.png

但其實還有第三種觀點,即數據科學確實是一件新的事物,既不同于統計學,也不同于科學家在研究原子和基因時使用的方法。數據科學將統計學、計算機科學以及其他必要的學科專業知識結合起來,帶來了數據科學所獨有的、由數據科學家所應對的全新挑戰。此外,數據科學家開展的工作與其他類型的數據分析不同,它需要更廣泛的跨學科技能。我們和其他人的研究都認為數據科學確實是一件全新的、不同的事物,基于這點,我們創建了一個關于數據科學的定義,作為我們工作的基礎:

數據科學是一個跨學科領域,旨在通過統計和計算技術的結構化應用,從現實世界的數據中得到新的見解。 這一定義很重要,因為它幫助我們了解數據科學工作者面臨的挑戰和未滿足的需求,它們主要來自于處理真實數據的挑戰(而不是模擬數據),以及大規模應用統計和計算方法的挑戰。

什么是數據科學工作?

efed810e-879b-11eb-8b86-12bb97331649.png

重要的是,數據科學的有效定義縮小了研究范圍。我們并沒有包含人們可能希望進行研究的所有類型的數據分析,而是仔細研究那些數據科學家進行研究的分析類型。這種區別很重要,因為實驗物理學家分析數據所采取的具體步驟與數據科學家可能采取的分析步驟不同,盡管它們有共同點。這就引出了一個重要的后續問題:究竟什么是數據科學的研究工作? 有好幾個行業標準來分解數據科學的研究工作。第一種是 KDD(數據發現中的知識)方法,隨著時間的推移,其他人會對該方法進行修改和擴展?;谶@些推論,以及采訪數據科學家,我們創建了一個框架,其中包括四個高階過程(準備、分析、部署和通信)和 14 個低階過程。使用紅色筆劃輪廓,我們還強調了數據可視化在數據科學工作中已經發揮突出作用的具體領域。在我們的研究文章中,我們提供了這些過程的詳細定義和示例。

誰是數據科學工作者?

我們在與數據科學家進行的 12 項深入研究中發現了 9 個數據科學角色。這些年來,我聽到了許多關于數據科學家的不同看法。我喜歡的一個例子是,數據科學家是“比統計學家更擅長軟件工程,比軟件工程師更擅長統計學” 的人。我最近聽到的一個直白的說法是,數據科學家是“西海岸的統計學家”。

然而,當我們深入研究現有的數據科學家的研究時,我們沒想到發現了一個重要且一致的特征,即 “數據科學家” 的多樣性以及它們在特定數據科學過程中的作用如何變化。您可能已經注意到數據工程師的崛起,例如,作為一個獨特但仍然相鄰的數據科學角色。隨著數據科學工作的復雜性的增加,數據科學家變得更專業,往往從事數據科學研究工作的具體方面。Harris 等人的訪談早在 2012 年就已經確定了這一趨勢,這種趨勢只是隨著時間的推移而加速。他們敏銳地發現,數據科學角色之間的這種多樣性導致了 “數據科學家和尋求幫助的人之間的交流不暢”。

我們根據 Harris 的研究結果,對 12 項研究進行了調查,共有數千名被認定為數據科學家的個體。通過對這些研究的分析,我們能夠識別出 9 個不同的數據角色。這些人有不同的技能和背景,我們以統計、計算機科學和領域專業知識為軸心來說明。我們還將以人為中心的設計納入了我們對數據科學技能的描述,因為考慮到數據產品的影響,就像面部識別應用程序一樣,越來越重要。我們要強調的是,這些角色不是絕對的范疇,它們的邊界是不固定的,同時這些角色的技術技能也符合類似的規律。相反,提出這些角色類別的目的是提供一個指導,從而幫助研究人員對于正在交談的人以及他們的背景有一個直觀的認識。

這將如何改變我們創建可視化

和數據分析工具的方式?

當然,最重要的是我們對數據科學的定義以及我們的數據科學工作框架和工作人員如何幫助我們構建更好的數據可視化工具。首先也是最重要的一點是,它有助于提供一個清晰的標準,從而明確了數據科學研究工作的多樣性和對應的工作人員。我們已經使用這個框架創建了更清晰的標準來分解數據科學中的 Tableau 客戶體驗。我們可以更精確地確定他們正試圖做什么,并可以就這些過程提出更深入的問題。

已知 “數據科學家” 這個角色本身包含了大量的多樣性,我們可以通過將與我們交談的個人歸類到九個數據科學的角色,從而更好地確定誰在執行這項工作。這樣的分類使得我們更容易理解可視化系統需要支持的任務以及在什么級別上支持這些任務。例如,技術分析員和 ML/AI 工程師是我們描述的兩個數據科學角色,他們都可以參與模型構建的共同任務,但需求截然不同;如果我們忽略這些差異,我們就有可能為這兩個角色創建錯誤的工具。

但也許對我來說最重要的是,這個框架還幫助我思考當前可視化分析工具生態系統中缺少的東西。我得出的一個令人擔憂的結論是,現有工具對可視化機器學習模型的關注范圍很窄,缺乏支持數據科學研究工作的其他關鍵方面的工具,如數據準備、部署或通信。這種工具的缺乏不僅增加了數據科學研究工作的開銷,還使得數據科學家無論擔任什么角色,都更難讓他們的工作影響到組織的決策和實踐。這項關于數據科學工作和工作者的研究幫助我面對以上挑戰,同時為構建更好的工具來幫助人們查看和理解他們的數據提供了機會。

原文標題:數據科學的十年回顧與可視化工具的未來

文章出處:【微信公眾號:Tableau社區】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7237

    瀏覽量

    90937
  • 機器學習
    +關注

    關注

    66

    文章

    8487

    瀏覽量

    133994

原文標題:數據科學的十年回顧與可視化工具的未來

文章出處:【微信號:TableauChina,微信公眾號:Tableau社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    工業設備數據集中監控可視化管理平臺是什么

    工業設備數據集中監控可視化管理平臺是種用于整合、監控和可視化工業設備數據的綜合性系統,旨在幫助
    的頭像 發表于 05-06 11:10 ?103次閱讀

    七款經久不衰的數據可視化工具!

    、圖形等形式展示,使數據更易于理解與分析。本文將深入探討數據可視化工具的概念、種類及其應用,同時,我們將推薦款高效好用的
    發表于 01-19 15:24

    什么是大屏數據可視化?特點有哪些?

    大屏數據可視化是指通過大屏幕展示大量數據和信息,以直觀、可視化的方式幫助用戶理解和分析數據。這種
    的頭像 發表于 12-16 16:59 ?585次閱讀

    數據可視化數據分析的關系

    在當今這個信息爆炸的時代,數據無處不在。無論是企業運營、科學研究還是個人決策,我們都需要從海量的數據中提取有價值的信息。數據分析和
    的頭像 發表于 12-06 17:09 ?793次閱讀

    Minitab 數據可視化技巧

    數據分析領域,數據可視化種將數據以圖形或圖像的形式展示出來的技術,它可以
    的頭像 發表于 12-02 15:40 ?1143次閱讀

    智慧能源可視化監管平臺——助力可視化能源數據管理

    博達可視化大屏設計平臺在智慧能源領域的價值體現在實時監控、數據可視化、決策支持和效率提升等方面。借助該平臺,企業可以輕松搭建智慧能源類可視化
    的頭像 發表于 11-29 10:00 ?800次閱讀
    智慧能源<b class='flag-5'>可視化</b>監管平臺——助力<b class='flag-5'>可視化</b>能源<b class='flag-5'>數據</b>管理

    智慧園區數據可視化優勢體現在哪些地方

    、地圖、儀表盤等形式呈現數據,使復雜的數據變得直觀易懂,幫助用戶更快速、準確地理解數據。 2.實時監控與反饋:數據
    的頭像 發表于 11-15 10:30 ?455次閱讀
    智慧園區<b class='flag-5'>數據</b><b class='flag-5'>可視化</b>優勢體現在哪些地方

    毫米波演示可視化工具

    電子發燒友網站提供《毫米波演示可視化工具.pdf》資料免費下載
    發表于 11-13 14:24 ?0次下載
    毫米波演示<b class='flag-5'>可視化工具</b>

    數字孿生三維可視化場景如何搭建?

    數字孿生 三維可視化 場景是種強大的工具,能夠幫助我們模擬和展示現實世界中的復雜環境和系統。從數據采集到交互設計,通過
    的頭像 發表于 11-06 14:40 ?510次閱讀

    博世Logistics Cockpit軟件平臺這套神秘引擎把數據可視化玩得很酷

    數據的呈現方式, 你更喜歡哪種?誰會有耐心從密密麻麻的數據中挖掘信息呢?相比之下,圖表、趨勢圖等視覺化呈現更易于理解與分析。 你看,當紛繁復雜的行行數據被 「
    的頭像 發表于 08-13 10:40 ?867次閱讀
    博世Logistics Cockpit軟件平臺這套神秘引擎把<b class='flag-5'>數據</b><b class='flag-5'>可視化</b>玩得很酷

    大屏數據可視化 開源

    在當今信息爆炸的時代,數據已經成為各個行業決策制定和業務發展的關鍵。為了更直觀、準確地理解和利用海量數據, 大屏數據可視化 成為種強大的
    的頭像 發表于 06-27 16:06 ?644次閱讀
    大屏<b class='flag-5'>數據</b><b class='flag-5'>可視化</b> 開源

    物聯網時代,為什么需要可視化數據大屏

    在互聯網和大數據時代,工業領域日益增長的數據量越來越離不開數據分析的支持,可視化數據大屏便是集中
    的頭像 發表于 06-18 13:53 ?645次閱讀
    物聯網時代,為什么需要<b class='flag-5'>可視化</b><b class='flag-5'>數據</b>大屏

    態勢數據可視化技術有哪些

    智慧華盛恒輝態勢數據可視化技術是種將數據以圖形、圖像、動畫等視覺形式展現出來的技術,特別是在處理和分析態勢數據時,該技術能夠將復雜的
    的頭像 發表于 06-11 15:47 ?596次閱讀

    智慧大屏是如何實現數據可視化的?

    智慧大屏,作為數據可視化的重要載體,已在城市管理、交通監控、商業運營等領域廣泛應用。本文旨在闡述智慧大屏實現數據可視化的關鍵技術和方法,包括
    的頭像 發表于 06-04 15:02 ?913次閱讀
    智慧大屏是如何實現<b class='flag-5'>數據</b><b class='flag-5'>可視化</b>的?

    大屏數據可視化的作用和意義

    大屏數據可視化則是將這些數據以更加直觀、易懂的方式展現出來,幫助用戶快速做出決策、發現問題、分析趨勢,具有重要的作用和意義。 大屏數據
    的頭像 發表于 06-03 17:56 ?1009次閱讀