女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

八大機器學習數(shù)據(jù)集

DPVg_AI_era ? 來源:lq ? 2019-01-18 09:52 ? 次閱讀

近日,Medium上的一位用戶整理了一份機器學習大型數(shù)據(jù)集清單,包括八大數(shù)據(jù)集資源庫??傆幸豢钸m合你,快來收藏吧!

下面的ML大型數(shù)據(jù)集,總有一款適合你。

就目前來看,找到一個特定的數(shù)據(jù)集來解決各種機器學習問題,甚至進行實驗還是比較困難的。

本文作者Will Badr便列舉了八大機器學習數(shù)據(jù)集。

不僅包含用于實驗的大型數(shù)據(jù)集,還附帶對數(shù)據(jù)集的描述以及使用示例。有的還包含用于解決與該數(shù)據(jù)集相關(guān)機器學習問題的算法代碼。

話不多說,上數(shù)據(jù)集!

1、Kaggle數(shù)據(jù)集

數(shù)據(jù)集地址:

https://www.kaggle.com/datasets

這是作者最喜歡的數(shù)據(jù)集之一。

每個數(shù)據(jù)集都是一個小型社區(qū),用戶可以在其中討論數(shù)據(jù)、查找公共代碼或在內(nèi)核中創(chuàng)建自己的項目。包含各式各樣的真實數(shù)據(jù)集。

用戶還可以看到與每個數(shù)據(jù)集相關(guān)的“內(nèi)核”,許多數(shù)據(jù)科學家還提供了相關(guān)手冊來分析數(shù)據(jù)集。

2、Amazon數(shù)據(jù)集

數(shù)據(jù)集地址:

https://registry.opendata.aws/

該數(shù)據(jù)源包含多個不同領(lǐng)域的數(shù)據(jù)集,如:公共交通、生態(tài)資源、衛(wèi)星圖像等。

網(wǎng)頁中也有一個搜索框來幫助用戶尋找想要的數(shù)據(jù)集,還有所有數(shù)據(jù)集的描述和使用示例,這些數(shù)據(jù)集信息豐富且易于使用!

數(shù)據(jù)集存儲在Amazon Web Services (AWS)資源中,比如Amazon S3——云中的一個高度可伸縮的對象存儲服務。

如果用戶正在使用AWS進行機器學習實驗和開發(fā),這將非常方便,由于它是AWS網(wǎng)絡的本地數(shù)據(jù),因此數(shù)據(jù)集的傳輸將非常快。

3、UCI機器學習資源庫

數(shù)據(jù)集地址:

https://archive.ics.uci.edu/ml/datasets.html

另一個來自加州大學信息與計算機科學學院的大型資源庫,包含100多個數(shù)據(jù)集。

用戶可以找到單變量和多變量時間序列數(shù)據(jù)集,分類、回歸或推薦系統(tǒng)的數(shù)據(jù)集。

有些UCI的數(shù)據(jù)集已經(jīng)是被清洗過的。

4、谷歌數(shù)據(jù)集搜索引

數(shù)據(jù)集地址:

https://toolbox.google.com/datasetsearch

在2018年末,谷歌做了他們最擅長的事情,推出了另一項偉大的服務——它是一個可以按名稱搜索數(shù)據(jù)集的工具箱。

他們的目標是統(tǒng)一成千上萬個不同的數(shù)據(jù)集存儲庫,使這些數(shù)據(jù)能夠且易被發(fā)現(xiàn)。

5、微軟數(shù)據(jù)集

數(shù)據(jù)集地址:

https://msropendata.com/

2018年7月,微軟與外部研究社區(qū)共同宣布推出“Microsoft Research Open Data”。

它在云中包含一個數(shù)據(jù)存儲庫,用于促進全球研究社區(qū)之間的協(xié)作。它提供了一系列用于已發(fā)表研究的、經(jīng)過處理的數(shù)據(jù)集。

6、Awesome Public Datasets Collection

數(shù)據(jù)集地址:

https://github.com/awesomedata/awesome-public-datasets

這是一個按“主題”組織的數(shù)據(jù)集,比如生物學、經(jīng)濟學、教育學等。

這里列出的大多數(shù)數(shù)據(jù)集都是免費的,但是在使用任何數(shù)據(jù)集之前,用戶需要檢查一下許可要求。

7、政府數(shù)據(jù)集

政府相關(guān)數(shù)據(jù)集也很容易找到的。

許多國家為了提高透明度,向公眾分享了各種數(shù)據(jù)集。以下是一些例子:

歐盟開放數(shù)據(jù)門戶:歐洲政府數(shù)據(jù)集。

數(shù)據(jù)集地址:

https://data.europa.eu/euodp/data/dataset

美國政府數(shù)據(jù):目前由于一些非政治性原因,暫時無法訪問。

數(shù)據(jù)集地址:

https://www.data.gov/

新西蘭政府數(shù)據(jù)集:

數(shù)據(jù)集地址:

https://catalogue.data.govt.nz/dataset

印度政府數(shù)據(jù)集:

數(shù)據(jù)集地址:

https://data.gov.in/

8、計算機視覺數(shù)據(jù)集

數(shù)據(jù)集地址:

https://www.visualdata.io/

Visual Data包含一些可以用來構(gòu)建計算機視覺(CV)模型的大型數(shù)據(jù)集。

用戶可以通過特定的CV主題查找特定的數(shù)據(jù)集,如語義分割、圖像標題、圖像生成,甚至可以通過解決方案(自動駕駛汽車數(shù)據(jù)集)查找特定的數(shù)據(jù)集。

總結(jié)

從上述作者所觀察到數(shù)據(jù)集情況來看,似乎是涵蓋各個方向和領(lǐng)域。

這些新數(shù)據(jù)集的社區(qū)將繼續(xù)發(fā)展,使數(shù)據(jù)更容易被獲取,使眾包和計算機科學社區(qū)能夠繼續(xù)快速創(chuàng)新,為生活帶來更多創(chuàng)造性的解決方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4700

    瀏覽量

    94786
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8492

    瀏覽量

    134121
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1223

    瀏覽量

    25283

原文標題:【收藏】8款大型機器學習數(shù)據(jù)集頂級資源

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    最新!智慧燈桿八大應用場景案例獨家匯總

    最新!智慧燈桿八大應用場景案例獨家匯總
    的頭像 發(fā)表于 01-14 12:47 ?573次閱讀
    最新!智慧燈桿<b class='flag-5'>八大</b>應用場景案例獨家匯總

    2025年全球半導體八大趨勢,萬年芯蓄勢待發(fā)

    近日,國際數(shù)據(jù)公司(IDC)發(fā)布了2025年全球半導體市場的八大趨勢預測,顯示出對半導體市場回暖的信心,為業(yè)界提供了寶貴的市場洞察。在全球范圍內(nèi),特別是在人工智能(AI)和高性能運算(HPC)需求
    的頭像 發(fā)表于 12-17 16:53 ?1985次閱讀
    2025年全球半導體<b class='flag-5'>八大</b>趨勢,萬年芯蓄勢待發(fā)

    cmp在機器學習中的作用 如何使用cmp進行數(shù)據(jù)對比

    機器學習領(lǐng)域,"cmp"這個術(shù)語可能并不是一個常見的術(shù)語,它可能是指"比較"(comparison)的縮寫。 比較在機器學習中的作用 模型評估 :比較不同模型的性能是
    的頭像 發(fā)表于 12-17 09:35 ?774次閱讀

    盤點圖像傳感器選型八大要點

    ,成為了一個值得深入探討的話題。本文將為您揭示圖像傳感器選型的八大要點,幫助您精準捕捉世界的奧秘。 一、分辨率:細節(jié)與清晰度的關(guān)鍵 分辨率是評估圖像傳感器性能的首要指標,決定了圖像的細節(jié)和清晰度。高分辨率傳
    的頭像 發(fā)表于 12-02 01:02 ?708次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統(tǒng)自身的性能”。事實上,由于“經(jīng)驗”在計算機系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機器學習需要設法對數(shù)據(jù)進行分析學習,這就使得它逐漸成為智
    的頭像 發(fā)表于 11-16 01:07 ?859次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關(guān)系

    緊密。 NPU的起源與特點 NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項目中提出,旨在為TensorFlow框架提供專用的硬件加速。NPU的設計目標是提高機器學習算法的運行效率,特別是在處理大規(guī)模數(shù)
    的頭像 發(fā)表于 11-15 09:19 ?1102次閱讀

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    提高機器學習模型效果與性能的過程。 而我對特征工程的理解就是從一堆數(shù)據(jù)里找出能表示這堆數(shù)據(jù)的最小數(shù)據(jù)
    發(fā)表于 08-14 18:00

    米思米直線電機模組的八大核心優(yōu)勢,你知道嗎?

    米思米直線電機模組憑借其價格親民、高精度、高速運行、低噪音、長壽命、多動子配置、選型便捷以及品類豐富等八大核心優(yōu)勢,在自動化與精密制造領(lǐng)域展現(xiàn)出了強大的競爭力和廣闊的應用前景。
    的頭像 發(fā)表于 07-25 10:57 ?890次閱讀
    米思米直線電機模組的<b class='flag-5'>八大</b>核心優(yōu)勢,你知道嗎?

    pycharm怎么訓練數(shù)據(jù)

    在本文中,我們將介紹如何在PyCharm中訓練數(shù)據(jù)。PyCharm是一款流行的Python集成開發(fā)環(huán)境,提供了許多用于數(shù)據(jù)科學和機器學習
    的頭像 發(fā)表于 07-11 10:10 ?1134次閱讀

    機器學習中的數(shù)據(jù)分割方法

    機器學習中,數(shù)據(jù)分割是一項至關(guān)重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習
    的頭像 發(fā)表于 07-10 16:10 ?2983次閱讀

    如何理解機器學習中的訓練、驗證和測試

    理解機器學習中的訓練、驗證和測試,是掌握機器學習
    的頭像 發(fā)表于 07-10 15:45 ?6396次閱讀

    機器學習中的數(shù)據(jù)預處理與特征工程

    機器學習的整個流程中,數(shù)據(jù)預處理與特征工程是兩個至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,進而影響模型的訓練效果和泛化能力。本文將從數(shù)據(jù)預處理和特征工程的基本概念出發(fā),詳細探討這
    的頭像 發(fā)表于 07-09 15:57 ?1227次閱讀

    PyTorch如何訓練自己的數(shù)據(jù)

    PyTorch是一個廣泛使用的深度學習框架,它以其靈活性、易用性和強大的動態(tài)圖特性而聞名。在訓練深度學習模型時,數(shù)據(jù)是不可或缺的組成部分。然而,很多時候,我們可能需要使用自己的
    的頭像 發(fā)表于 07-02 14:09 ?3328次閱讀

    機器學習數(shù)據(jù)分析中的應用

    隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從
    的頭像 發(fā)表于 07-02 11:22 ?1282次閱讀

    機器學習的經(jīng)典算法與應用

    關(guān)于數(shù)據(jù)機器學習就是喂入算法和數(shù)據(jù),讓算法從數(shù)據(jù)中尋找一種相應的關(guān)系。Iris鳶尾花數(shù)據(jù)是一個
    的頭像 發(fā)表于 06-27 08:27 ?1959次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經(jīng)典算法與應用