女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Reddit上掀起機器學習論文也要實行“預注冊”的大討論

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-10-27 09:57 ? 次閱讀

近日,關于“預注冊”(Pre-registered)的研究方式在Reddit論壇上引發了熱烈討論。“預注冊”是先向期刊提交理論研究和實驗設計方案,在評審并接受后,再展開進一步工作的一種方式。Reddit用戶呼吁在機器學習領域中也采用這種方式,引發了網友們的熱議。

所謂“預注冊”研究,通俗點說就是,在實際著手開始研究之前,先將研究假設和實驗設計方案等前期重要信息,向欲投稿的學術期刊進行事先注冊,由期刊先行組織專家進行同行評議。

如果評議通過,則期刊一般原則性承諾同意發表。然后再進入正式研究和論文撰寫、投稿等后續環節。

顯然,這一方式與現行的研究和論文發表流程有很大不同。

英國卡迪夫大學的研究人員特別對“預注冊”制度及其影響做了首次分析研究。

研究結果表明,采用這種模式,最終產生無效結果(即研究結果無法證明假設)的情形會大大增高,尤其是在心理學領域。這表明“預注冊”制度對一些“削足適履”的假結果起到了明顯的過濾作用。

傳統研究流程中,研究人員為了獲得“優質結果”,易產生發表偏見、p值作弊、可重復性低的嚴重問題

于是,Reddit上今天也掀起機器學習論文也要實行“預注冊”的大討論。

預注冊有多好?能夠避免“發表偏見”

研究人員指出,在傳統的提出假設——設計實驗——驗證結果——投稿發表的研究流程中,研究人員容易為獲得正面結果而產生“發表偏見”,可能會對不利于證明研究假設的結論有意隱瞞,甚至對數據進行篡改等造假作弊手段。

他們認為,在進行研究之前記錄下研究假設和實驗方案,確實可以取得預期的結果,能夠減少為獲得正面結果而產生的“發表偏見”。

日前,《Nature》網站也撰文稱,“預注冊”制度確實可以起到預期的“去偽存真”的作用,提高科學研究的可信度和可重復性。

在開始收集數據之前,先將研究方案進行登記和記錄,可能會改變研究結果。圖片來源:Ariana Lindquist / Bloomberg / Getty

文中提到,沒有獲得正面結果的研究往往被歸檔,從此不見天日,這會導致為獲取正面結果而產生的“發表偏見”,損害科學文獻的可信度。

現有分析表明,在進行研究之前,對研究方案進行登記和同行評議,可以改善這個問題,并有助于糾正為獲取正面結果而產生的發表偏見問題。

來自英國卡迪夫大學的研究人員稱,他們的這一研究是對“預注冊”研究方式是否有效的第一次分析。結果發現,事先將研究方案進行登記的研究更有可能報告無效的結果。該分析于10月17日發表在PsyArXiv資源庫上。

預注冊去偽存真:真的能提高研究結果質量

在“預注冊”制度下,研究人員需要在研究開始前就向相應期刊提交研究方案。如果研究方案通過了同行評議,該期刊會暫時承諾在研究完成時將論文發表,無論研究結果如何。

這種做法在過去幾年中已經開始在科學界出現,這一制度起源于美國法律強制要求的臨床試驗中的“預登記”制度。目前約有140種期刊使用這種方式,有130份進行預注冊的研究報告,其最終研究結果已經發表。

“預注冊”制度的支持者希望,該方式能夠打擊那些可疑的研究活動,比如先看結果,或根本不報告負面結果,然后再回頭提出研究假設。

為了考察“預注冊”方式是否會增加研究報告無效結果的頻率,心理學家Chris Allen和David Mehler分析了生物醫學和心理學中113份預登記報告的結果。

在這些研究中,他們考察了296個彼此獨立的研究假設,結果發現,總體而言,這些研究后來發表的結果中,有61%不支持最初的假設。對于考察可重復性研究的驗證研究,這個數字比例要更高一些,為66%,對于原始研究,這一比例為55%。

來源:PsyArXiv,https://psyarxiv.com/3czyt(2018)。

這些數字遠遠高于一般科學文獻中提出的無效結果的比例,以前的研究表明,研究人員估計該比例在5%到20%之間。

預注冊報告的數量呈指數級增長,但研究的代表性還有待提升

不過,荷蘭埃因霍溫科技大學的心理學研究人員Anne Scheel表示,這項研究可能仍然低估了無效研究結果的真實比例。

據其他研究估計,在心理學中測試中的假設實際上為假的比例可能高達90%,Scheel說。這表明當前科學文獻中的實際上的無效結果“與我們期望中不存在任何發表偏見的情況”大不相同。

她表示,這一分析是探索性的,而且研究結果也可以有其他解釋。

比如Scheel說,由于采用“預注冊”可以或多或少地保證論文發表,人們可能會策略性地使用這種制度,提出一些預期可能無法通過驗證的研究假設。

她補充說,“預注冊”制度誕生不久,有可能迄今為止發表的研究并不能更廣泛地代表心理學領域的情況。 “目前還有很多未知因素,”Scheel說。 “但對于科學家來說,這也是一個非常激動人心的時刻。”

目前,預注冊報告的數量正呈指數級增長,Allen現在希望能夠進行樣本量更大的另一項研究,以便回答之前研究提出的一些問題,而且計劃將這項研究也進行“預注冊”。

Reddit呼吁ML中采用“預注冊”:無效結果會比其他領域有用得多

Reddit上便有位用戶拋出了一個討論:

若是能在機器學習領域中召開預登記實驗的會議/期刊就好了。你只要提交理論部分的論文以及實驗的設計,然后讓評審們進行評估,若是他們覺得OK,你再繼續做實驗。而且,無論實驗結果如何,這篇論文都算是被接受了。

此貼一出,便得到了眾多網友的圍觀與評論,網友Flag_Red評論到:

目前很多機器學習的研究都屬于工程學,我覺得在這種情況下,無效結果會比其他領域有用得多。我認為這主要歸結于機器學習在工程方面要比理論方面超前很多。

在其他領域中,他們會說:“這是我的假設”,然后再對其進行測試。若結果無效,仍然是一件非常有意思的事情,“我的假設”本應該有效,卻不知什么原因變得無效了。

然而,在機器學習中,幾乎沒有人在測試假設之前就說,“我認為這將會因為某某原因而起作用”。許多的發現都是來自簡單的實驗。

如果我們能在ML學術界培養一種更傳統的科學文化,那么發表無效結果論文數的增加,也未嘗不是一件好事。但就目前的狀況而言,我認為并不會有多大幫助。

另一位網友表示:

這可能為時過早。無效結果在物理學領域中非常有用,并且具有完善的理論框架。

現在大多數的深度學習是由研究生根據直覺和實證結果結合在一起的。 無效結果可能是一個很好的啟發式方法,但如果沒有一個堅實的理論框架,這個假設期刊中的信噪比會非常高。

當然,這甚至還沒有解決大規模超參數搜索和隨機初始化的問題,我認為這才是真正的問題。你的方法失敗是因為你的原始概念不健全,還是因為你無法找到超參數和/或隨機初始化的正確組合呢?

那么對于在機器學習領域也采用“預注冊”制度,你怎么看呢?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8492

    瀏覽量

    134091
  • Reddit
    +關注

    關注

    0

    文章

    34

    瀏覽量

    5598

原文標題:機器學習論文呼吁“預注冊”,事先評審專治“注水研究”!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    機器學習賦能的智能光子學器件系統研究與應用

    騰訊會議---六月直播 1.機器學習賦能的智能光子學器件系統研究與應用 2.COMSOL聲學多物理場仿真技術與應用 3.超表面逆向設計及前沿應用(從基礎入門到論文復現) 4.智能光學計算成像技術
    的頭像 發表于 06-04 17:59 ?77次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>賦能的智能光子學器件系統研究與應用

    STM32+Android實現的智能家政機器人電路代碼論文及項目源碼

    STM32+Android實現的智能家政機器人電路代碼論文及項目部分截圖:
    發表于 05-28 21:22

    嵌入式機器學習的應用特性與軟件開發環境

    設備和智能傳感器),這些設備通常具有有限的計算能力、存儲空間和功耗。本文將您介紹嵌入式機器學習的應用特性,以及常見的機器學習開發軟件與開發
    的頭像 發表于 01-25 17:05 ?548次閱讀
    嵌入式<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的應用特性與軟件開發環境

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優勢,逐漸成為企業構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發表于 12-25 11:54 ?387次閱讀

    《具身智能機器人系統》第7-9章閱讀心得之具身智能機器人與大模型

    和經驗積累,使機器人能夠自主發現工藝規律,優化作業參數。家庭服務機器人則采用混合任務規劃策略:將訓練的基礎技能與實時規劃相結合,靈活應對開放環境中的各種情況。 第9章深入探討了元學習
    發表于 12-24 15:03

    Reddit測試人工智能問答功能Reddit Answers

    近日,Reddit公司宣布了一項重要的新功能測試計劃,旨在通過人工智能技術為用戶提供更加便捷的問答體驗。這項新功能被命名為Reddit Answers。 據Reddit官方介紹,Reddit
    的頭像 發表于 12-12 09:46 ?576次閱讀

    騰訊對Reddit進行多次股票拋售

    近日,根據向美國證券交易委員會(SEC)提交的文件,騰訊在近期對Reddit進行了多次股票拋售。具體而言,11月19日,騰訊以平均每股133.76美元的價格出售了65.50萬股;在11月14日至11
    的頭像 發表于 11-25 10:46 ?571次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統自身的性能”。事實,由于“經驗”在計算機系統中主要以數據的形式存在,因此機器學習需要設法對數據進行分析學習,這就使得它逐漸成為智能數據分析技術的創新源之一,
    的頭像 發表于 11-16 01:07 ?848次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    LLM和傳統機器學習的區別

    在人工智能領域,LLM(Large Language Models,大型語言模型)和傳統機器學習是兩種不同的技術路徑,它們在處理數據、模型結構、應用場景等方面有著顯著的差異。 1. 模型結構
    的頭像 發表于 11-08 09:25 ?1709次閱讀

    直播預約 |數據智能系列講座第4期:訓練的基礎模型下的持續學習

    神經網絡,特別是訓練的基礎模型研究得到了廣泛的應用,但其仍然主要依賴于在大量樣本的批量式訓練。本報告將探討實現模型的增量式訓練,針對深度神經網絡在增量式學習新任務
    的頭像 發表于 10-18 08:09 ?527次閱讀
    直播預約 |數據智能系列講座第4期:<b class='flag-5'>預</b>訓練的基礎模型下的持續<b class='flag-5'>學習</b>

    NVIDIA在ICRA展示最新機器人研究

    在 日前舉行的 IEEE 國際機器人和自動化大會(ICRA),幾何織物(geometric fabrics)成為一個熱門的討論話題。幾何織物是 NVIDIA 機器人研究實驗室成員與合
    的頭像 發表于 10-10 09:55 ?653次閱讀

    蘋果揭示AI新動向:Apple Intelligence模型在谷歌云端芯片訓練

    蘋果公司在最新的技術論文中披露了一項重要信息,其全新的人工智能系統Apple Intelligence所依賴的模型并非傳統大型科技公司首選的NVIDIA GPU,而是選擇了在谷歌設計的云端芯片上進行訓練。這一決定不僅打破了行
    的頭像 發表于 07-30 15:00 ?754次閱讀

    訓練和遷移學習的區別和聯系

    訓練和遷移學習是深度學習機器學習領域中的兩個重要概念,它們在提高模型性能、減少訓練時間和降低對數據量的需求方面發揮著關鍵作用。本文將從定
    的頭像 發表于 07-11 10:12 ?1897次閱讀

    訓練模型的基本原理和應用

    訓練模型(Pre-trained Model)是深度學習機器學習領域中的一個重要概念,尤其是在自然語言處理(NLP)和計算機視覺(CV)等領域中得到了廣泛應用。
    的頭像 發表于 07-03 18:20 ?4180次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發表于 07-01 11:40 ?2227次閱讀