女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于代碼的機器學習是什么,它的原理如何

獨愛72H ? 來源:CDA數據分析師 ? 作者:CDA數據分析師 ? 2020-03-20 15:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:CDA數據分析師)

隨著IT組織的發(fā)展,其代碼庫的大小以及開發(fā)人員工具鏈的復雜性也在不斷增長。工程負責人對其代碼庫,軟件開發(fā)過程和團隊狀態(tài)了解的非常有限。通過將現代數據科學和機器學習技術應用于軟件開發(fā),大型企業(yè)有機會顯著提高其軟件交付性能和工程效率。

在過去的幾年中,許多大型公司,例如Google,Microsoft,Facebook以及類似Jetbrains等較小的公司已經與學術研究人員合作,為基于代碼的機器學習奠定了基礎。

基于代碼的機器學習是什么,它的原理如何

基于代碼的機器學習?代碼機器學習(MLonCode)是一個新的跨學科研究領域,涉及自然語言處理,編程語言結構以及社會和歷史分析,例如貢獻圖形和提交時間序列。MLonCode旨在從大規(guī)模的源代碼數據集中學習,從而能自動執(zhí)行軟件工程任務,例如輔助代碼審查,代碼重復數據刪除,軟件專業(yè)知識評估等。

為什么MLonCode很難?某些MLonCode問題要求零錯誤率,例如與代碼生成有關的錯誤率。自動程序修復是一個特定的示例。一個微小的單一錯誤預測可能會導致整個程序的編譯失敗。

在其他一些情況下,錯誤率必須足夠低。理想的模型應犯的錯誤應盡可能少,所以用戶(軟件開發(fā)人員)的信噪比仍是可承受且值得信賴的。因此,可以使用與傳統(tǒng)靜態(tài)代碼分析工具相同的方式來使用該模型。最佳實踐挖掘就是一個很好的例子。

最后,絕大多數MLonCode問題是無監(jiān)督的,或至多是弱監(jiān)督的。手動標記數據集可能會非常昂貴,因此研究人員通常必須開發(fā)相關的啟發(fā)式方法。例如,有許多相似性分組任務,例如向相似的開發(fā)人員展示或根據專業(yè)領域幫助團隊。我們在本主題中的經驗在于挖掘代碼格式化規(guī)則,并將其應用于修復錯誤,這與短絨一樣,但完全不受監(jiān)督。有一個相關的學術競賽來預測格式問題,稱為CodRep。

基于代碼的機器學習是什么,它的原理如何

MLonCode問題包括各種數據挖掘任務,這些任務從理論上講可能是微不足道的,但由于規(guī)?;驅毠?jié)的關注,在技術上仍然具有挑戰(zhàn)性。示例包括代碼克隆檢測和類似的開發(fā)人員聚類。此類問題的解決方案在年度學術會議“ 采礦軟件存儲庫”中進行了介紹。

采礦軟件存儲庫會議徽標。解決MLonCode問題時,通常用以下方式之一表示源代碼:頻率字典(加權詞袋,BOW)。示例:函數內的標志符;文件中的graphlet;存儲庫的依賴性;可以通過TF-IDF加權頻率等。這些表示是最簡單,可伸縮性最高的。順序令牌流(TS),對應于源代碼解析序列。該流通常通過指向相應抽象語法樹節(jié)點的鏈接來增強。此表示形式對常規(guī)自然語言處理算法(包括序列到序列深度學習模型)很友好。

一棵樹,它自然地來自抽象語法樹。在進行不可逆的簡化或標志符后,我們執(zhí)行各種轉換。這是最強大的表示形式,也是最難使用的表示形式。以下是相關的ML模型包括各種圖嵌入和門控圖神經網絡。

解決MLonCode問題的許多方法都基于所謂的自然假說(Hindle等):“從理論上講,編程語言是復雜,靈活且功能強大的,但很多人實際上編寫的程序大多是簡單且相當重復的,因此它們具有有用的可預測統(tǒng)計屬性,可以在統(tǒng)計語言模型中捕獲并用于軟件工程、任務?!?/p>

該聲明證明了大代碼的有用性:分析的源代碼越多,強調的統(tǒng)計屬性越強,并且訓練有素的機器學習模型所獲得的指標越好。底層關系與當前最新的自然語言處理模型相同:如XLNet,ULMFiT等。類似地,通用MLonCode模型可以在下游任務中進行訓練和利用。
(責任編輯:fqj)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 代碼
    +關注

    關注

    30

    文章

    4900

    瀏覽量

    70705
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134584
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    機器學習模型市場前景如何

    當今,隨著算法的不斷優(yōu)化、數據量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器學習模型市場的未來發(fā)展。
    的頭像 發(fā)表于 02-13 09:39 ?359次閱讀

    嵌入式機器學習的應用特性與軟件開發(fā)環(huán)境

    作者:DigiKey Editor 在許多嵌入式系統(tǒng)中,必須采用嵌入式機器學習(Embedded Machine Learning)技術,這是指將機器學習模型部署在資源受限的設備(如微
    的頭像 發(fā)表于 01-25 17:05 ?658次閱讀
    嵌入式<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的應用特性與軟件開發(fā)環(huán)境

    傳統(tǒng)機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統(tǒng)機器學習的基礎知識和多種算法特征,供各位老師選擇。 01 傳統(tǒng)機器
    的頭像 發(fā)表于 12-30 09:16 ?1183次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發(fā)表于 12-25 11:54 ?452次閱讀

    自然語言處理與機器學習的關系 自然語言處理的基本概念及步驟

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能和語言學領域的一個分支,致力于研究如何讓計算機能夠理解、解釋和生成人類語言。機器學習(Machine
    的頭像 發(fā)表于 12-05 15:21 ?1976次閱讀

    ASR和機器學習的關系

    自動語音識別(ASR)技術的發(fā)展一直是人工智能領域的一個重要分支,使得機器能夠理解和處理人類語言。隨著機器學習(ML)技術的迅猛發(fā)展,ASR系統(tǒng)的性能和準確性得到了顯著提升。 ASR
    的頭像 發(fā)表于 11-18 15:16 ?778次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統(tǒng)自身的性能”。事實上,由于“經驗”在計算機系統(tǒng)中主要以數據的形式存在,因此機器學習需要設法對數據進行分析學習,這就使得逐漸成為智能數據分析技術的創(chuàng)新源之一,
    的頭像 發(fā)表于 11-16 01:07 ?963次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統(tǒng)的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習機器
    的頭像 發(fā)表于 11-15 09:19 ?1211次閱讀

    具身智能與機器學習的關系

    (如機器人、虛擬代理等)通過與物理世界或虛擬環(huán)境的交互來獲得、發(fā)展和應用智能的能力。這種智能不僅包括認知和推理能力,還包括感知、運動控制和環(huán)境適應能力。具身智能強調智能體的身體和環(huán)境在智能發(fā)展中的重要性。 2. 機器學習的定義
    的頭像 發(fā)表于 10-27 10:33 ?1047次閱讀

    人工智能、機器學習和深度學習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中一個很大的子集是機器學習——讓算法從數據中學習。
    發(fā)表于 10-24 17:22 ?2974次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區(qū)別

    【「時間序列與機器學習」閱讀體驗】時間序列的信息提取

    個重要環(huán)節(jié),目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續(xù)的分析和預測任務。 特征工程(Feature Engineering)是將數據轉換為更好地表示潛在問題的特征,從而提高機器學習
    發(fā)表于 08-17 21:12

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    之前對《時間序列與機器學習》一書進行了整體瀏覽,并且非常輕松愉快的完成了第一章的學習,今天開始學習第二章“時間序列的信息提取”。 先粗略的翻閱第二章,內容復雜,充斥了大量的定義、推導計
    發(fā)表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】+ 鳥瞰這本書

    這本書不僅內容豐富,而且當我打開時,它還帶有一種特殊的含義--頁面上的簽名來自一次溫暖的社區(qū)活動。這些簽名充當了作者、讀者和整個學習社區(qū)之間的紐帶,見證了知識的轉移和成長的樂趣。 本書目錄結構
    發(fā)表于 08-12 11:28

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器學習如何在這一領域發(fā)揮巨
    發(fā)表于 08-12 11:21

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    收到《時間序列與機器學習》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個讓我學習時間序列及應用的機會! 前言第一段描述了編寫背景: 由此可知,這是一本關于時
    發(fā)表于 08-11 17:55