女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

“沒人比我更懂AI了”介紹45篇讓你跟上AI時代的論文

WpOh_rgznai100 ? 來源:lq ? 2019-07-18 10:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀:AI領域的發展會是IT中最快的。我們所看到的那些黑科技,其后無不堆積了大量論文,而且都是最新、最前沿的論文。從某種角度來講,它們所用的技術跟書籍里的內容確實不是一個時代。要想與時俱進,就必須改變思路——從論文入手。今天給大家介紹45篇讓你跟上AI時代的論文,讀完后,相信你會比“全知全能”的特朗普更了解AI一分。

一、神經網絡基礎部分

No1 wide_deep模型論文:

關于神經元、全連接網絡之類的基礎結構,想必每個AI學者都有了解。那么你是否真的了解全連接網絡中深層與淺層的關系呢?來看看wide_deep模型吧。這篇論文會使你對全連接有個更深刻的理解。

關于該模型的更多介紹可以參考論文:

arxiv.org/pdf/1606.0779

在wide_deep模型中,wide模型和deep模型具有各自不同的分工。

wide模型:一種淺層模型。它通過大量的單層網絡節點,實現對訓練樣本的高度擬合性。它的缺點是泛化能力很差。

deep模型:一種深層模型。它通過多層的非線性變化,使模型具有很好的泛化性。它的缺點是擬合度欠缺。

將二者結合起來——用聯合訓練方法共享反向傳播的損失值來進行訓練—可以使兩個模型綜合優點,得到最好的結果。

No2 wide_deep模型論文:

為什么Adam被廣泛使用?光會用可不行,還得把原理看懂。這樣出去噴一噴,才會顯得更有面子。

Adam的細節請參閱論文《Adam: A Method for Stochastic Optimization》,該論文的鏈接網址是:

arxiv.org/pdf/1412.6980

No3 Targeted Dropout模型論文:

你還再用普通的Dropout嗎?我已經開始用Targeted Dropout了,比你的又快,又好。你不知道吧,趕緊學習一下。

Targeted Dropout不再像原有的Dropout那樣按照設定的比例隨機丟棄部分節點,而是對現有的神經元進行排序,按照神經元的權重重要性來丟棄節點。這種方式比隨機丟棄的方式更智能,效果更好。更多理論見以下論文:

openreview.net/pdf?id=HkghWScuoQ

二、圖像分類部分

No4 Xception模型論文:

在那個圖像分類的時代,谷歌的Xception系列,像x戰警一樣,一個一個的打破記錄。其中的技術也逐漸成為AI發展的知識體系。有必要看一下,或許會對自己的工作有所啟發。

詳細情況請查看原論文《Xception: Deep Learning with Depthwise Separable Convolutions》,該論文網址是:

arxiv.org/abs/1610.0235

No5 殘差結構論文:

運氣好到沒朋友,現有模型,后完善理論指的就是殘差結構這哥們。它的傳奇導致即使到今天的AI技術,也無法將它割舍,就來常微分方程都得拿它比肩。快來學學吧,用處大著呢。好多模型都拿它當先鋒。

利用殘差結構,可以使得網絡達到上百層的深度。詳情請參閱原始論文《Deep ResidualLearning for Image Recognition》,該論文網址是:

arxiv.org/abs/1512.0338

No6 空洞卷積論文:

NasNet的招牌動作,雖然不是出于NASNet,但是卻被人家用得如火純青。有時不得不驚嘆,機器設計出來的模型還真實跟人設計的不一樣!

想知道空洞卷積的感受野為什么與層數呈指數級關系嗎?

細節請查看原論文《Multi-scale context aggregation by dilated convolutions》,該論文網址是:

arxiv.org/abs/1511.0712

No7 DenseNet論文:

這個模型使我想到了“一根筋”,再次證明了只有軸的人才能成大事!另類的模型,神奇的效果,快來體驗一下吧。這可是比華佗還牛的神醫哦!

有關DenseNet模型的細節,請參考原始論文《Densely Connected Convolutional Networks》,該論文的連接是:

arxiv.org/abs/1608.0699

No8 EfficientNet模型論文:

知道目前位置圖像分類界誰是老大嗎?來,看看這個!

EfficientNet模型的論文地址如下:

arxiv.org/pdf/1905.1194

No9 Grad-CAM模型論文:

如果你能把神經元搞得透徹,你也會想到這個點子。不想聊太多!一個字“絕”!這TMD才叫卷積網絡的可視化!

詳細情況請參閱論文《Grad-CAM:Visual Explanations from Deep Networks via Gradient-based Localization》,該論文的鏈接網址是:

arxiv.org/pdf/1610.0239

No10 分類模型泛化能力論文:

知道為啥都喜歡使用ResNet模型當先鋒嗎?運氣好就是運氣好!好到大家都喜歡用它,還說不出為啥它那么好!反正就是好,不信的話看看這篇論文的實驗結果。

論文中,在選取模型的建議中,多次提到了ResNet模型。原因是,ResNet模型在Imgnet數據集上輸出的特征向量所表現的泛化能力是最強的。具體可以參考以下論文:

arxiv.org/pdf/1805.0897

三、批量正則化部分

No11 批量正則化論文:

這個沒的說,必修課,不懂的話,會被鄙視成渣渣!

論文《Batch Normalization Accelerating Deep Network Training by Reducing Internal Covariate Shift》,該論文網址是:

arxiv.org/abs/1502.0316

No12 實例歸一化論文:

時代不同了,批量歸一化也升級了,趕緊學學新的歸一化吧。

在對抗神經網絡模型、風格轉換這類生成式任務中,常用實例歸一化取代批量歸一化。因為,生成式任務的本質是——將生成樣本的特征分布與目標樣本的特征分布進行匹配。生成式任務中的每個樣本都有獨立的風格,不應該與批次中其他的樣本產生太多聯系。所以,實例歸一化適用于解決這種基于個體的樣本分布問題。詳細說明見以下鏈接:

arxiv.org/abs/1607.0802

No13 ReNorm算法論文:

ReNorm算法與BatchNorm算法一樣,注重對全局數據的歸一化,即對輸入數據的形狀中的N維度、H維度、W維度做歸一化處理。不同的是,ReNorm算法在BatchNorm算法上做了一些改進,使得模型在小批次場景中也有良好的效果。具體論文見以下鏈接:

arxiv.org/pdf/1702.0327

No14 GroupNorm算法論文:

GroupNorm算法是介于LayerNorm算法和InstanceNorm算法之間的算法。它首先將通道分為許多組(group),再對每一組做歸一化處理。

GroupNorm算法與ReNorm算法的作用類似,都是為了解決BatchNorm算法對批次大小的依賴。具體論文見下方鏈接:

arxiv.org/abs/1803.0849

No15 SwitchableNorm算法論文:

我們國人做產品都喜歡這么干!all in one ,好吧。既然那么多批量歸一化的方法。來,來,來,我們來個all in one吧。不服來辯,我這啥都有!

SwitchableNorm算法是將BN算法、LN算法、IN算法結合起來使用,并為每個算法都賦予權重,讓網絡自己去學習歸一化層應該使用什么方法。具體論文見下方鏈接:

arxiv.org/abs/1806.1077

四、注意力部分

No16 大道至簡的注意力論文:

把AI搞成玄學也就算了!居然還扯到道家了!谷歌的工程師真實中外通吃啊!搞出來了一個只用注意力就能做事的模型,連卷積都不要了!你說好玩不好玩!至簡不至簡!刺激不刺激!

大名鼎鼎的Attention is All You Need 注意力機制論文

注意力機制因2017年谷歌的一篇論文Attention is All You Need而名聲大噪。下面就來介紹該技術的具體內容。如果想了解更多,還可以參考原論文,具體地址如下:

arxiv.org/abs/1706.0376

No17-18 孿生注意力論文:

好比LSTM與GRU一樣,注意力它們家也除了一對雙胞胎,長得略微有點不同。但是功能一樣,都能吃能喝,還能注意。老虎老鼠傻傻的不清楚!

—BahdanauAttention:arxiv.org/abs/1409.0473。

—LuongAttention:arxiv.org/abs/1508.0402。

No19 各自升級的孿生注意力論文:

話說這對雙胞胎,出生后就分開了。各自學的不同的語言,一個學習漢語,一個學習中文。若干年后,見面,發現二者的能力還是一樣!

BahdanauAttention注意力升級成了normed_BahdanauAttention,而LuongAttention注意力升級成了scaled_LuongAttention。都一樣的效果,你愛用哪個用哪個吧!

例如:

在BahdanauAttention類中有一個權重歸一化的版本(normed_BahdanauAttention),它可以加快隨機梯度下降的收斂速度。在使用時,將初始化函數中的參數normalize設為True即可。

具體可以參考以下論文:

arxiv.org/pdf/1602.0786

No20 單調注意力機制論文:

老公主動表忠心,我以后不看別的美女。老婆覺得不夠,再加個限制:你以后不準看別的女人!于是單調注意力就出來了。

單調注意力機制(monotonic attention),是在原有注意力機制上添加了一個單調約束。該單調約束的內容為:

(1)假設在生成輸出序列過程中,模型是以從左到右的方式處理輸入序列的。

(2)當某個輸入序列所對應的輸出受到關注時,在該輸入序列之前出現的其他輸入將不能在后面的輸出中被關注。

即已經被關注過的輸入序列,其前面的序列中不再被關注。

更多描述可以參考以下論文:

arxiv.org/pdf/1704.0078

No21 混合注意力機制論文:

這個注意力很強大,比一般的注意力專注的地方更多,信息更豐富。我已經注意你很久了!呵呵呵~~~

因為混合注意力中含有位置信息,所以它可以在輸入序列中選擇下一個編碼的位置。這樣的機制更適用于輸出序列大于輸入序列的Seq2Seq任務,例如語音合成任務。

具體可以參考以下論文:

arxiv.org/pdf/1506.0750

五、高級的卷積網絡知識

No22 膠囊網絡與動態路由的論文:

這是一股為圖像分類降溫的寒風,深刻而又尖銳的點出了卷積網絡的硬傷!從事最大池化再無翻身之日。

雖然膠囊網絡在實際應用中,不像它的理論那么牛,但是對AI的幫助,卷積的理解是革命性的,非常值得一讀。另外,這也是一篇絕對讓你對數學徹底絕望的論文。花幾根白頭發把里面的算法啃下來吧,這樣你與大神就能更近一步。

膠囊網絡分為主膠囊與數字膠囊,主膠囊與數字膠囊之間的耦合系數是通過訓練得來的。在訓練過程中,耦合系數的更新不是通過反向梯度傳播實現的,而是采用動態路由選擇算法完成的。該算法來自以下論文鏈接:

arxiv.org/pdf/1710.0982

目前膠囊網絡的研究還處于初級階段,隨著人們研究的深入,相信這些問題會得到解決。

No23 矩陣膠囊網絡與EM路由算法:

如果你覺得不過癮,那么還可以再看一篇。繼續自虐一下。

帶有EM(期望最大化)路由的矩陣膠囊網絡是動態路由膠囊網絡的一個改進版本。論文鏈接如下:

openreview.net/pdf?id=HJWLfGWRb

No24 膠囊網絡的其它用處:

膠囊網絡混身是寶,但就是自己不爭氣。這也說明還有上升的空間。就拿其中一個動態路由算法來講,居然比普通的注意力還好。

看完之后,相信你一定會手癢!要不要也試試?把你的注意力換一下。值得你嘗試,會有彩蛋的!

該論文的實踐也證明,與原有的注意力機制相比,動態路由算法確實在精度上有所提升。具體介紹可見以下論文:

arxiv.org/pdf/1806.0150

No25 卷積網絡新玩法TextCNN模型:

早先小編在一個項目中,自己用卷積網絡處理字符數據。自己感覺很Happy。沒想到,無意間居然發現了一篇同樣這么干的論文。居然還有個名字,叫TextCNN。哎!可惜啊!小編文化少,只會寫代碼,不會寫論文。

TextCNN模型是利用卷積神經網絡對文本進行分類的算法,由 Yoon Kim 在 Convolutional Neural Networks for Sentence Classification 一文中提出。論文地址:

arxiv.org/pdf/1408.5882

六、圖像內容處理部分

No26 FPN模型論文(包含了ROIAlign的匹配算法):

要是搞計算機視覺,還是要建議看一下。非常的基礎。也是圖像分割方面的用得最多得模型。

FPN的原理是:將骨干網絡最終特征層和中間特征層的多個尺度的特征以類似金字塔的形式融合在一起。最終的特征可以兼顧兩個特點——指向收斂目標的特征準確、特征語義信息豐富。更多信息可以參考論文:

ROIAlign層中的匹配算法也來自于這篇FPN論文,鏈接如下:

arxiv.org/abs/1612.0314

No27 Mask R-CNN模型論文:

效果好,代碼多!硬貨!來啃吧!

Mask R-CNN模型是一個簡單、靈活、通用的對象實例分割框架。它能夠有效地檢測圖像中的對象,并為每個實例生成高質量的分割掩碼,還可以通過增加不同的分支完成不同的任務。它可以完成目標分類、目標檢測、語義分割、實例分割、人體姿勢識別等多種任務。具體細節可以參考以下論文:

arxiv.org/abs/1703.0687

No28 YOLO V3模型論文:

這個模型的提點就是快!目標識別強烈推薦。

YOLO V3模型的更多信息可以參考以下鏈接中的論文:

https://pjreddie.com/media/files/papers/YOLOv3.pdf

No29 Anchor-Fress模型--FCOS模型論文:

隨著AI技術的進步Anchor-Fress模型死灰復燃(早先是YOLO V1那一批模型),這次不一樣的是徹底干掉帶Anchor的模型。訓練起來那就一個爽!媽媽再也不用為我準備單獨的Anchor標簽了。

與YOLO V1相比, FCOS模型的思想與YOLO V1模型非常相似,唯一不同的是FCOS模型沒有像YOLOv1那樣只考慮中心附近的點,而是利用了ground truth邊框中所有的點來進行預測邊框。并且通過 center-ness 分支來抑制那些效果不行的檢測邊框。這樣FCOS 就可以改善YOLO V1模型總會漏掉部分檢測邊框的缺點。

相關論文地址:

arxiv.org/abs/1904.0135

No30 Anchor-Fress模型--CornerNet-Lite模型論文:

一樣也是Anchor-Fress模型,與FCOS效果差不多少,具體看一下論文吧。

CornerNet-Lite模型。相關論文地址:

arxiv.org/pdf/1904.0890

No31 棧式沙漏網絡模型--Hourglass論文:

最初用戶人的姿態估計,在符合模型中也是常被使用的模型。論文地址:

arxiv.org/abs/1603.0693

No32 OCR必修課——STN模型論文:

可以讓模型自動仿射變化,你說牛不牛!要學OCR,就得從這個開始。

有關STN模型的論文鏈接如下:

arxiv.org/abs/1506.0202

七、循環神經網絡部分

No33 QRNN模型論文:

在RNN模型的cell里,如果還只知道LSTM和GRU。那就太low了。快來補補吧:

如果想更多了解QRNN,可以參考以下論文:

arxiv.org/abs/1611.0157

No34 SRU模型論文:

接著來,各種RNN的Cell。又漂亮,又好吃!

SRU單元在本質上與QRNN單元很像。從網絡構建上看,SRU單元有點像QRNN單元中的一個特例,但是又比QRNN單元多了一個直連的設計。

若需要研究SRU單元更深層面的理論,可以參考如下論文:

arxiv.org/abs/1709.0275

No35 IndRNN模型論文:

再補一個,這可都是好cell啊!

將IndRNN單元配合ReLu等非飽和激活函數一起使用,會使模型表現出更好的魯棒性。

有關IndRNN單元的更多理論,可以參考論文:

arxiv.org/abs/1803.0483

No36 IndRNN模型論文:

最后,再來一個cell,如想要了解更多關于JANET單元的內容,可以參考以下論文:

arxiv.org/abs/1804.0484

八、AI合成部分

No37-38 Tacotron與Tacotron-2模型論文:

AI合成部分的經典模型,以上結構來自Tacotron與Tacotron-2兩個結構,更多內容可以參考以下兩篇論文:

arxiv.org/pdf/1703.1013

arxiv.org/pdf/1712.0588

No39 DeblurGAN模型論文:

圖片合成的論文太多了。這里簡單列幾個,大體原理和思路了解即可。

DeblurGAN模型是一個對抗神經網絡模型,由生成器模型和判別器模型組成。

—生成器模型,根據輸入的模糊圖片模擬生成清晰的圖片。

—判別器模型,用在訓練過程中,幫助生成器模型達到更好的效果。

具體可以參考論文:

arxiv.org/pdf/1711.0706。

No40 AttGAN模型論文:

同樣,這也是個圖片合成的。不同的是多屬性合成,相對比較有意思。

AttGAN模型由兩個子模型組成:

(1)利用編碼器模型將圖片特征提取出來。

(2)將提取的特征與指定的屬性值參數一起輸入編碼器模型中,合成出最終的人臉圖片。

更多細節可以參考論文:

arxiv.org/pdf/1711.1067

No41 RNN.WGAN模型論文:

可以合成文本的GAN。離散數據也能干!

RNN.WGAN模型使用了WGAN模型的方法進行訓練。詳細做法可以參考如下論文:

arxiv.org/abs/1704.0002

九、多任務學習

No42 MKR模型論文:

多任務學習模型有必要了解一下。這里推薦一個論文給你看看。

MKR是一個多任務學習的端到端框架。該框架能夠將兩個不同任務的低層特征抽取出來,并融合在一起實現聯合訓練,從而達到最優的結果。有關MKR的更多介紹可以參考以下鏈接:

arxiv.org/pdf/1901.0890

十、NLP部分

No43 BERT模型論文:

如果你搞NLP,那么這個就不用我來介紹了。如果你準備搞NLP,那么趕緊來看看這個,跟上時代。

BERT相關論文鏈接

arxiv.org/abs/1810.0480

在BERT之后,又出了好多優秀的模型。但是,還是先把這個啃下來,再看別的才不費勁。

十一、模型攻防

No44 FGSM模型論文:

攻擊模型的經典方法。值得掌握。

FGSM(Fast Gradient Sign Method)是一種生成對抗樣本的方法。該方法的描述如下:

(1)將輸入圖片當作訓練的參數,使其在訓練過程中可以被調整。

(2)在訓練時,通過損失函數誘導模型對圖片生成錯誤的分類。

(3)當多次迭代導致模型收斂后,訓練出來的圖片就是所要得到的對抗樣本。

具體可以參考論文:

arxiv.org/pdf/1607.0253

No45 黑箱攻擊論文:

基于雅可比(Jacobian)矩陣的數據增強方法,是一種常用的黑箱攻擊方法。該方法可以快速構建出近似于被攻擊模型的決策邊界,從而使用最少量的輸入樣本。即:構建出代替模型,并進行后續的攻擊操作。

詳細請見如下鏈接:

arxiv.org/abs/1602.0269

這里只是列了一些基礎的論文。如果這45篇論文看完,可以保證你再看到大廠的產品時,不會感覺有代溝。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    35109

    瀏覽量

    279603
  • 論文
    +關注

    關注

    1

    文章

    103

    瀏覽量

    15210
  • 黑科技
    +關注

    關注

    14

    文章

    129

    瀏覽量

    37915

原文標題:讀完這45篇論文,“沒人比我更懂AI了”

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發的新一代AI大模型。其核心優勢在于強大的推理引擎能力,融合自然語言處理(NLP)、深度
    發表于 07-16 15:29

    失去工作不是因為AI,而是因為使用AI的人

    當算法能精準預測消費者需求時,當AI生成的文案比人類傳播心理學時,當自動化系統開始取代基礎決策崗位時,真正的危機已悄然降臨—— 不是AI在搶奪
    的頭像 發表于 05-13 12:05 ?231次閱讀
    <b class='flag-5'>你</b>失去工作不是因為<b class='flag-5'>AI</b>,而是因為使用<b class='flag-5'>AI</b>的人

    【「零基礎開發AI Agent」閱讀體驗】+ 入門學習

    的是基礎,主要從為什么要學習AI Agent和開發AI Agent的知識儲備入手進行介紹。作為入門AI Agent的小白還是很有必要學習的
    發表于 05-02 09:26

    正點原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續航,語音暢聊,情景對話,知識科普,多色可選,隨身攜帶!

    正點原子 AI BOX0攜小智AI來襲,專屬的智能伴侶!的全能AI伙伴,懂你貼心 正點原子
    發表于 04-24 16:11

    【「零基礎開發AI Agent」閱讀體驗】+初品Agent

    期待中的《零基礎開發AI Agent——手把手教你用扣子做智能體》終于寄到了,該書由葉濤、 管鍇、張心雨完成,并由電子工業出版社出版發行。 全書分為三個部分,即入門、工具及實踐
    發表于 04-22 11:51

    【「零基礎開發AI Agent」閱讀體驗】總體預覽及入門

    基礎知識有所補充,另外書本后面的案例也會對Ai的應用產生一些啟發. 首先老規矩,先看一下目錄結構 包含3大主題: 入門:介紹Agent的概念、發展、與Prompt和Copilot
    發表于 04-20 21:53

    首創開源架構,天璣AI開發套件端側AI模型接入得心應手

    Studio提供最優解。Neuron Studio可針對模型到應用,提供一站式、全鏈路、自動化的開發協助,不僅AI應用開發的全流程可視化,帶來整個多種工具的一站式開發能力,還支
    發表于 04-13 19:52

    AI 時代開啟,企業跟風做 AI 產品是明智之舉?

    AI
    華成工控
    發布于 :2025年04月10日 17:28:44

    適用于數據中心和AI時代的800G網絡

    ,成為新一代AI數據中心的核心驅動力。 AI時代的兩大數據中心:AI工廠與AIAI
    發表于 03-25 17:35

    【「AI Agent應用與項目實戰」閱讀體驗】書籍介紹

    會追根溯源,有種“大徹大悟”的感覺。 這本書主要講大語言模型的內容,教我們做一個AI Agent應用出來,其實這個東西現在也叫智能體,他跟我們平常使用大語言模型有個不同點在于他會
    發表于 03-05 20:40

    AI Agent應用與項目實戰》閱讀體驗--跟著迪哥學Agent

    的知識是自由行,那么閱讀《Agent》就是跟團游。它我對AI落地應用有系統和清晰的了解。 《Agent》第一章是全書的導引章節,本章
    發表于 03-02 12:28

    當我問DeepSeek AI爆發時代的FPGA是否重要?答案是......

    AI時代,FPGA(現場可編程門陣列)具有極其重要的地位,主要體現在以下幾個方面: 1.硬件加速與高效能 ? 并行處理能力:FPGA內部由大量可編程邏輯單元組成,能夠實現高度并行的數據處理。這種
    發表于 02-19 13:55

    AI賦能邊緣網關:開啟智能時代的新藍海

    。這一變革不僅帶來了技術架構的革新,更為產業發展開辟新的增長空間。 傳統邊緣網關受限于計算能力和算法支持,往往只能完成數據采集和簡單處理,大量原始數據需要回傳云端處理,導致響應延遲和帶寬壓力。AI技術
    發表于 02-15 11:41