如果你想要一本書來幫助你入門深度學習生成模型,那么最新出版的“Generative Deep Learning”一定是不二之選。本書囊括了包括BERT/GPT-2, StyleGAN等近五年來最先進的GAN,帶你走進生成模型的奇妙世界。
現在是2019年7月20日UTC時間20:17。
50年前的今天,尼爾·阿姆斯特朗和巴茲·奧爾德林駕駛駕駛的登月艙“鷹”號降落在月球上。這是一項偉大的工程壯舉,充滿著勇氣和堅定的決心。
快進50年,將這些宇航員帶到月球表面去的阿波羅制導計算機(AGC)的處理能力就在你的口袋里——事實上,iPhone 6的計算能力就足以引導1.2億個阿波羅11號飛船登月,而且是在同一時間。
這一事實并沒有真正公正地反映AGC的輝煌。由于摩爾定律,你可以選擇任何計算機器,也可以說50年后,將會有一臺機器能夠比它的運行速度快22?倍。
編寫AGC代碼的軟件團隊的負責人是瑪格麗特·漢密爾頓(Margaret Hamilton),她沒有把那時的硬件限制看作是一種障礙,而是一種挑戰。她利用當時可用的資源完成了不可想象的目標。
Margaret Hamilton
這讓我想到…
《生成式深度學習》新書
459天前,我收到來自O'Reilly Media的消息,詢問我是否有興趣寫一本書。當時我覺得這似乎是個好主意,所以答應了,并決定寫一本關于生成模型的最新指南——特別是如何構建最先進的深度學習模型,這樣的模型可以繪畫、寫作、作曲和玩游戲。
更重要的是,我希望這本書能讓讀者深入了解生成式深度學習,并構建能夠做出各種令人驚嘆的事情的模型,而不需要大量昂貴且耗時的計算資源。
我很高興地宣布,這本書現在可以可以通過亞馬遜購買,也可以在O’Reilly網站上購買電子版。(注:作者David Foster是Applied Data Science的聯合創始人)
我堅信,掌握任何技術的秘訣都是首先解決小問題,但是要了解每一行代碼背后的原理。
如果你一開始就搞龐大的數據集和模型,那么會需要一天而不是一個小時的時間來運行,你不會學到更多的東西——只是將學習的速度放慢了24倍。
如果說登月教會了我們什么的話,那就是真正令人驚奇的事情是可以在非常少的計算資源下實現的,我的目標是讓你在讀完這本書后,對生成模型有同樣的感受。
封面的鸚鵡是怎么回事?
為O’Reilly寫書最棒的一點是,他們會在你的書的封面上畫一只動物——我得到了一只畫好的長尾小鸚鵡,我親切地給它取名為Neil Wingstrong。
長尾小鸚鵡Neil Wingstrong
那么現在鸚鵡已經著陸,你還能從這本書中期待什么呢?
這本書是關于什么的?
這是一本關于生成模型的動手指南。
它將帶你了解基本生成模型的基礎知識,然后逐步構建更復雜的模型——始終使用實際示例、架構圖和代碼。
這本書適合任何想要深入了解當前熱門的生成模型的人。你不需要深度學習的先驗知識,所有代碼示例都是用Python編寫的。
這本書涵蓋哪些內容?
我試圖涵蓋過去5年來所有的重要生成模型。
如下面的時間軸所示。
全書分為兩部分,章節提綱如下:
第一部分:生成式深度學習簡介
本書的前四章旨在介紹開始構建生成式深度學習模型所需的核心技術。
1. 生成模型
我們對生成建模領域進行了廣泛的研究,并考慮了我們試圖從概率角度解決的問題的類型。然后,我們探索了基本概率生成模型的第一個例子,并分析為什么隨著生成任務的復雜性增加,可能需要部署深度學習技術。
2. 深度學習
本章將指導你開始構建更復雜的生成模型所需的深度學習工具和技術。我們將介紹Keras,一個用于構建神經網絡的框架,可用于構建和訓練一些在文獻中發表的最先進的深度神經網絡架構。
3.變分自動編碼器
在本章中,我們將介紹第一個生成深度學習模型——變分自動編碼器。這一強大的技術將允許我們從頭開始生成逼真的面孔,并改變現有的圖像——例如,添加微笑,或改變某人頭發的顏色。
4. 生成對抗網絡(GANs)
本章探討了近年來最成功的生成模型技術之一——生成對抗性網絡。這個用于構建生成模型問題的優雅框架是大多數最先進的生成模型背后的基礎引擎。我們將學習它的微調的方式,從而不斷推進生成模型能夠實現的邊界。
第二部分:教機器繪畫、寫作、作曲和玩游戲
第二部分提供了一組案例研究,展示了如何將生成建模技術應用于特定的任務。
5. 繪畫
在本章中,我們將研究兩種與機器繪畫有關的技術。首先我們來看看CycleGAN,顧名思義,它是GAN架構的一個改編,允許模型學習如何將照片轉換成特定風格的繪畫(反之亦然)。我們還探索了包含在許多照片編輯應用程序中的神經風格遷移技術,這種技術允許你將一幅畫的風格轉移到一張照片上,給人一種這是同一位藝術家的畫的印象。
6. 寫作
在本章中,我們將注意力轉向機器寫作,這是一項對圖像生成提出不同挑戰的任務。本章介紹了遞歸神經網絡(RNN)的結構,它允許我們處理涉及序列數據的問題。我們還將了解encoder–decoder 架構是如何工作的,并構建一個問答生成器。
7. 作曲
本章著眼于音樂生成,這也是一個序列生成問題,但提出了額外的挑戰,如建模音樂的音高和節奏。我們將了解許多用于文本生成的技術如何可以應用于音樂生成任務,但我們還將探索一個稱為MuseGAN的深度學習架構,它將第4章(關于GAN)中的思想應用于音樂數據。
8. 玩游戲
本章展示了生成模型如何應用于其他機器學習領域,如強化學習。最近幾年最激動人心的一篇論文是“世界模型”,作者展示了一個生成模型可以用作智能體訓練的環境,因此本質上允許智能體對未來可能的場景“做夢”,想象如果采取某些行動會發生什么,完全在其環境的概念模型中。
9. 生成模型的未來
本章是對當前生成模型的概述,并回顧了在本書中介紹的技術。我們還將放眼未來,探索今天可用的最先進技術如GPT-2和BigGAN可能如何改變我們創造的方式,我們是否能創造一個人造實體,它可以生產內容,創造性地生成藝術作品、文學和音樂。
10. 結論
本章關于為什么生成式深度學習在未來5-10年可能成為機器學習最重要、最有影響力的領域。
總結
在一個事實和虛構不那么容易分離的世界里,至關重要的是有一些工程師能夠詳細地理解生成模型的工作原理,并且不會因為技術限制而卻步。
希望這本書能幫助你了解當前最先進的技術,同時也能讓你享受閱讀的樂趣。
-
GaN
+關注
關注
19文章
2184瀏覽量
76238 -
深度學習
+關注
關注
73文章
5555瀏覽量
122527
原文標題:O'Reilly新書:《生成式深度學習》,近5年最先進GAN一網打全!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論