機器學習和數據科學離不開數學,本文從數學基礎的角度入手,推薦了數據科學和機器學習方面的七本參考書以及兩本補充讀物。相信對打好數學基礎的相關人士會有所幫助。
大多數人學習數據科學的人都會把重點放在編程上,實際上編程能力確實是機器學習和數據科學領域的重要技能。但是,要真正精通數據科學和機器學習,必然不能忽視的數據科學背后的數學基礎。
出于這個目的,本文介紹了七本在注重打好數據科學的數學基礎上的技術讀物。當然,涉及到數學,往往閱讀體驗可能不會很舒服,但要搞好機器學習,數學基礎是必須要打牢的,所以努力讀書吧!
先說一說為什么在數據科學學習時打好數學基礎。
以下是我總結的幾個原因:
AI領域無時無刻不在迅速變化。Hinton認為,我們也許應該重新思考反向傳播。掌握牢固的數學知識有助于更好地理解AI的演變。一個數學基礎深厚的人,對AI的理解和認識與其他僅從表面認識AI的人有很大的區別。此外,掌握數學知識還能更好地了解AI技術帶來知識產權的潛力。最后,了解數據科學背后的數學知識,也可以讓人更容易獲得AI和數據科學的高端職位。
此外,作者推薦這幾本書,還有兩點個人原因:
1.作者在牛津大學教授物聯網數據科學的課程,也包括一些AI技術應用方面的教學事務,在教學過程中涉及到數學基礎知識和課程。
2.其次,作者在寫一本書來簡述人工智能,從數學的角度入手,目標讀者是14到18歲的少年。要深入了解數學科學和人工智能數學的數學基礎,你需要了解四個方面知識:線性代數,概率論,多元微積分和優化。目前在高中階段至少會教授這些課程的一部分內容。因此,我試圖將高中數學與人工智能和數據科學聯系起來,重點是數學建模。
下面進入正題:
(1) The Nature Of Statistical Learning Theory《統計學習理論的本質》
作者:VladimirVapnik
PDF資源:
https://statisticalsupportandresearch.files.wordpress.com/2017/05/vladimir-vapnik-the-nature-of-statistical-learning-springer-2010.pdf
如果說要列一份關于數學的書單,這本書是繞不過去的。本書單中排名第一的就是俄羅斯著名數學家VladimirVapnik的《統計學習理論的本質》。在這份清單中的所有書籍中,Vapnik這本是最不好找的。VladimirVapnik是支持向量機(SVM)的創始人。他的維基百科頁面中提供了更多關于他研究成果的介紹。
(2)Pattern Classification(2007-12-24)《模式分類》
作者:RichardODuda
PDF資源:
https://cds.cern.ch/record/683166/files/0471056693_TOC.pdf
就像Vapnik的著作一樣,Duda的著作時另一個時代的另一部經典。本書初版于1973年,在二十多年后的2000年才推出第二版,此后一直未再版。時隔近二十年,本書仍然是一個重要資源。本書采用模式識別方法,并涵蓋了廣泛的算法。
(3)
MachineLearning:AnAlgorithmicPerspective,SecondEdition(Chapman&Hall/CrcMachineLearning&PatternRecognition)
《機器學習:算法視角》
PDF資源:
https://doc.lagout.org/science/Artificial%20Intelligence/Machine%20learning/Machine%20Learning_%20An%20Algorithmic%20Perspective%20%282nd%20ed.%29%20%5BMarsland%202014-10-08%5D.pdf
這本書現在已經出版了第二版。此書第一版是我讀過的最早的書關于機器學習和算法的著作之一,第二版增加了更多Python代碼。與前兩本書一樣,本書也非常強調算法。
(4)
TheElementsofStatisticalLearning:DataMining,Inference,andPrediction,SecondEdition
《統計學習基礎:數據挖掘、推理和預測》(第二版)
作者:TrevorHastie,RobertTibshirani,JeromeFriedman
PDF資源:https://web.stanford.edu/~hastie/Papers/ESLII.pdf
另一本經典之作,可以作為參考書。
(5)Pattern Recognition and Machine Learning (Information Science and Statistics)
《模式識別與機器學習(信息科學與統計)》
作者:ChristopherM.Bishop
PDF資源:http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf
ChristopherM.Bishop的模式識別和機器學習(信息科學和統計學)也是一本深入而精心設計的參考書。
(6)
MachineLearning:TheArtandScienceofAlgorithmsthatMakeSenseofData
作者:PeterFlach
PDF資源:http://www.cs.put.poznan.pl/tpawlak/files/ZMIO/W02.pdf
我喜歡PeterFlach的書,盡管亞馬遜網站上的一些評論說這書寫得太羅嗦,而且代碼量顯得不足。我特別喜歡這本書中的算法分組(邏輯模型,線性模型,概率模型)章節以及這些主題的整體講述方式。
最后,是我最推薦的一本書:
(7)Deep Learning《深度學習》
作者:Goodfellow、Bengio、Corville
相關資源:https://www.deeplearningbook.org/
如果你在找一本值得逐頁讀完的書,就是它了!這本書既詳細,又有現代感,書中內容幾乎涵蓋了你能想到的關于深度學習的一切知識。
補充兩本書:
A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition) by Simon Rogers, Mark Girolami
作者:SimonRogers,MarkGirolami
我覺得這本書并不太適合初學者,但它仍然是一本好書(特別是第二版)
MachineLearning:AProbabilisticPerspective
作者:KevinMurphy
這本書中評價也很高,但我個人沒有讀過(因此沒有收集)。
寫在最后:
除了最后一本《深度學習》之外,我建議其他書不必逐頁閱讀,而是將其作為參考書,根據需要按相應主題閱讀相應的書籍。這些書教會了我時刻保持謙遜。無論我們現在知道了多少,掌握了多少知識,都總能在閱讀過程中發現,這個領域原來是如此的龐大和復雜。
這些書已經超越了時間。VladimirVapnik現年已經81歲。Duda的著作初版于1973年。我預計50年以后,這個行業里的人們仍然會閱讀這些著作。就像與那些經歷了時間考驗的老朋友們重逢一樣。多年之后,也許你會發現,在眼花繚亂的技術、模型和框架背后,數學是永恒的。
-
AI
+關注
關注
87文章
34280瀏覽量
275465 -
機器學習
+關注
關注
66文章
8492瀏覽量
134118 -
數據科學
+關注
關注
0文章
168瀏覽量
10407
原文標題:【薦書】提升機器學習數學基礎,這7本書一定要讀(附pdf資源)
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
(專家著作,建議收藏)電機的數學研究方法
國產首款量產型七位半萬用表!青島漢泰開啟國產高精度測量新篇章。
【「芯片通識課:一本書讀懂芯片技術」閱讀體驗】圖文并茂,全面詳實,值得閱讀的芯片科普書
名單公布!【書籍評測活動NO.57】芯片通識課:一本書讀懂芯片技術
國巨產品在筆記本電腦上的應用
OSI七層模型中的數據封裝過程
《AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感
AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感
《AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得
《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得
名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新
如意香山筆記本軟件適配工作穩步推進,成功運行多款Linux發行版及國產辦公套件
ElfBoard技術貼|在NXP源碼基礎上適配ELF 1開發板的按鍵功能

評論