機器學習實踐指南.pdf
http://www.www.srpcoatings.com
2020年11月18日
![]() |
| 第1頁 |
![]() |
| 第8頁 |
![]() |
| 第19頁 |
![]() |
| 第28頁 |
![]() |
| 第50頁 |
![]() |
| 第59頁 |
參見附件(14126KB,69頁)。
機器學習實踐指南通過知識介紹,使讀者了解收集數(shù)據(jù)、準備使用數(shù)據(jù)、訓練模型、評估模型的性能,以及改進模型的性能的方法;通過對實際問題解決的講解,幫助讀者獲得處理機器學習問題的經(jīng)驗。

本書的主要內(nèi)容
第1章涵蓋了機器學習的各種概念。本章使讀者初步了解本書涵蓋的各個主題。
第2章包括以下算法:判別函數(shù)分析、多元邏輯回歸、Tobit回歸、泊松回歸。
第3章包括以下主題和算法:層次聚類、二進制聚類、k均值聚類。
第4章包括以下主題和算法:壓縮方法、降維方法和主成分分析。
第5章包括以下主題和算法:廣義加性模型、平滑樣條、局部回歸。
第6章包括以下主題和算法:決策樹學習、樸素貝葉斯、隨機森林、支持向量機、隨機梯度下降。
第7章包括以下主題和算法:自組織映射和矢量量化。
第8章包括以下主題和算法:馬爾可夫鏈、蒙特卡洛模擬。
第9章包括以下主題和算法:隱馬爾可夫模型。
第10章包括以下主題和算法:神經(jīng)網(wǎng)絡(luò)。
第11章包括以下主題和算法:遞歸神經(jīng)網(wǎng)絡(luò)。
第12章包括世界銀行數(shù)據(jù)分析。
第13章包括再保險合同定價。
第14章包括用電量預測。
本書的重點本書的重點是用R語言構(gòu)建基于機器學習的應(yīng)用。我們已經(jīng)使用R語言構(gòu)建過各種解決方案。我們的重點是利用R語言庫和函數(shù)以最佳方式來克服現(xiàn)實世界的挑戰(zhàn)。我們盡量保持所有代碼的友好性和可讀性。我們認為這將使讀者能夠很容易地理解代碼,并在不同的場景中隨時使用它。
本書的目標讀者本書是為想構(gòu)建實用的基于機器學習的應(yīng)用的專業(yè)人士,以及統(tǒng)計、數(shù)據(jù)分析、機器學習、計算機科學或其他專業(yè)的學生和專業(yè)人士準備的。本書適用于R語言的初學者,但是熟悉R語言對理解和使用本書的代碼肯定是會有所幫助的。對于那些希望在現(xiàn)有技術(shù)棧中探索機器學習技術(shù)的有經(jīng)驗的R語言程序員來說,本書也將是非常有用的。
讀者對象
開發(fā)人員。在理解機器學習算法的基礎(chǔ)上,調(diào)用機器學習的中間庫進行開發(fā),將機器學習應(yīng)用于各種場景,如數(shù)據(jù)分析、圖像識別、文本分類、搜索引擎、中文智能輸入法等。
架構(gòu)師。在理解機器學習算法的基礎(chǔ)上,適應(yīng)現(xiàn)代云計算平臺的發(fā)展,將機器學習算法應(yīng)用在大規(guī)模并行計算上。同時,機器學習算法是大數(shù)據(jù)分析的基礎(chǔ),如神經(jīng)網(wǎng)絡(luò)、svM.
相似度分析、統(tǒng)計分析等技術(shù)。
機器學習的初、中級讀者。人類對機器學習的研究只是一個開始,還遠遠沒有結(jié)束。近年來,機器學習一直保持著強勁的發(fā)展勢頭,并擁有廣闊的發(fā)展前景,而不同于某些軟件開發(fā)領(lǐng)域中的程序語言或架構(gòu)知識。掌握機器學習有一定的難度,屬于“金領(lǐng)”行業(yè),對讀者來說,掌握機器學習知識就意味著更高的薪水、更具前景的職業(yè)。
機器學習概述
機器學習作為一門多領(lǐng)域的交叉學科,在近20年里異軍突出。機器學習涉及概率論、統(tǒng)計學、微積分、代數(shù)學、算法復雜度理論等多門學科。通過可以讓計算機自動“學習”的算法來實現(xiàn)人工智能,是人類在人工智能領(lǐng)域展開的積極探索。
2009年,被譽為人工大腦之父的雨果·德·加里斯教授走進清華大學講堂,在兩小時的演講時間內(nèi),給大家描述了一個人工智能的世界:20年后,人工智能機器可以和人類做朋友,50年后,人工智能將成為人類最大的威脅,世界最終會因人工智能超過人類而爆發(fā)一場戰(zhàn)爭,這場智能戰(zhàn)爭也許會奪去數(shù)十億人的生命。這樣的描述并不是幻想,隨著人類在人工智能領(lǐng)域取得的進步,這很有可能成為事實。而這一切主要歸功于對機器學習的研究和探索。
什么是機器學習
學習是人類具有的一種重要智能行為。人類一直夢想機器能像人類一樣學習,也一直在
為這個終極目標努力。那么,什么是機器學習呢?長期以來眾說紛,Langley(1996)定義
機器學習為:“機器學習是一門人工智能的科學,該領(lǐng)域的主要研究對象是人工智能,特別
是如何在經(jīng)驗學習中改善具體算法的性能”(Machine learning is a science of the artificial.The field's main objects of study are artifacts,specifically algorithms that improve their performance with experience.),Mitchell(1997)在《Machine Learning》中寫到:“機器學習是計算機算法的研究,并通過經(jīng)驗提高其自動進行改善"(Machine Learning is the study of computer algorithms that improve automatically through experience.),Alpaydin(2004)提出自己對機器學習的定義:“機器學習是用數(shù)據(jù)或以往的經(jīng)驗,來優(yōu)化計算機程序的性能標準"(Machine learning is programming computers to optimize a performance criterion using example data or past experience.)
筆者綜合維基百科和百度百科的定義,嘗試著將機器學習定義如下:“機器學習是一門
人工智能的科學,該領(lǐng)域的主要研究對象是人工智能,專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能,它是人工智能的核心,是使計算機具有智能的根本途徑。機器學習的研究方法通常是根據(jù)生理學、認知科學等對人類學習機理的了解,建立人類學習過程的計算模型或認識模型,發(fā)展各種學習理論和學習方法,研究通用的學習算法并進行理論上的分析,建立面向任務(wù)的具有
特定應(yīng)用的學習系統(tǒng)。”
機器學習實踐指南截圖



您現(xiàn)在查看是摘要介紹頁, 詳見PDF附件(14126KB,69頁)。





