從零開(kāi)始學(xué)Python數(shù)據(jù)分析與挖掘第二版.pdf
http://www.www.srpcoatings.com
2020年11月5日
![]() |
| 第1頁(yè) |
![]() |
| 第9頁(yè) |
![]() |
| 第12頁(yè) |
![]() |
| 第23頁(yè) |
![]() |
| 第43頁(yè) |
![]() |
| 第364頁(yè) |
參見(jiàn)附件(69436KB,568頁(yè))。
從零開(kāi)始學(xué)Python數(shù)據(jù)分析與挖掘第二版以Python 3.7版本作為數(shù)據(jù)分析與挖掘?qū)崙?zhàn)的應(yīng)用工具,從Python的基礎(chǔ)語(yǔ)法開(kāi)始,陸續(xù)介紹有關(guān)數(shù)值計(jì)算的numpy、數(shù)據(jù)處理的pandas、數(shù)據(jù)可視化的matplotlib和數(shù)據(jù)挖掘的sklearn等內(nèi)容

編輯推薦
"為滿(mǎn)足用人單位對(duì)數(shù)據(jù)分析和挖掘人員在編程方面的技能要求,本書(shū)遵循由淺入深的原則,詳細(xì)地介紹了利用Python及其相關(guān)工具實(shí)現(xiàn)數(shù)據(jù)分析和挖掘的實(shí)用技能。 結(jié)合Python中成熟的Numpy、Pandas、MatPlotLib、Sklearn、Seaborn、Statsmodels和SciPy模塊,實(shí)現(xiàn)數(shù)據(jù)分析與挖掘中關(guān)于數(shù)據(jù)的清洗、整理、探索、可視化、建模和評(píng)估等流程的操作,讓每一位對(duì)數(shù)據(jù)分析和挖掘的從業(yè)者或感興趣的讀者都能從中學(xué)到所需的內(nèi)容。 詳解十大常用數(shù)據(jù)挖掘算法及案例實(shí)戰(zhàn),如多元線性等
內(nèi)容簡(jiǎn)介
全書(shū)共涵蓋15種可視化圖形以及10個(gè)常用的數(shù)據(jù)挖掘算法和實(shí)戰(zhàn)項(xiàng)目,通過(guò)本書(shū)的學(xué)習(xí),讀者可以掌握數(shù)據(jù)分析與挖掘的理論知識(shí)和實(shí)戰(zhàn)技能。本書(shū)適于統(tǒng)計(jì)學(xué)、數(shù)學(xué)、經(jīng)濟(jì)學(xué)、金融學(xué)、管理學(xué)以及相關(guān)理工科專(zhuān)業(yè)的本科生、研究生使用,也能夠提高從事數(shù)據(jù)咨詢(xún)、研究或分析等人士的專(zhuān)業(yè)水平和技能。
作者簡(jiǎn)介
劉順祥,統(tǒng)計(jì)學(xué)碩士,“數(shù)據(jù)分析1480”公眾號(hào)運(yùn)營(yíng)者。曾就職于唯品會(huì)電商平臺(tái),擔(dān)任不錯(cuò)數(shù)據(jù)分析師一職。目前就職于靠前某數(shù)據(jù)咨詢(xún)公司,為聯(lián)想、亨氏、美麗田園、喜力、網(wǎng)魚(yú)網(wǎng)咖等企業(yè)提供數(shù)據(jù)咨詢(xún)服務(wù)。著有《從零開(kāi)始學(xué)Python數(shù)據(jù)分析與挖掘》一書(shū)。
目錄
第1章 數(shù)據(jù)分析與挖掘概述
1.1 什么是數(shù)據(jù)分析和挖掘
1.2 數(shù)據(jù)分析與挖掘的應(yīng)用領(lǐng)域
1.2.1 電商領(lǐng)域——發(fā)現(xiàn)破壞規(guī)則的“害群之馬”
1.2.2 交通出行領(lǐng)域——為打車(chē)平臺(tái)進(jìn)行私人訂制
1.2.3 醫(yī)療健康領(lǐng)域——找到佳醫(yī)療方案
1.3 數(shù)據(jù)分析與挖掘的區(qū)別
1.4 數(shù)據(jù)挖掘的流程
1.4.1 明確目標(biāo)
1.4.2 數(shù)據(jù)搜集
1.4.3 數(shù)據(jù)清洗
1.4.4 構(gòu)建模型
1.4.5 模型評(píng)估
1.4.6 應(yīng)用部署
1.5 常用的數(shù)據(jù)分析與挖掘工具
1.6 本章小結(jié)
1.7 課后練習(xí)
第2章 從收入的預(yù)測(cè)分析開(kāi)始
2.1 與安裝Anaconda
2.1.1 基于Windows系統(tǒng)安裝
2.1.2 基于Mac系統(tǒng)安裝
2.1.3 基于Linux系統(tǒng)安裝
2.2 基于Python的案例實(shí)戰(zhàn)
2.2.1 數(shù)據(jù)的預(yù)處理
2.2.2 數(shù)據(jù)的探索性分析
2.2.3 數(shù)據(jù)建模
2.3 本章小結(jié)
2.4 課后練習(xí)
第3章 Python基礎(chǔ)與數(shù)據(jù)抓取
3.1 數(shù)據(jù)結(jié)構(gòu)及方法
3.1.1 列表
3.1.2 元組
3.1.3 字典
3.2 控制流
3.2.1 if分支
3.2.2 for循環(huán)
3.2.3 while循環(huán)
3.3 字符串處理方法
3.3.1 字符串的常用方法
3.3.2 正則表達(dá)式
3.4 自定義函數(shù)
3.4.1 自定義函數(shù)語(yǔ)法
3.4.2 自定義函數(shù)的幾種參數(shù)
3.5 一個(gè)爬蟲(chóng)案例
3.6 本章小結(jié)
3.7 課后練習(xí)
第4章 Python數(shù)值計(jì)算——numpy的高效技能
4.1 數(shù)組的創(chuàng)建與操作
4.1.1 數(shù)組的創(chuàng)建
4.1.2 數(shù)組元素的獲取
4.1.3 數(shù)組的常用屬性
4.1.4 數(shù)組的形狀處理
4.2 數(shù)組的基本運(yùn)算符
4.2.1 四則運(yùn)算
4.2.2 比較運(yùn)算
4.2.3 廣播運(yùn)算
4.3 常用的數(shù)學(xué)和統(tǒng)計(jì)函數(shù)
4.4 線性代數(shù)的相關(guān)計(jì)算
4.4.1 矩陣乘法
4.4.2 diag函數(shù)的使用
4.4.3 特征根與特征向量
4.4.4 多元線性回歸模型的解
4.4.5 多元一次方程組的求解
4.4.6 范數(shù)的計(jì)算
4.5 偽隨機(jī)數(shù)的生成
4.6 本章小結(jié)
4.7 課后練習(xí)
第5章 Python數(shù)據(jù)處理——展現(xiàn)pandas的強(qiáng)r /> 5.1 序列與數(shù)據(jù)框的構(gòu)造
5.1.1 構(gòu)造序列
5.1.2 構(gòu)造數(shù)據(jù)框
5.2 外部數(shù)據(jù)的讀取
5.2.1 文本文件的讀取
5.2.2 電子表格的讀取
5.2.3 數(shù)據(jù)庫(kù)數(shù)據(jù)的讀取
5.3 數(shù)據(jù)類(lèi)型轉(zhuǎn)換及描述統(tǒng)計(jì)
5.4 字符與日期數(shù)據(jù)的處理
5.5 常用的數(shù)據(jù)清洗方法
5.5.1 重復(fù)觀測(cè)處理
5.5.2 缺失值處理
5.5.3 異常值處理
5.6 數(shù)據(jù)子集的獲取
5.7 透視表功能
5.8 表之間的合并與連接
5.9 分組聚合操作
5.10 本章小結(jié)
5.11 課后練習(xí)
第6章 Python數(shù)據(jù)可視化——分析報(bào)告必要元素
6.1 離散型變量的可視化
6.1.1 餅圖——“芝麻信用”失信用戶(hù)分布
6.1.2 條形圖——胡潤(rùn)排行榜
6.2 數(shù)值型變量的可視化
6.2.1 直方圖與核密度曲線——展現(xiàn)年齡分布特征
6.2.2 箱線圖——房單價(jià)分布形態(tài)
6.2.3 小提琴圖——客戶(hù)消費(fèi)數(shù)據(jù)的呈現(xiàn)
6.2.4 折線圖——公眾號(hào)每日閱讀趨勢(shì)
6.3 關(guān)系型數(shù)據(jù)的可視化
6.3.1 散點(diǎn)圖——探究鳶尾花花瓣長(zhǎng)度與寬度的關(guān)系
6.3.2 氣泡圖——暴露商品的銷(xiāo)售特征
6.3.3 熱力圖——一份簡(jiǎn)單的月度日歷
6.4 多個(gè)圖形的合并
6.5 本章小結(jié)
6.6 課后練習(xí)
第7章 線性回歸預(yù)測(cè)模型
7.1 一元線性回歸模型——收入預(yù)測(cè)
7.2 多元線性回歸模型——銷(xiāo)售利潤(rùn)預(yù)測(cè)
7.2.1 回歸模型的參數(shù)求解
7.2.2 回歸模型的預(yù)測(cè)
7.3 回歸模型的假設(shè)檢驗(yàn)
7.3.1 模型的顯著性檢驗(yàn)——F檢驗(yàn)
7.3.2 回歸系數(shù)的顯著性檢驗(yàn)——t檢驗(yàn)
7.4 回歸模型的診斷
7.4.1 正態(tài)性檢驗(yàn)
7.4.2 多重共線性檢驗(yàn)
7.4.3 線性相關(guān)性檢驗(yàn)
7.4.4 異常值檢驗(yàn)
7.4.5 獨(dú)立性檢驗(yàn)
7.4.6 方差齊性檢驗(yàn)
7.5 本章小結(jié)
7.6 課后練習(xí)
第8章 嶺回歸與LASSO回歸模型
8.1 嶺回歸模型
8.1.1 參數(shù)求解
8.1.2 系數(shù)求解的幾何意義
8.2 嶺回歸模型的應(yīng)用——糖尿病病情預(yù)測(cè)(1)
8.2.1 可視化方法確定λ值
8.2.2 交驗(yàn)證法確定λ值
8.2.3 模型的預(yù)測(cè)
8.3 LASSO回歸模型——糖尿病病情預(yù)測(cè)(2)
8.3.1 參數(shù)求解
8.3.2 系數(shù)求解的幾何意義
8.4 LASSO回歸模型的應(yīng)用
8.4.1 可視化方法確定λ值
8.4.2 交驗(yàn)證法確定λ值
8.4.3 模型的預(yù)測(cè)
8.5 本章小結(jié)
8.6 課后練習(xí)
第9章 Logistic回歸分類(lèi)模型
9.1 Logistic模型的構(gòu)建
9.1.1 Logistic模型的參數(shù)求解
9.1.2 Logistic模型的參數(shù)解釋
9.2 分類(lèi)模型的評(píng)估方法
9.2.1 混淆矩陣
9.2.2 ROC曲線
9.2.3 K-S曲線
9.3 Logistic回歸模型的應(yīng)用——運(yùn)動(dòng)狀態(tài)的識(shí)別……
從零開(kāi)始學(xué)Python數(shù)據(jù)分析與挖掘第二版截圖



您現(xiàn)在查看是摘要介紹頁(yè), 詳見(jiàn)PDF附件(69436KB,568頁(yè))。
始學(xué)Python數(shù)據(jù)分析與挖掘第二版_1.jpg)
始學(xué)Python數(shù)據(jù)分析與挖掘第二版_2.jpg)
始學(xué)Python數(shù)據(jù)分析與挖掘第二版_3.jpg)
始學(xué)Python數(shù)據(jù)分析與挖掘第二版_4.jpg)
始學(xué)Python數(shù)據(jù)分析與挖掘第二版_5.jpg)
始學(xué)Python數(shù)據(jù)分析與挖掘第二版_6.jpg)