Python資料科學自學聖經

    不只是建模!用實戰帶你預測趨勢、找出問題與發現價值

    收集中
    US$18.43

    內容簡介


    網路書店年度百大電腦資訊暢銷書
    《Python自學聖經》系列力作

    運用Python掌握資料科學的價值
    讓人工智慧機器學習找出趨勢的關鍵密碼

    完整涵蓋Python資料科學技術,從開發工具、資料預處理、
    機器學習、深度學習到模型訓練進化一應俱全!

    給需要本書的人:
    ★想進入Python資料科學領域,又不知怎麼切入的人
    ★面對資料科學龐大又雜亂的理論與資訊卻不知如何下手的人
    ★想快速且有系統收集大量資料,並提高處理運用效率的人
    ★想利用大量資料進行分析,找出隱藏訊息與趨勢以協助決策的人
    ★想運用資料數據訓練人工智慧模型,開發適用的演算法進行預測與解決問題的人

    隨著AI人工智慧帶來的科技革命,資料科學的應用正在改變你我的生活。如何由龐大的資料數據中擷取爬梳出有價值的資訊,判斷決策,甚至能預測趨勢、掌握契機,是資料科學為現代社會帶來的新視野。
    資料科學橫跨多個領域,涵蓋數學、統計與電腦科學等面向。如果想有系統的進入資料科學領域,歡迎藉由本書循序漸進的學習。書中除了有資料科學的觀念,還有技術應用與發展方向,讓每個艱澀觀念都能在範例實作的引導下有著更清楚的輪廓,讓你一探資料科學迷人的樣貌。

    【書籍特色】
    ■深入淺出,只要具備基礎Python程式語言能力即可輕鬆上手。
    ■標示出重要觀念,在學習的過程中不會錯失關鍵內容。
    ■應用範例導向,每個觀念皆附實用案例,不怕學不會。
    ■不使用艱澀數學推導資料科學原理,而以淺顯易懂的文字解說學理。
    ■實作圖片增量及遷移學習,即使少量資料也可訓練出實用模型。
    ■實作機器學習與深度學習模型參數調校,輕鬆建立完美模型。

    【重要關鍵】
    ■應用工具:雲端開發平台(Google Colab)、資料科學工具(Numpy、Pandas、Matplotlib、Seaborn)、網路爬蟲(requests、BeautifulSoup)。
    ■資料預處理:資料清洗、缺失值、重複值及異常值的處理、資料檢查、資料合併、樞紐分析表、圖片增量,以及資料標準化、資料轉換與特徵選擇。
    ■機器學習:學習工具(Scikit-Learn)、非監督式學習(K-means演算法、DBSCAN演算法、PCA降維演算法)、監督式學習分類演算法(Scikit-Learn資料集、K近鄰演算法、單純貝氏演算法、決策樹演算法、隨機森林演算法)、監督式學習迴歸演算法(線性迴歸演算法、邏輯迴歸演算法、支持向量機演算法)。
    ■深度學習:學習工具(TensorFlow、Keras)、深度神經網路(DNN)、MNIST手寫數字圖片辨識實作、Gradio模組(深度學習成果展示、過擬合)、卷積神經網路(CNN)與循環神經網路(RNN)。
    ■模型訓練進化:預訓練模型、遷移學習、深度學習參數調校、hyperas參數調校神器,以及手寫數字辨識參數調校。

    【超值學習資源】
    獨家收錄「Python資料科學關鍵影音教學」、全書範例程式檔

    作者介紹


    一個致力於資訊圖書創作二十餘載的工作團隊,擅長用輕鬆詼諧的筆觸,深入淺出介紹難懂的 IT 技術,並以範例帶領讀者學習電腦應用的大小事。
    我們不賣弄深奧的專有名辭,奮力堅持吸收新知的態度,誠懇地與讀者分享在學習路上的點點滴滴,讓軟體成為每個人改善生活應用、提昇工作效率的工具。
    舉凡程式開發、文書處理、美工動畫、攝影修片、網頁製作,都是我們專注的重點,而不同領域有各自專業的作者組成,以進行書籍的規劃與編寫。一直以來,感謝許多讀者與學校老師的支持,選定為自修用書或授課教材。衷心期待能盡我們的心力,幫助每一位讀者燃燒心中的小宇宙,用學習的成果在自己的領域裡發光發熱!
    我們期待自己能在每一本創作中注入快快樂樂的心情來分享, 也期待讀者能在這樣的氛圍下快快樂樂的學習。

    官方網站:www.e-happy.com.tw
    FB粉絲團:www.facebook.com/ehappytw

    章节目录

    • 1-1
      封面頁
    • 1-2
      書名頁
    • 1-3
      關於文淵閣工作室
    • 1-4
      前言
    • 1-5
      學習資源說明
    • 1-6
      目錄
    • 1-7
      資料科學工具篇
    • 1-8
      Ch01 進入資料科學的學習殿堂
    • 1-9
      1.1 認識資料科學
    • 1-10
      1.1.1 什麼是資料科學?
    • 1-11
      1.1.2 資料科學流程
    • 1-12
      1.1.3 資料科學應用
    • 1-13
      1.2 Google Colab:雲端的開發平台
    • 1-14
      1.2.1 Colab 的介紹
    • 1-15
      1.2.2 Colab 建立筆記本
    • 1-16
      1.2.3 Colab 筆記本基本操作
    • 1-17
      1.2.4 Colab 虛擬機器的檔案管理
    • 1-18
      1.2.5 Colab 掛接Google 雲端硬碟
    • 1-19
      1.2.6 執行Shell 命令:「!」
    • 1-20
      1.2.7 魔術指令:「%」
    • 1-21
      1.2.8 Colab 筆記本檔案的下載與上傳
    • 1-22
      1.3 Colab 的筆記功能
    • 1-23
      1.3.1 Markdown 語法
    • 1-24
      1.3.2 區塊元素
    • 1-25
      1.3.3 行內元素
    • 1-26
      Ch02 資料科學神器: Numpy 與Pandas
    • 1-27
      2.1 Numpy:高速運算的解決方案
    • 1-28
      2.1.1 安裝Numpy 與載入模組
    • 1-29
      2.1.2 認識Numpy 陣列
    • 1-30
      2.2 Numpy 陣列建立
    • 1-31
      2.2.1 建立基本陣列
    • 1-32
      2.2.2 建立多維陣列
    • 1-33
      2.2.3 改變陣列形狀:reshape()
    • 1-34
      2.3 Numpy 陣列取值
    • 1-35
      2.3.1 一維陣列取值
    • 1-36
      2.3.2 多維陣列取值
    • 1-37
      2.3.3 產生隨機資料:np.ramdom()
    • 1-38
      2.3.4 Numpy 讀取CSV 檔案
    • 1-39
      2.4 Numpy 的陣列運算功能
    • 1-40
      2.4.1 Numpy 陣列運算
    • 1-41
      2.4.2 Numpy 常用的計算及統計函式
    • 1-42
      2.4.3 Numpy 的排序
    • 1-43
      2.5 Pandas:資料處理分析的強大工具
    • 1-44
      2.6 Series 的使用
    • 1-45
      2.6.1 建立Series
    • 1-46
      2.6.2 Series 資料取值
    • 1-47
      2.7 DataFrame 的建立
    • 1-48
      2.7.1 建立DataFrame
    • 1-49
      2.7.2 利用字典建立DataFrame
    • 1-50
      2.7.3 利用Series 建立DataFrame
    • 1-51
      2.8 Pandas DataFrame 資料取值
    • 1-52
      2.8.1 DataFrame 基本取值
    • 1-53
      2.8.2 以索引及欄位名稱取得資料:df.loc()
    • 1-54
      2.8.3 以索引及欄位編號取得資料:df.iloc()
    • 1-55
      2.8.4 取得最前或最後幾列資料
    • 1-56
      2.9 DataFrame 資料操作
    • 1-57
      2.9.1 DataFrame 資料排序
    • 1-58
      2.9.2 DataFrame 資料修改
    • 1-59
      2.9.3 刪除 DataFrame 資料
    • 1-60
      Ch03 資料收集:檔案存取與網路爬蟲
    • 1-61
      3.1 資料來源的取得
    • 1-62
      3.1.1 開放資料
    • 1-63
      3.1.2 資料集網站
    • 1-64
      3.1.3 自行收集資料的技術
    • 1-65
      3.2 CSV 檔案的讀取
    • 1-66
      3.2.1 認識CSV
    • 1-67
      3.2.2 載入CSV 檔案
    • 1-68
      3.3 JSON 資料的讀取
    • 1-69
      3.3.1 認識JSON
    • 1-70
      3.3.2 載入JSON 檔案
    • 1-71
      3.4 Excel 試算表檔案的讀取
    • 1-72
      3.5 HTML 網頁資料讀取
    • 1-73
      3.6 儲存資料為檔案
    • 1-74
      3.7 認識網路爬蟲
    • 1-75
      3.8 requests 模組:讀取網站檔案
    • 1-76
      3.8.1 安裝requests 模組
    • 1-77
      3.8.2 發送GET 請求
    • 1-78
      3.8.3 發送POST 請求
    • 1-79
      3.9 BeautifulSoup 模組:網頁解析
    • 1-80
      3.9.1 安裝Beautifulsoup 模組
    • 1-81
      3.9.2 認識網頁的結構
    • 1-82
      3.9.3 BeautifulSoup 的使用
    • 1-83
      3.9.4 BeautifulSoup 常用的屬性
    • 1-84
      3.9.5 BeautifulSoup 常用的方法
    • 1-85
      3.9.6 找尋指定標籤的內容:find()、find_all()
    • 1-86
      3.9.7 利用CSS 選擇器找尋內容:select()
    • 1-87
      3.9.8 取得標籤的屬性內容
    • 1-88
      3.10 文字及檔案資料的收集
    • 1-89
      3.10.1 檔案的建立與寫入
    • 1-90
      3.10.2 檔案讀取及處理
    • 1-91
      3.10.3 二進位檔案的建立與寫入
    • 1-92
      Ch04 資訊圖表化: Matplotlib 與Seaborn
    • 1-93
      4.1 Matplotlib:資訊視覺化的核心工具
    • 1-94
      4.2 折線圖:plot
    • 1-95
      4.2.1 繪製折線圖
    • 1-96
      4.2.2 設定線條、標記及圖例
    • 1-97
      4.2.3 設定圖表及xy 軸標題
    • 1-98
      4.2.4 設定xy 軸資料範圍
    • 1-99
      4.2.5 設定格線
    • 1-100
      4.2.6 同時繪製多組資料
    • 1-101
      4.2.7 自定軸刻度
    • 1-102
      4.2.8 範例:各年度銷售報表
    • 1-103
      4.2.9 Matplotlib 圖表中文顯示問題
    • 1-104
      4.3 長條圖與橫條圖:bar、barh
    • 1-105
      4.3.1 繪製長條圖
    • 1-106
      4.3.2 繪製橫條圖
    • 1-107
      4.3.3 繪製堆疊長條圖
    • 1-108
      4.3.4 繪製並列長條圖
    • 1-109
      4.4 圓形圖:pie
    • 1-110
      4.5 直方圖:hist
    • 1-111
      4.6 散佈圖:scatter
    • 1-112
      4.7 線箱圖:boxplot
    • 1-113
      4.8 設定圖表區:figure
    • 1-114
      4.9 在圖表區加入多張圖表:subplot、axes
    • 1-115
      4.9.1 用欄列排列多張圖表:subplot()
    • 1-116
      4.9.2 用相對位置排列多張圖表:axes
    • 1-117
      4.10 Pandas 繪圖應用
    • 1-118
      4.10.1 plot 繪圖方法
    • 1-119
      4.10.2 繪製長條圖、橫條圖、堆疊圖
    • 1-120
      4.10.3 繪製折線圖
    • 1-121
      4.10.4 繪製圓餅圖
    • 1-122
      4.11 Seaborn:更美觀的圖表工具
    • 1-123
      4.11.1 開始使用Seaborn
    • 1-124
      4.11.2 長條圖與橫條圖
    • 1-125
      4.11.3 折線圖
    • 1-126
      4.11.4 直方圖
    • 1-127
      4.11.5 散佈圖
    • 1-128
      4.11.6 線箱圖
    • 1-129
      4.11.7 Seaborn 圖表中文顯示問題
    • 1-130
      資料預處理篇
    • 1-131
      Ch05 資料預處理:資料清洗及圖片增量
    • 1-132
      5.1 資料清洗處理
    • 1-133
      5.1.1 資料處理的相關工作
    • 1-134
      5.1.2 缺失值處理
    • 1-135
      5.1.3 重複資料處理
    • 1-136
      5.1.4 異常值處理
    • 1-137
      5.2 資料檢查
    • 1-138
      5.2.1 範圍檢查
    • 1-139
      5.2.2 資料格式檢查
    • 1-140
      5.3 資料合併
    • 1-141
      5.3.1 資料附加
    • 1-142
      5.3.2 資料串接
    • 1-143
      5.3.3 資料融合
    • 1-144
      5.4 樞紐分析表
    • 1-145
      5.4.1 樞紐分析表語法
    • 1-146
      5.4.2 樞紐分析表實作
    • 1-147
      5.5 圖片增量
    • 1-148
      5.5.1 keras ImageDataGenerator 模組
    • 1-149
      5.5.2 augmentor 模組
    • 1-150
      Ch06 資料預處理:標準化、資料轉換與特徵選擇
    • 1-151
      6.1 Scikit-Learn:機器學習的開發工具
    • 1-152
      6.1.1 認識Scikit-Learn
    • 1-153
      6.1.2 Scikit-Learn 主要功能
    • 1-154
      6.1.3 Scikit-Learn 核心理念
    • 1-155
      6.2 數值資料標準化
    • 1-156
      6.2.1 Z 分數標準化:StandardScaler
    • 1-157
      6.2.2 最大最小值標準化:MinMaxScaler
    • 1-158
      6.2.3 最大絕對值標準化:MaxAbsScaler
    • 1-159
      6.2.4 RobustScaler 標準化:RobustScaler
    • 1-160
      6.2.5 數值資料標準化方法的比較
    • 1-161
      6.3 非數值資料轉換
    • 1-162
      6.3.1 對應字典法
    • 1-163
      6.3.2 標籤編碼法
    • 1-164
      6.3.3 One-Hot 編碼法
    • 1-165
      6.4 認識特徵選擇
    • 1-166
      6.5 使用Pandas 進行特徵選擇
    • 1-167
      6.5.1 使用Pandas 計算相關係數
    • 1-168
      6.5.2 皮爾森(Pearson) 相關係數
    • 1-169
      6.5.3 肯德爾(Kendall) 相關係數
    • 1-170
      6.5.4 斯皮爾曼(Spearman) 相關係數
    • 1-171
      6.6 使用Scikit-Learn 進行特徵選擇
    • 1-172
      機器學習篇
    • 1-173
      Ch07 機器學習:非監督式學習
    • 1-174
      7.1 認識機器學習
    • 1-175
      7.1.1 機器學習是什麼?
    • 1-176
      7.1.2 機器學習類別
    • 1-177
      7.1.3 機器學習應用
    • 1-178
      7.2 K-means 演算法
    • 1-179
      7.2.1 K-means 演算法原理
    • 1-180
      7.2.2 Scikit-Learn 中K-means 相關模組
    • 1-181
      7.2.3 K-means 應用:信用卡客戶分群
    • 1-182
      7.3 DBSCAN 演算法
    • 1-183
      7.3.1 DBSCAN 演算法原理
    • 1-184
      7.3.2 Scikit-Learn 的DBSCAN 模組
    • 1-185
      7.3.3 DBSCAN 應用:信用卡客戶分群
    • 1-186
      7.4 降維演算法
    • 1-187
      7.4.1 主成份分析:PCA
    • 1-188
      7.4.2 Scikit-Learn 的PCA 模組
    • 1-189
      7.4.3 主成份分析應用:消費者購買哪些商品
    • 1-190
      Ch08 機器學習:監督式學習分類演算法
    • 1-191
      8.1 Scikit-Learn 資料集
    • 1-192
      8.1.1 資料集種類
    • 1-193
      8.1.2 資料集分割
    • 1-194
      8.2 K 近鄰演算法
    • 1-195
      8.2.1 K 近鄰演算法原理
    • 1-196
      8.2.2 Scikit-Learn 的K 近鄰模組
    • 1-197
      8.2.3 K 近鄰演算法應用:手寫數字辦識
    • 1-198
      8.2.4 交叉驗證與網格搜索
    • 1-199
      8.2.5 模型儲存與讀取
    • 1-200
      8.3 單純貝氏演算法
    • 1-201
      8.3.1 單純貝氏演算法原理
    • 1-202
      8.3.2 文句特徵處理
    • 1-203
      8.3.3 tf-idf 文句處理
    • 1-204
      8.3.4 Scikit-Learn 的單純貝氏分類模組
    • 1-205
      8.3.5 單純貝氏演算法應用:判斷新聞類別
    • 1-206
      8.3.6 單純貝氏演算法應用:中文新聞類別
    • 1-207
      8.4 決策樹演算法
    • 1-208
      8.4.1 決策樹演算法原理
    • 1-209
      8.4.2 Scikit-Learn 的決策樹模組
    • 1-210
      8.4.3 決策樹演算法應用:鐵達尼號生存判斷
    • 1-211
      8.5 隨機森林演算法
    • 1-212
      8.5.1 隨機森林演算法原理
    • 1-213
      8.5.2 Scikit-Learn 的隨機森林模組
    • 1-214
      8.5.3 隨機森林演算法範例:葡萄酒種類判斷
    • 1-215
      Ch09 機器學習:監督式學習迴歸演算法
    • 1-216
      9.1 線性迴歸演算法
    • 1-217
      9.1.1 線性迴歸演算法原理
    • 1-218
      9.1.2 正規方程法線性迴歸
    • 1-219
      9.1.3 梯度下降法線性迴歸
    • 1-220
      9.2 邏輯迴歸演算法
    • 1-221
      9.2.1 邏輯迴歸演算法原理
    • 1-222
      9.2.2 Scikit-Learn 的邏輯迴歸模組
    • 1-223
      9.2.3 邏輯迴歸應用:判斷是否罹癌
    • 1-224
      9.2.4 精確率與召回率
    • 1-225
      9.2.5 Scikit-Learn 的精確率、召回率與準確度模組
    • 1-226
      9.2.6 召回率應用:提高罹癌患者檢測率
    • 1-227
      9.2.7 提高「惡性」召回率
    • 1-228
      9.3 支持向量機演算法
    • 1-229
      9.3.1 支持向量機演算法原理
    • 1-230
      9.3.2 Scikit-Learn 的支持向量機分類模組
    • 1-231
      9.3.3 支持向量機分類範例:稻米種類判斷
    • 1-232
      9.3.4 支持向量機分類應用:人臉辨識
    • 1-233
      9.3.5 支持向量機迴歸範例:廣告效益預測
    • 1-234
      深度學習篇
    • 1-235
      Ch10 深度學習:深度神經網路(DNN)
    • 1-236
      10.1 認識深度學習
    • 1-237
      10.1.1 認識神經網路
    • 1-238
      10.1.2 深度學習工具:TensorFlow
    • 1-239
      10.1.3 深度學習工具:Keras
    • 1-240
      10.2 認識深度神經網路(DNN)
    • 1-241
      10.2.1 隱藏層及多神經元
    • 1-242
      10.2.2 損失函式與最佳化函式
    • 1-243
      10.3 實作MNIST 手寫數字圖片辨識
    • 1-244
      10.3.1 神經網路模型建立步驟
    • 1-245
      10.3.2 蒐集資料:MNIST 資料集
    • 1-246
      10.3.3 資料預處理
    • 1-247
      10.3.4 建立深度神經網路模型
    • 1-248
      10.3.5 訓練模型
    • 1-249
      10.3.6 評估準確率及存取模型
    • 1-250
      10.3.7 完整手寫數字模型程式碼
    • 1-251
      10.3.8 預測自己的數字圖片
    • 1-252
      10.4 Gradio 模組:深度學習成果展示
    • 1-253
      10.4.1 Gradio 模組基本操作
    • 1-254
      10.4.2 Gradio 模組輸入欄位
    • 1-255
      10.4.3 Gradio 模組輸出欄位
    • 1-256
      10.4.4 範例:手寫數字辨識線上展示
    • 1-257
      10.5 過擬合
    • 1-258
      10.5.1 觀察過擬合現象
    • 1-259
      10.5.2 加入拋棄層避免過擬合
    • 1-260
      Ch11 深度學習:卷積神經網路(CNN)
    • 1-261
      11.1 認識卷積神經網路(CNN)
    • 1-262
      11.1.1 為什麼需要卷積神經網路?
    • 1-263
      11.1.2 卷積層
    • 1-264
      11.1.3 池化層
    • 1-265
      11.2 實作貓狗圖片辨識
    • 1-266
      11.2.1 蒐集資料:貓狗資料集
    • 1-267
      11.2.2 資料預處理
    • 1-268
      11.2.3 建立卷積神經網路模型
    • 1-269
      11.2.4 訓練模型及評估準確率
    • 1-270
      11.2.5 完整貓狗辨識模型程式碼
    • 1-271
      11.2.6 預測自己的貓狗圖片
    • 1-272
      11.2.7 使用Gradio 模組展示貓狗圖片辨識
    • 1-273
      Ch12 深度學習:循環神經網路(RNN)
    • 1-274
      12.1 認識循環神經網路(RNN)
    • 1-275
      12.1.1 為什麼需要循環神經網路?
    • 1-276
      12.1.2 循環神經網路運作原理
    • 1-277
      12.2 下載台灣股市資料
    • 1-278
      12.2.1 查詢歷史股票資料
    • 1-279
      12.2.2 下載全年個股資料
    • 1-280
      12.3 實作台灣股票市場股價預測
    • 1-281
      12.3.1 資料預處理
    • 1-282
      12.3.2 建立及訓練循環神經網路
    • 1-283
      12.3.3 完整股價預測程式碼
    • 1-284
      12.3.4 預測股票收盤價
    • 1-285
      模型訓練進化篇
    • 1-286
      Ch13 預訓練模型及遷移學習
    • 1-287
      13.1 預訓練模型
    • 1-288
      13.1.1 認識ImageNet
    • 1-289
      13.1.2 使用InceptionV3 預訓練模型
    • 1-290
      13.1.3 Gradio 中使用InceptionV3 模型
    • 1-291
      13.2 遷移學習
    • 1-292
      13.2.1 認識遷移學習
    • 1-293
      13.2.2 蒐集資料:花朵資料集
    • 1-294
      13.2.3 資料預處理
    • 1-295
      13.2.4 花朵辨識卷積神經網路模型
    • 1-296
      13.2.5 花朵辨識遷移學習模型
    • 1-297
      Ch14 深度學習參數調校
    • 1-298
      14.1 hyperas 模組:參數調校神器
    • 1-299
      14.1.1 深度學習的參數
    • 1-300
      14.1.2 hyperas 參數調校語法
    • 1-301
      14.1.3 hyperas 模組參數範圍設定
    • 1-302
      14.2 手寫數字辨識參數調校
    • 1-303
      14.2.1 主要參數調校
    • 1-304
      14.2.2 細部參數調校
    • 1-305
      14.2.3 手寫數字辨識最佳模型程式
    • 1-306
      版權頁
    • 1-307
      封底頁

    常见问答

    您可以透過手機、平板或是電腦登入 HiSKIO 平台,在【我的學習】>【我的書籍】頁面,選擇想看的電子書。

    猜你喜欢

    用户评价

    | 收集中

    销售方案