Spark

實戰機器學習｜使用Spark

學習熱門的機器學習演算法本書介紹熱門的機器學習演算法及其實作方式。你將會了解如何在Spark ML這套開發框架之內，實作各種機器學習概念。首先，我們會帶你在單一節點與多重節點的運算叢集上，完成Spark的安裝工作；接著，說明如何執行以Scala和Python語言撰寫的Spark ML程式；然後以幾套資料集為範例，深入探索分群、分類與迴歸；最後，利用Spark ML來處理文字資料

收集中

US$13.53

學習熱門的機器學習演算法

本書介紹熱門的機器學習演算法及其實作方式。你將會了解如何在Spark ML這套開發框架之內，實作各種機器學習概念。首先，我們會帶你在單一節點與多重節點的運算叢集上，完成Spark的安裝工作；接著，說明如何執行以Scala和Python語言撰寫的Spark ML程式；然後以幾套資料集為範例，深入探索分群、分類與迴歸；最後，利用Spark ML來處理文字資料。

打造可以應用於工作中的機器學習程式

弄懂概念之後，便可運用來實作演算法，可能是從頭開始，或是將既有的系統轉移到這個新平台，像是從Mahout或Scikit轉移到Spark ML。當你讀完本書之時，應該能夠善加運用Spark，打造可以應用於工作中的機器學習程式。

本書將帶您

．實際動手嘗試最新版的Spark ML

．以Scala與Python語言撰寫Spark程式

．在本機以及Amazon ECS雲端平台上，安裝並設置Spark開發環境

．取用公開的機器學習資料集，使用Spark進行資料的載入、處理、清理與轉換等動作

．處理巨量的文字資料，包括特徵萃取，並使用文字資料作為輸入餵給機器學習模型

．撰寫Spark函式，評估機器學習模型的表現能力

章節目錄

1-1
封面
1-2
書名頁
1-3
關於作者
1-4
關於審閱者
1-5
前言
1-6
目錄
1-7
CH1 與Spark 一起奔跑
1-8
在本地端安裝並設定Spark
1-9
Spark叢集
1-10
Spark程式設計模型
1-11
SchemaRDD
1-12
Spark資料框
1-13
邁出第一步撰寫Spark程式：使用Scala語言
1-14
邁出第一步撰寫Spark程式：使用Java語言
1-15
邁出第一步撰寫Spark程式：使用R語言
1-16
在Amazon EC2上執行Spark
1-17
設定Amazon Elastic MapReduce並執行Spark
1-18
Spark的使用者介面
1-19
Spark支援的機器學習演算法
1-20
與其他程式庫相比，Spark ML的優勢
1-21
總結
1-22
CH2 機器學習需要的數學知識
1-23
線性代數
1-24
梯度下降法
1-25
過去經驗、可能性、事後機率
1-26
微積分
1-27
圖表繪製
1-28
總結
1-29
CH3 設計機器學習系統
1-30
何謂機器學習？
1-31
介紹MovieStream
1-32
機器學習系統的商業案例
1-33
機器學習模型的種類
1-34
以資料驅動的機器學習系統的組成元件
1-35
機器學習系統的架構
1-36
Spark MLlib
1-37
效能提升：在Spark MLlib之上的Spark ML
1-38
比較MLlib支援的演算法
1-39
MLlib支援的方法和開發人員API
1-40
MLlib版本
1-41
MLlib版本比較
1-42
總結
1-43
CH4 Spark 取得資料並進行處理準備
1-44
存取公開資料
1-45
資料探索與視覺化
1-46
資料處理與轉換
1-47
從資料萃取出有用的特徵
1-48
總結
1-49
CH5 使用Spark 建構推薦引擎
1-50
推薦模型的種類
1-51
從你的資料萃取出正確特徵
1-52
訓練推薦模型
1-53
使用推薦模型
1-54
評估推薦模型的表現
1-55
FP-Growth演算法
1-56
總結
1-57
CH6 使用Spark 建構分類模型
1-58
分類模型的類型
1-59
從資料萃取出正確的特徵
1-60
訓練分類模型
1-61
使用分類模型
1-62
增進模型表現能力與調校參數
1-63
其他特徵
1-64
總結
1-65
CH7 使用Spark 建構迴歸模型
1-66
迴歸模型的種類
1-67
評估迴歸模型的表現能力
1-68
從資料萃取出正確的特徵
1-69
訓練迴歸模型並使用
1-70
增進模型表現能力與調校參數
1-71
總結
1-72
CH8 使用Spark 建構分群模型
1-73
分群模型的種類
1-74
從資料萃取出正確的特徵
1-75
k-平均演算法：訓練分類模型
1-76
k-平均演算法：評估分群模型的表現能力
1-77
WSSSE受迭代次數的影響
1-78
二分k-平均演算法
1-79
二分k-平均演算法：訓練分群模型
1-80
高斯混合模型
1-81
總結
1-82
CH9 Spark 與維度縮減
1-83
維度縮減的種類
1-84
從資料萃取出正確的特徵
1-85
訓練維度縮減模型
1-86
使用維度縮減模型
1-87
評估維度縮減模型
1-88
總結
1-89
CH10 Spark 與進階文字處理
1-90
文字資料為何如此特別？
1-91
從資料萃取出正確的特徵
1-92
使用tf-idf模型
1-93
評估文字處理的影響
1-94
以Spark 2.0進行文字分類
1-95
Word2Vec模型
1-96
Word2Vec與20個新聞群組資料集
1-97
總結
1-98
CH11 Spark 串流程式庫與即時機器學習
1-99
線上學習
1-100
串流處理
1-101
Spark串流與線上學習
1-102
線上模型評估
1-103
結構化串流
1-104
總結
1-105
CH12 Spark ML 的工作流程API
1-106
介紹工作流程
1-107
工作流程如何運作？
1-108
機器學習工作流程範例
1-109
總結
1-110
版權
1-111
封底

用戶評價

| 收集中

語言

幣別

語言

幣別

實戰機器學習｜使用Spark

章節目錄

常見問答

猜你喜歡

圖解演算法原理

MySQL/MariaDB資料庫設計與開發實務

圖解AI人工智慧

Vue.js入門到實戰：頁面開發x元件管理x多語系網站開發(適用Vue.js 3.x/2.x)

年賺18%的複利式存股

用戶評價

章節目錄

1目錄共 111 單元

常見問答

Q 電子書購買後，怎麼觀看呢？

Q 電子書有觀看時間的限制嗎？

Q ePub 和 PDF 的差別？

Q 購買電子書有發票嗎？可以開統編發票嗎？

Q 為什麼我已經購買電子書，卻找不到它？

猜你喜歡

圖解演算法原理

MySQL/MariaDB資料庫設計與開發實務

圖解AI人工智慧

Vue.js入門到實戰：頁面開發x元件管理x多語系網站開發(適用Vue.js 3.x/2.x)

年賺18%的複利式存股

用戶評價

銷售方案