實戰機器學習|使用Spark

    學習熱門的機器學習演算法 本書介紹熱門的機器學習演算法及其實作方式。你將會了解如何在Spark ML這套開發框架之內,實作各種機器學習概念。首先,我們會帶你在單一節點與多重節點的運算叢集上,完成Spark的安裝工作;接著,說明如何執行以Scala和Python語言撰寫的Spark ML程式;然後以幾套資料集為範例,深入探索分群、分類與迴歸;最後,利用Spark ML來處理文字資料

    收集中
    US$13.69

    學習熱門的機器學習演算法


    本書介紹熱門的機器學習演算法及其實作方式。你將會了解如何在Spark ML這套開發框架之內,實作各種機器學習概念。首先,我們會帶你在單一節點與多重節點的運算叢集上,完成Spark的安裝工作;接著,說明如何執行以Scala和Python語言撰寫的Spark ML程式;然後以幾套資料集為範例,深入探索分群、分類與迴歸;最後,利用Spark ML來處理文字資料。


    打造可以應用於工作中的機器學習程式


    弄懂概念之後,便可運用來實作演算法,可能是從頭開始,或是將既有的系統轉移到這個新平台,像是從Mahout或Scikit轉移到Spark ML。當你讀完本書之時,應該能夠善加運用Spark,打造可以應用於工作中的機器學習程式。


    本書將帶您

    .實際動手嘗試最新版的Spark ML

    .以Scala與Python語言撰寫Spark程式

    .在本機以及Amazon ECS雲端平台上,安裝並設置Spark開發環境

    .取用公開的機器學習資料集,使用Spark進行資料的載入、處理、清理與轉換等動作

    .處理巨量的文字資料,包括特徵萃取,並使用文字資料作為輸入餵給機器學習模型

    .撰寫Spark函式,評估機器學習模型的表現能力

    章節目錄

    • 1-1
      封面
    • 1-2
      書名頁
    • 1-3
      關於作者
    • 1-4
      關於審閱者
    • 1-5
      前言
    • 1-6
      目錄
    • 1-7
      CH1 與Spark 一起奔跑
    • 1-8
      在本地端安裝並設定Spark
    • 1-9
      Spark叢集
    • 1-10
      Spark程式設計模型
    • 1-11
      SchemaRDD
    • 1-12
      Spark資料框
    • 1-13
      邁出第一步撰寫Spark程式:使用Scala語言
    • 1-14
      邁出第一步撰寫Spark程式:使用Java語言
    • 1-15
      邁出第一步撰寫Spark程式:使用R語言
    • 1-16
      在Amazon EC2上執行Spark
    • 1-17
      設定Amazon Elastic MapReduce並執行Spark
    • 1-18
      Spark的使用者介面
    • 1-19
      Spark支援的機器學習演算法
    • 1-20
      與其他程式庫相比,Spark ML的優勢
    • 1-21
      總結
    • 1-22
      CH2 機器學習 需要的數學知識
    • 1-23
      線性代數
    • 1-24
      梯度下降法
    • 1-25
      過去經驗、可能性、事後機率
    • 1-26
      微積分
    • 1-27
      圖表繪製
    • 1-28
      總結
    • 1-29
      CH3 設計機器學習系統
    • 1-30
      何謂機器學習?
    • 1-31
      介紹MovieStream
    • 1-32
      機器學習系統的商業案例
    • 1-33
      機器學習模型的種類
    • 1-34
      以資料驅動的機器學習系統的組成元件
    • 1-35
      機器學習系統的架構
    • 1-36
      Spark MLlib
    • 1-37
      效能提升:在Spark MLlib之上的Spark ML
    • 1-38
      比較MLlib支援的演算法
    • 1-39
      MLlib支援的方法和開發人員API
    • 1-40
      MLlib版本
    • 1-41
      MLlib版本比較
    • 1-42
      總結
    • 1-43
      CH4 Spark 取得資料 並進行處理準備
    • 1-44
      存取公開資料
    • 1-45
      資料探索與視覺化
    • 1-46
      資料處理與轉換
    • 1-47
      從資料萃取出有用的特徵
    • 1-48
      總結
    • 1-49
      CH5 使用Spark 建構推薦引擎
    • 1-50
      推薦模型的種類
    • 1-51
      從你的資料萃取出正確特徵
    • 1-52
      訓練推薦模型
    • 1-53
      使用推薦模型
    • 1-54
      評估推薦模型的表現
    • 1-55
      FP-Growth演算法
    • 1-56
      總結
    • 1-57
      CH6 使用Spark 建構分類模型
    • 1-58
      分類模型的類型
    • 1-59
      從資料萃取出正確的特徵
    • 1-60
      訓練分類模型
    • 1-61
      使用分類模型
    • 1-62
      增進模型表現能力與調校參數
    • 1-63
      其他特徵
    • 1-64
      總結
    • 1-65
      CH7 使用Spark 建構迴歸模型
    • 1-66
      迴歸模型的種類
    • 1-67
      評估迴歸模型的表現能力
    • 1-68
      從資料萃取出正確的特徵
    • 1-69
      訓練迴歸模型並使用
    • 1-70
      增進模型表現能力與調校參數
    • 1-71
      總結
    • 1-72
      CH8 使用Spark 建構分群模型
    • 1-73
      分群模型的種類
    • 1-74
      從資料萃取出正確的特徵
    • 1-75
      k-平均演算法:訓練分類模型
    • 1-76
      k-平均演算法:評估分群模型的表現能力
    • 1-77
      WSSSE受迭代次數的影響
    • 1-78
      二分k-平均演算法
    • 1-79
      二分k-平均演算法:訓練分群模型
    • 1-80
      高斯混合模型
    • 1-81
      總結
    • 1-82
      CH9 Spark 與維度縮減
    • 1-83
      維度縮減的種類
    • 1-84
      從資料萃取出正確的特徵
    • 1-85
      訓練維度縮減模型
    • 1-86
      使用維度縮減模型
    • 1-87
      評估維度縮減模型
    • 1-88
      總結
    • 1-89
      CH10 Spark 與 進階文字處理
    • 1-90
      文字資料為何如此特別?
    • 1-91
      從資料萃取出正確的特徵
    • 1-92
      使用tf-idf模型
    • 1-93
      評估文字處理的影響
    • 1-94
      以Spark 2.0進行文字分類
    • 1-95
      Word2Vec模型
    • 1-96
      Word2Vec與20個新聞群組資料集
    • 1-97
      總結
    • 1-98
      CH11 Spark 串流程式庫與 即時機器學習
    • 1-99
      線上學習
    • 1-100
      串流處理
    • 1-101
      Spark串流與線上學習
    • 1-102
      線上模型評估
    • 1-103
      結構化串流
    • 1-104
      總結
    • 1-105
      CH12 Spark ML 的 工作流程API
    • 1-106
      介紹工作流程
    • 1-107
      工作流程如何運作?
    • 1-108
      機器學習工作流程範例
    • 1-109
      總結
    • 1-110
      版權
    • 1-111
      封底

    常見問答

    您可以透過手機、平板或是電腦登入 HiSKIO 平台,在【我的學習】>【我的書籍】頁面,選擇想看的電子書。

    猜你喜歡

    用戶評價

    | 收集中

    銷售方案