大數據分析實務–RapidMiner之應用

    9786263246768

    收集中
    US$15.73

    內容簡介


    本書使用免費下載的「RapidMiner」軟體,該軟體使用圖形化界面,不需編寫程式、操作簡易、功能強大且應用廣泛,適合初學與進階資料分析人士使用。

    本書從基礎的資料取得、事前處理到模型的建置、評分、驗證與實例分析等,以實作方式,循序漸進的介紹大數據分析的操作步驟與流程。

    全書提供30個案例,內容包含金融、製造、銷售、管理、醫療、休閒、氣象與情感分析文字探勘等諸多領域的應用實例,除了對現有結構與非結構式資料進行分析外,同時利用訓練模型預測未來,提升數據分析的實用價值。

    本書除提供數據資料檔Data File外,亦附有各章節之程式/流程檔供讀者參考。

    目錄


    Chapter 00 RapidMiner 軟體下載、介面說明與注意事項

    Chapter 01 基礎篇
    本章介紹使用RapidMiner平台的基礎知識,涵蓋內容從如何取得與過濾資料到改變資料的類型與角色以及對各類型檔案的讀取與儲存等。本章同時涵蓋如何建置一個基本模型,以及認識變數的結合、分類、新增與選擇等功能。

    Chapter 02 資料處理
    本章介紹資料的前置處理,內容包含遺漏值的處理、資料的常態化與刪除離群值以及變數的樞紐轉換與重新命名等;同時涵蓋使用巨集、迴圈與分支等運算式進行抽樣以及多個資料檔案的讀入、儲存、合併、運算與結合等。在時間序列資料的前置處裡部分,會介紹如何將日資料轉換為月平均以及季平均資料的方式。

    Chapter 03 模型之建置、評分與驗證
    本章介紹分類模型之建置、預測、績效評估以及驗證方式,內容包含分割資料與交叉驗證的差異。使用之演算法包含決策樹、簡單貝式法、規則歸納法以及羅吉斯回歸等。在比較不同演算法績效表現方面,除了常用之準確率、精確率與召回率等指標外,更介紹以視覺化模型(ROC曲線)進行分析。

    Chapter 04 多元實例練習
    本章涵蓋實例練習的第一部分,主題包含國人赴國外旅遊人數分析、台灣50的股票價格分群、參數最佳化及對交易對手信用違約預測、調整不平衡資料及對客戶流失預測、建置增益圖找出最可能流失的客戶群集中行銷、依據基地台號碼與座標位置找出距離最近的基地台、使用回歸模型預測二手車售價以及依據羅吉斯回歸模型最佳變數預測新生嬰兒體重是否過輕。

    Chapter 05 進階實例練習
    本章涵蓋實作練習的第二部分,主題包含根據民眾就醫資料偵測醫療詐欺行為、使用關聯性法則判斷那些商品經常同時購買、針對連續未達測試績效的預測模型郵寄警訊至相關人員、依據機器各部位感應器記錄找出發生故障的主要來源、使用K-NN模型預測機器是否將發生故障以預先安排維修工作、檢視S&P 500的移動平均以及線性與非線性趨勢、使用視窗與滑動視窗驗證根據公司財報資料預測股價、處裡視窗資料、使用交叉驗證與時間序列滑動視窗驗證以及單變量ARIMA模型進行溫度預測、使用單變量Holt-Winters模型預測貿易出口值以及計算並根據顧客之RFM值進行顧客分群與執行問卷回覆分析。

    Chapter 06 中英文文字探勘
    本章介紹如何執行中英文文字探勘並據以分析,英文文字探勘的主題包含利用書籍名稱預測圖書主題、尋找程式設計師徵才廣告所列之主要條件、分析顧客對藍芽耳機的文字評價以及檢視正負評價中的主要詞彙。中文探勘結合了Python的Jieba套件進行中文斷字,涵蓋主題包含尋找2012年以及2020年總統就職演說使用的主要詞彙、消費者情緒分析以及對網路新聞的文字探勘。

    章节目录

    • 1-1
      封面頁
    • 1-2
      書名頁
    • 1-3
    • 1-4
      目錄
    • 1-5
      CH00 RapidMiner 軟體下載、介面說明與注意事項
    • 1-6
      CH01 基礎介紹
    • 1-7
      1-1 取得資料
    • 1-8
      練習 1-1-1
    • 1-9
      練習 1-1-2
    • 1-10
      1-2 資料的過濾與排序
    • 1-11
      練習1-2-1
    • 1-12
      1-3 改變變數的類型與角色
    • 1-13
      練習 1-3-1
    • 1-14
      練習 1-3-2
    • 1-15
      1-4 檔案的讀取與儲存
    • 1-16
      1-5 模型建置
    • 1-17
      練習1-5-1
    • 1-18
      練習1-5-2
    • 1-19
      1-6 變數的結合與分類
    • 1-20
      練習1-6-1
    • 1-21
      練習1-6-2
    • 1-22
      1-7 變數的新增與選擇
    • 1-23
      練習1-7-1
    • 1-24
      學習評量
    • 1-25
      CH02 資料處理
    • 1-26
      2-1 遺漏值處理
    • 1-27
      練習2-1-1
    • 1-28
      2-2 資料的常態化與找出離群值
    • 1-29
      練習2-2-1
    • 1-30
      2-3 變數的分類、樞紐轉換與重新命名
    • 1-31
      練習 2-3-1
    • 1-32
      練習 2-3-2
    • 1-33
      2-4 巨集與抽樣
    • 1-34
      練習 2-4-1
    • 1-35
      練習 2-4-2
    • 1-36
      練習 2-4-3
    • 1-37
      2-5 迴圈、分支、樣本設定與附加資料
    • 1-38
      練習2-5-1
    • 1-39
      2-6 以最小樣本進行迴圈與分支
    • 1-40
      練習2-6-1
    • 1-41
      2-7 讀入多個檔案進行儲存、合併與運算
    • 1-42
      練習2-7-1
    • 1-43
      2-8 結合多個檔案之變數
    • 1-44
      練習2-8-1
    • 1-45
      2-9 計算日資料之月平均與季平均值
    • 1-46
      練習2-9-1
    • 1-47
      學習評量
    • 1-48
      CH03 模型之建置、 評分與驗證
    • 1-49
      3-1 分類模型之建置
    • 1-50
      練習3-1-1
    • 1-51
      練習3-1-2
    • 1-52
      3-2 模型預測
    • 1-53
      3-3 分割資料預測並檢視績效
    • 1-54
      練習3-3-1
    • 1-55
      練習3-3-2
    • 1-56
      練習3-3-3
    • 1-57
      3-4 交叉驗證
    • 1-58
      練習3-4-1
    • 1-59
      3-5 視覺化模型比較
    • 1-60
      練習3-5-1
    • 1-61
      練習3-5-2
    • 1-62
      練習3-5-3
    • 1-63
      學習評量
    • 1-64
      CH04 多元實例練習
    • 1-65
      4-1 國外旅遊分析
    • 1-66
      練習4-1-1
    • 1-67
      4-2 價格分群
    • 1-68
      練習4-2-1
    • 1-69
      練習4-2-2
    • 1-70
      練習4-2-3
    • 1-71
      4-3 信用違約與參數最佳化
    • 1-72
      練習4-3-1
    • 1-73
      練習4-3-2
    • 1-74
      4-4 客戶流失與資料不平衡
    • 1-75
      練習4-4-1
    • 1-76
      4-5 增益圖分析
    • 1-77
      練習4-5-1
    • 1-78
      4-6 以KNN 模型尋找最近基地台
    • 1-79
      練習4-6-1
    • 1-80
      4-7 迴歸模型與二手車售價(1)
    • 1-81
      練習4-7-1
    • 1-82
      4-8 迴歸模型與二手車售價(2)
    • 1-83
      練習4-8-1
    • 1-84
      4-9 嬰兒體重過輕預測
    • 1-85
      練習4-9-1
    • 1-86
      練習4-9-2
    • 1-87
      學習評量
    • 1-88
      CH05 進階實例練習
    • 1-89
      5-1 醫療詐欺偵測
    • 1-90
      練習5-1-1
    • 1-91
      練習5-1-2
    • 1-92
      5-2 購物籃分析
    • 1-93
      練習5-2-1
    • 1-94
      練習5-2-2
    • 1-95
      5-3 依據績效發送警訊郵件(1)
    • 1-96
      5-4 依據績效發送警訊郵件(2)
    • 1-97
      5-5 機器維修預測(1)
    • 1-98
      5-6 機器維修預測(2)
    • 1-99
      5-7 移動平均與趨勢
    • 1-100
      練習5-7-1
    • 1-101
      5-8 公司財報與股價
    • 1-102
      練習5-8-1
    • 1-103
      5-9 處裡視窗資料
    • 1-104
      5-10 天氣預測:交叉驗證與滑動視窗驗證
    • 1-105
      練習5-10-1
    • 1-106
      5-11 天氣預測:ARIMA 模型
    • 1-107
      5-12 Holt-Winters 模型㍤
    • 1-108
      5-13 RFM 模型分析(1)
    • 1-109
      5-14 RFM 模型分析(2)
    • 1-110
      練習5-14-1
    • 1-111
      學習評量
    • 1-112
      CH06 中英文文字探勘
    • 1-113
      6-1 圖書主題預測
    • 1-114
      練習6-1-1
    • 1-115
      6-2 徵才廣告分析
    • 1-116
      練習6-2-1
    • 1-117
      6-3 消費者評價分析(1)
    • 1-118
      練習6-3-1
    • 1-119
      練習6-3-2
    • 1-120
      6-4 消費者評價分析(2)
    • 1-121
      練習6-4-1
    • 1-122
      6-5 結合Python 之中文文字探勘
    • 1-123
      練習6-5-1
    • 1-124
      附錄
    • 1-125
      6-6 消費者情緒分析
    • 1-126
      練習6-6-1
    • 1-127
      練習6-6-2
    • 1-128
      6-7 網頁探勘
    • 1-129
      練習6-7-1
    • 1-130
      學習評量
    • 1-131
      版權頁
    • 1-132
      封底頁

    常见问答

    您可以透過手機、平板或是電腦登入 HiSKIO 平台,在【我的學習】>【我的書籍】頁面,選擇想看的電子書。

    猜你喜欢

    用户评价

    | 收集中

    销售方案