Python大數據特訓班(第二版):資料自動化收集、整理、清洗、儲存、分析與應用實戰

    熱銷最新升級增強版!

    收集中
    免费
    熱銷最新升級增強版!

    迅速掌握資料處理要領,深入全方位專案主題
    立即體驗Python的大數據超強實戰力!

    面對大數據資料
    如何爬取?如何整理?如何儲存?
    如何分析?如何呈現?最後要如何應用?
    就從熱門案例切入,快速搜集梳理海量資訊!

    熱門搜尋關鍵字、股票的交易資訊、政府的公開資料、社群網站上傳的圖片與影音,以及實體通路或網路商店的銷售數據…等,都讓資料量快速爆增。大數據時代來臨,不僅科技業重視,就連傳統的零售業、金融業、製造業、旅遊業,以及政府都爭相投入,無不希望能運用數據分析與預測來協助決策方向,掌握數據就能找出趨勢的出路與提高判斷的精準度,也讓新興的數據分析師、資料分析師、資料科學家成為熱門職業。

    Python無疑是大數據與AI時代第一程式語言,在數據資料處理的領域中有著非常重要的地位。本書由生活出發,以專題實戰,只要能掌握數據資料爬取清洗、儲存整理、統計分析、視覺化呈現,以及跨領域應用的關鍵技術,就能掌控大數據的應用。

    ■快速建置便利的Python開發環境,一次學會資料科學的實用模組。
    ■完整學習Python資料處理的4大觀念與技術:爬取清理、讀取儲存、統計分析、呈現與應用。
    ■全面深入不同應用面向,如:網路爬蟲、資料正規化、資料視覺化、資料儲存與讀取(CSV、Excel、Google試算表、多媒體檔案擷取…)、批次檔案下載、公開資料應用、API建立…
    ■以最多元的熱門實例進行大數據專案實作,如:LINE貼圖收集、線上相簿批次下載、YouTube影片及播放清單下載、字幕與音檔下載,股票市場個股分析統計圖、股價資訊即時推播、網路新書排行榜、人力銀行求職資訊分析、超商門市資訊收集、即時網路聲量輿情觀察、鄉鎮市區天氣預報,以及Web API開發…
    ■範例程式另提供Python筆記神器:Jupyter Notebook格式檔案,讓學習與操作更便利。
    ■針對專案實戰提供影音輔助教學,加速學習效率。

    章节目录

    • 1-1
      封面頁
    • 1-2
      書名頁
    • 1-3
      關於文淵閣工作室
    • 1-4
      前言
    • 1-5
      學習資源說明
    • 1-6
      目錄
    • 1-7
      Ch01 建置Python 開發環境
    • 1-8
      1.1 建置 Anaconda 開發環境
    • 1-9
      1.1.1 安裝 Anaconda
    • 1-10
      1.1.2 Anaconda Prompt 管理模組
    • 1-11
      1.2 Spyder 編輯器
    • 1-12
      1.2.1 啟動Spyder 編輯器及調整畫面
    • 1-13
      1.2.2 檔案管理
    • 1-14
      1.2.3 Spyder 簡易智慧輸入
    • 1-15
      1.2.4 程式除錯
    • 1-16
      1.3 Jupyter Notebook 編輯器
    • 1-17
      1.3.1 啟動 Jupyter Notebook 及建立檔案
    • 1-18
      1.3.2 Jupyter Notebook 簡易智慧輸入
    • 1-19
      1.3.3 Jupyter Notebook 執行程式
    • 1-20
      1.3.4 Jupyter Notebook 常用編輯快速鍵
    • 1-21
      1.3.5 使用markdown 語法做筆記
    • 1-22
      1.3.6 匯出其他格式檔案
    • 1-23
      Ch02 數據資料的爬取
    • 1-24
      2.1 requests 模組:讀取網站檔
    • 1-25
      2.1.1 網路資料爬取的原理
    • 1-26
      2.1.2 發送GET 請求
    • 1-27
      2.1.3 發送POST 請求
    • 1-28
      2.1.4 自訂HTTP Headers 偽裝瀏覽器操作
    • 1-29
      2.1.5 使用Session 及Cookie 進入認證頁面
    • 1-30
      2.2 BeautifulSoup 模組:網頁解析
    • 1-31
      2.2.1 安裝Beautifulsoup 模組
    • 1-32
      2.2.2 認識網頁的結構
    • 1-33
      2.2.3 BeautifulSoup 的使用
    • 1-34
      2.2.4 BeautifulSoup 常用的屬性
    • 1-35
      2.2.5 BeautifulSoup 常用的方法
    • 1-36
      2.2.6 找尋指定標籤的內容:find()、find_all()
    • 1-37
      2.2.7 利用CSS 選擇器找尋內容:select()
    • 1-38
      2.2.8 取得標籤的屬性內容
    • 1-39
      2.2.9 專題:威力彩開獎號碼
    • 1-40
      2.3 使用正規表達式
    • 1-41
      2.3.1 正規表達式的使用
    • 1-42
      2.3.2 正規表達式的範例
    • 1-43
      2.3.3 建立正規表達式物件
    • 1-44
      2.3.4 正規表達式物件的方法
    • 1-45
      2.3.5 使用正規表達式取代內容
    • 1-46
      2.3.6 範例:正規表示式練習
    • 1-47
      2.4 Selenium 模組:瀏覽器自動化操作
    • 1-48
      2.4.1 使用 Selenium
    • 1-49
      2.4.2 尋找網頁元素
    • 1-50
      2.4.3 專題:高鐵時刻表查詢
    • 1-51
      Ch03 數據資料的儲存與讀取
    • 1-52
      3.1 檔案的讀寫
    • 1-53
      3.1.1 檔案的建立與寫入
    • 1-54
      3.1.2 檔案讀取及處理
    • 1-55
      3.2 csv 資料的讀取與寫入
    • 1-56
      3.2.1 認識CSV
    • 1-57
      3.2.2 csv 模組的使用
    • 1-58
      3.2.3 csv 檔案讀取
    • 1-59
      3.2.4 csv 檔案寫入
    • 1-60
      3.3 json 資料的儲存與讀取
    • 1-61
      3.3.1 認識json
    • 1-62
      3.3.2 json 模組的使用
    • 1-63
      3.3.3 json 讀取資料
    • 1-64
      3.3.4 json 輸出資料
    • 1-65
      3.4 Excel 資料儲存與讀取
    • 1-66
      3.4.1 Excel 檔案新增及儲存
    • 1-67
      3.4.2 Excel 檔案讀取及編輯
    • 1-68
      3.5 SQLite 資料庫的操作
    • 1-69
      3.5.1 使用 sqlite3 模組
    • 1-70
      3.5.2 使用 cursor 物件操作資料庫
    • 1-71
      3.5.3 檢視SQLite 資料庫內容
    • 1-72
      3.5.4 使用連線物件操作資料庫
    • 1-73
      3.5.5 執行資料查詢
    • 1-74
      3.6 MySQL 資料庫的操作
    • 1-75
      3.6.1 建立資料資料表
    • 1-76
      3.6.2 MySQL 資料庫管理
    • 1-77
      3.7 Google 試算表的操作
    • 1-78
      3.7.1 連接Google 試算表前的注意事項
    • 1-79
      3.7.2 Google Developers Console 的設定
    • 1-80
      3.7.3 Google 試算表的權限設定
    • 1-81
      3.7.4 連結Google 試算表
    • 1-82
      3.7.5 操作Google 試算表的資料
    • 1-83
      Ch04 數據資料視覺化
    • 1-84
      4.1 繪製折線圖:plot
    • 1-85
      4.1.1 Matplotlib 模組的使用
    • 1-86
      4.1.2 繪製折線圖
    • 1-87
      4.1.3 設定線條及圖例
    • 1-88
      4.1.4 設定標題
    • 1-89
      4.1.5 設定座標範圍
    • 1-90
      4.1.6 設定座標刻度
    • 1-91
      4.1.7 設定格線
    • 1-92
      4.1.8 同時繪製多組資料
    • 1-93
      4.1.9 Matplotlib 圖表顯示中文
    • 1-94
      4.2 繪製長條圖:bar、barh
    • 1-95
      4.2.1 繪製直條圖
    • 1-96
      4.2.2 繪製橫條圖
    • 1-97
      4.2.3 繪製堆疊長條圖
    • 1-98
      4.2.4 繪製並列長條圖
    • 1-99
      4.3 繪製散佈圖:scatter
    • 1-100
      4.4 繪製圓餅圖:pie
    • 1-101
      4.5 設定圖表區:figure
    • 1-102
      4.6 在圖表區加入多張圖表:subplot、axes
    • 1-103
      4.6.1 用欄列排列多張圖表:subplot
    • 1-104
      4.6.2 用相對位置排列多張圖表:axes
    • 1-105
      4.6.3 專題:圖書分類銷售分析圖
    • 1-106
      Ch05 Numpy 數據運算
    • 1-107
      5.1 Numpy 陣列建立與取值
    • 1-108
      5.1.1 認識Numpy 陣列
    • 1-109
      5.1.2 建立陣列的函數及重要屬性
    • 1-110
      5.1.3 陣列取值
    • 1-111
      5.1.4 產生隨機的陣列資料
    • 1-112
      5.1.5 讀取檔案內容新增陣列
    • 1-113
      5.2 Numpy 陣列資料處理
    • 1-114
      5.2.1 Numpy 陣列運算
    • 1-115
      5.2.2 Numpy 常用的計算及統計函數
    • 1-116
      5.2.3 Numpy 的排序
    • 1-117
      Ch06 Pandas 資料處理
    • 1-118
      6.1 Pandas Series 的建立與取值
    • 1-119
      6.1.1 建立Series
    • 1-120
      6.1.2 Series 取值
    • 1-121
      6.2 Pandas DataFrame 的建立
    • 1-122
      6.2.1 建立DataFrame
    • 1-123
      6.2.2 利用字典建立DataFrame
    • 1-124
      6.2.3 利用Series 建立DataFrame
    • 1-125
      6.3 DataFrame 資料取值
    • 1-126
      6.3.1 DataFrame 基本取值
    • 1-127
      6.3.2 以索引及欄位名稱取得資料:loc
    • 1-128
      6.3.3 以索引及欄位編號取得資料:iloc
    • 1-129
      6.3.4 取得最前或最後數列資料
    • 1-130
      6.4 DataFrame 資料操作
    • 1-131
      6.4.1 DataFrame 資料排序
    • 1-132
      6.4.2 DataFrame 資料修改
    • 1-133
      6.4.3 刪除 DataFrame 資料
    • 1-134
      6.5 Pandas 資料存取
    • 1-135
      6.5.1 使用Pandas 讀取資料
    • 1-136
      6.5.2 使用Pandas 儲存資料
    • 1-137
      6.6 Pandas 模組:繪圖應用
    • 1-138
      6.6.1 plot 繪圖方法
    • 1-139
      6.6.2 繪製長條圖、橫條圖、堆疊圖
    • 1-140
      6.6.3 繪製折線圖
    • 1-141
      6.6.4 繪製圓餅圖
    • 1-142
      6.7 Pandas 資料清洗
    • 1-143
      6.7.1 空值的處理
    • 1-144
      6.7.2 去除重複資料
    • 1-145
      6.7.3 資料內容的置換
    • 1-146
      6.7.4 調整資料的格式
    • 1-147
      6.8 Pandas 資料篩選、分組運算
    • 1-148
      6.8.1 Pandas 資料篩選
    • 1-149
      6.8.2 Pandas 資料分組運算
    • 1-150
      Ch07 LINE 貼圖收集器
    • 1-151
      7.1 專題方向
    • 1-152
      7.2 關鍵技術
    • 1-153
      7.2.1 網頁原始碼分析
    • 1-154
      7.2.2 擷取指定標籤和鍵值資料
    • 1-155
      7.3 實戰:LINE 貼圖收集器
    • 1-156
      7.3.1 LINE 貼圖下載
    • 1-157
      7.3.2 延伸應用
    • 1-158
      Ch08 Youtube 影片資源下載
    • 1-159
      8.1 專題方向
    • 1-160
      8.2 關鍵技術
    • 1-161
      8.2.1 Pytube 模組的使用
    • 1-162
      8.2.2 影片名稱及存檔路徑
    • 1-163
      8.2.3 影片格式
    • 1-164
      8.3 實戰:YouTube 影片及相關資源下載
    • 1-165
      8.3.1 認識YouTube 播放清單
    • 1-166
      8.3.2 批次下載播放清單中所有影片
    • 1-167
      8.3.3 下載聲音檔
    • 1-168
      8.3.4 下載字幕檔
    • 1-169
      8.3.5 延伸應用
    • 1-170
      Ch09 運動相簿批次爬取
    • 1-171
      9.1 專題方向
    • 1-172
      9.2 關鍵技術
    • 1-173
      9.2.1 取得相簿資訊與圖片位址
    • 1-174
      9.2.2 擷取非同步載入資料
    • 1-175
      9.3 實戰:運動相簿批次爬取
    • 1-176
      9.3.1 運動相簿照片基本下載
    • 1-177
      9.3.2 運動相簿照片批次下載
    • 1-178
      9.3.3 延伸應用
    • 1-179
      Ch10 台灣股票市場分析統計圖
    • 1-180
      10.1 專題方向
    • 1-181
      10.2 關鍵技術
    • 1-182
      10.2.1 取得XHR 資料
    • 1-183
      10.2.2 自訂日期格式轉換函式:convertDate
    • 1-184
      10.2.3 取得全年個股單月 JSON 資料網址
    • 1-185
      10.3 實戰:個股單月與年度統計圖
    • 1-186
      10.3.1 單月個股統計圖
    • 1-187
      10.3.2 全年個股統計圖
    • 1-188
      10.3.3 以 plotly 繪製全年個股統計圖
    • 1-189
      10.3.4 延伸應用
    • 1-190
      Ch11 行動股市即時報價
    • 1-191
      11.1 專題方向
    • 1-192
      11.2 關鍵技術
    • 1-193
      11.2.1 台灣股市資訊模組:twstock
    • 1-194
      11.2.2 申請 LINE Notify 權杖
    • 1-195
      11.2.3 發送 LINE Notify 通知
    • 1-196
      11.3 實戰:用LINE 傳送即時股價
    • 1-197
      11.3.1 執行情形
    • 1-198
      11.3.2 完整程式碼
    • 1-199
      11.3.3 延伸應用
    • 1-200
      Ch12 網路書店新書排行榜
    • 1-201
      12.1 專題方向
    • 1-202
      12.2 關鍵技術
    • 1-203
      12.2.1 URL 參數的分析
    • 1-204
      12.2.2 取得新書分類頁面相關資料
    • 1-205
      12.2.3 使用 User Agent 模擬瀏覽器訪問
    • 1-206
      12.2.4 上傳資料到Google 試算表
    • 1-207
      12.3 實戰:網路書店新書排行榜
    • 1-208
      12.3.1 取得新書分類排行榜資料
    • 1-209
      12.3.2 將資料儲存到 Google 試算表
    • 1-210
      12.3.3 延伸應用
    • 1-211
      Ch13 人力銀行網站求職小幫手
    • 1-212
      13.1 專題方向
    • 1-213
      13.2 關鍵技術
    • 1-214
      13.2.1 分析網址參數
    • 1-215
      13.2.2 擷取總頁數
    • 1-216
      13.2.3 擷取職缺各欄位資料
    • 1-217
      13.2.4 Pandas 篩選文字欄位資料
    • 1-218
      13.3 實戰:1111 人力銀行求職小幫手
    • 1-219
      13.3.1 擷取電腦相關行業職缺資料
    • 1-220
      13.3.2 統計六都職缺數量分布
    • 1-221
      13.3.3 統計六都平均薪資金額
    • 1-222
      13.3.4 延伸應用
    • 1-223
      Ch14 7-11 超商門市資料下載
    • 1-224
      14.1 專題方向
    • 1-225
      14.2 關鍵技術
    • 1-226
      14.2.1 取得下拉式功能表的縣市資料
    • 1-227
      14.2.2 下載各縣市的資料
    • 1-228
      14.2.3 將資料儲存在 Excel 檔案中
    • 1-229
      14.3 實戰:7-11 超商門市資料下載
    • 1-230
      14.3.1 儲存單一縣市超商門市資料
    • 1-231
      14.3.2 使用Pandas 將資料儲存成 Excel 檔案
    • 1-232
      14.3.3 以縣市為工作表儲存成 Excel 活頁簿
    • 1-233
      14.3.4 延伸應用
    • 1-234
      Ch15 即時網路聲量輿情收集器
    • 1-235
      15.1 專題方向
    • 1-236
      15.2 關鍵技術
    • 1-237
      15.2.1 擷取及分析非同步載入資料
    • 1-238
      15.2.2 下載指定日期的資料
    • 1-239
      15.2.3 將資料儲存在 txt 檔案中
    • 1-240
      15.3 實戰:即時網路聲量輿情資料下載
    • 1-241
      15.3.1 擷取即時熱門關鍵字及資訊
    • 1-242
      15.3.2 依日期儲存收集結果
    • 1-243
      15.3.3 延伸應用
    • 1-244
      Ch16 鄉鎮市區天氣預報及建立API
    • 1-245
      16.1 專題方向目前
    • 1-246
      16.2 關鍵技術
    • 1-247
      16.2.1 用Pandas 整理Excel 資料
    • 1-248
      16.2.2 用Pandas 擷取網頁表格資料
    • 1-249
      16.2.3 使用requests 及BeautifulSoup 整理擷取資料
    • 1-250
      16.2.4 用Pandas 整理資料
    • 1-251
      16.3 實戰:查詢鄉鎮市區天氣預報及建立 API
    • 1-252
      16.3.1 查詢鄉鎮市區天氣預報
    • 1-253
      16.3.2 Flask 網站建置Web API
    • 1-254
      16.4 部署 Web API 到 Heroku
    • 1-255
      16.4.1 安裝 Git 版本管理軟體
    • 1-256
      16.4.2 建立 Heroku 應用程式
    • 1-257
      16.4.3 安裝 Heroku CLI
    • 1-258
      16.4.4 建置空白虛擬環境
    • 1-259
      16.4.5 建立上傳檔案結構
    • 1-260
      16.4.6 部署到 Heroku
    • 1-261
      16.4.7 部署後修改應用程式內容
    • 1-262
      16.4.8 延伸應用
    • 1-263
      版權頁
    • 1-264
      封底頁

    常见问答

    您可以透過手機、平板或是電腦登入 HiSKIO 平台,在【我的學習】>【我的書籍】頁面,選擇想看的電子書。

    猜你喜欢

    用户评价

    | 收集中

    销售方案