文科生也可以輕鬆學習網路爬蟲:Python+Web Scraper

    ★使用免寫程式的Web Scraper爬蟲工具和Python輕鬆學習網路爬蟲!

    Collecting
    US$16.27
    ★使用免寫程式的Web Scraper爬蟲工具和Python輕鬆學習網路爬蟲!

    *本書使用Web Scraper瀏覽器擴充功能的爬蟲工具,讓你不用撰寫程式碼,就可以建立CSS選擇器的網站爬取地圖從網站擷取資料,不只能夠輕鬆爬取約7~8成網站,更透過Web Scraper工具讓你輕鬆一邊爬一邊學習HTML標籤+CSS選擇器,輕鬆了解Web網頁內容和各種網站巡覽結構。
    *Python網路爬蟲程式不只能夠爬取Web Scraper工具爬取的網站內容,對於進階JavaScript動態和使用者互動網站,我們可以配合Python+Selenium爬取各種使用者互動網站,讓你在瀏覽器看得到的資料,就可以爬到資料;最後說明Python的Pandas資料清理和Plotly資料視覺化。

    Content

    • 1-1
      封面頁
    • 1-2
      書名頁
    • 1-3
      序言
    • 1-4
      目錄
    • 1-5
      第一篇 Web Scraper 網路爬蟲:免寫程式邊爬邊學 HTML+CSS
    • 1-6
      Ch01 認識網路爬蟲、HTML 和CSS
    • 1-7
      1-1 網路爬蟲的基礎
    • 1-8
      1-2 了解瀏覽器瀏覽網頁的步驟
    • 1-9
      1-3 認識HTTP 通訊協定與URL 網址
    • 1-10
      1-3-1 HTTP 通訊協定
    • 1-11
      1-3-2 URL 網址
    • 1-12
      1-4 HTML5 標示語言
    • 1-13
      1-4-1 認識HTML 標示語言
    • 1-14
      1-4-2 HTML5 網頁的結構
    • 1-15
      1-5 CSS 基礎與CSS 選擇器
    • 1-16
      1-5-1 認識CSS
    • 1-17
      1-5-2 CSS 的基本語法
    • 1-18
      1-5-3 CSS 選擇器互動測試工具
    • 1-19
      1-6 在瀏覽器安裝Web Scraper 擴充功能
    • 1-20
      1-6-1 認識Web Scraper 擴充功能
    • 1-21
      1-6-2 安裝與使用Web Scraper 擴充功能
    • 1-22
      Ch02 爬取HTML 標題、段落與文字格式標籤
    • 1-23
      2-1 爬取HTML 標題文字標籤
    • 1-24
      2-2 爬取HTML 段落文字標籤
    • 1-25
      2-2-1 爬取全部的HTML 段落標籤
    • 1-26
      2-2-2 爬取特定HTML 段落標籤
    • 1-27
      2-3 爬取HTML 文字格式標籤
    • 1-28
      2-4 CSS 的型態和id 屬性選擇器
    • 1-29
      2-5 編輯與管理Web Scraper 網站地圖
    • 1-30
      Ch03 爬取清單項目和表格標籤
    • 1-31
      3-1 爬取HTML 清單標籤
    • 1-32
      3-1-1 認識HTML 清單標籤
    • 1-33
      3-1-2 從HTML 網頁爬取<ol>和<ul>兩種標籤
    • 1-34
      3-1-3 使用CSS 樣式類別的選擇器
    • 1-35
      3-1-4 使用Element 選擇器類型
    • 1-36
      3-1-5 將多個答案改為是同一筆記錄
    • 1-37
      3-2 爬取HTML 表格標籤
    • 1-38
      3-2-1 認識HTML 表格標籤
    • 1-39
      3-2-2 使用Table 選擇器類型
    • 1-40
      3-2-3 依序爬取多個HTML 表格
    • 1-41
      3-3 網路爬蟲實戰:PChome 股票資訊
    • 1-42
      3-4 CSS 樣式類別和群組選擇器
    • 1-43
      3-5 在網路地圖新增多個起始URL
    • 1-44
      3-6 使用Element 節點爬取HTML 標籤
    • 1-45
      Ch04 爬取圖片和超連結標籤
    • 1-46
      4-1 爬取HTML 圖片標籤
    • 1-47
      4-1-1 認識HTML 圖片標籤
    • 1-48
      4-1-2 在網頁找出圖片的URL 網址
    • 1-49
      4-1-3 爬取HTML 圖片標籤
    • 1-50
      4-2 爬取HTML 超連結標籤
    • 1-51
      4-2-1 認識HTML 超連結標籤
    • 1-52
      4-2-2 爬取HTML 超連結標籤
    • 1-53
      4-2-3 使用Link 類型爬取清單和詳細內容的網頁
    • 1-54
      4-3 網路爬蟲實戰:Yahoo!電影本週新片清單
    • 1-55
      4-4網路爬蟲實戰:Yahoo!電影本週新片詳細資訊
    • 1-56
      4-5 CSS 選擇器的語法整理
    • 1-57
      Ch05 爬取HTML 容器和版面配置標籤
    • 1-58
      5-1 爬取HTML 容器標籤
    • 1-59
      5-1-1 認識HTML 容器標籤
    • 1-60
      5-1-2 爬取HTML 容器標籤
    • 1-61
      5-2 網路爬蟲實戰:MoneyDJ 新聞總表
    • 1-62
      5-3 爬取HTML 版面配置標籤
    • 1-63
      5-3-1 HTML 4 與HTML5 網頁的內容結構
    • 1-64
      5-3-2 認識HTML5 版面配置的結構標籤
    • 1-65
      5-4 使用正規表達式處理擷取的資料
    • 1-66
      5-4-1 認識正規表達式
    • 1-67
      5-4-2 處理擷取的日期資料
    • 1-68
      5-4-3 處理擷取的整數資料
    • 1-69
      5-4-4 處理擷取的浮點數資料同
    • 1-70
      Ch06 爬取階層選單和上/下頁巡覽網站
    • 1-71
      6-1 認識網站巡覽
    • 1-72
      6-2 爬取階層選單巡覽的網站
    • 1-73
      6-3 爬取上/下頁巡覽的網站
    • 1-74
      6-4 起始URL 網址的範圍參數
    • 1-75
      6-4-1 認識起始URL 網址的範圍參數
    • 1-76
      6-4-2 在起始URL 網址使用範圍參數
    • 1-77
      6-4-3 在分頁參數使用範圍參數
    • 1-78
      Ch07 爬取頁碼、更多按鈕和無限捲動頁面巡覽的網站
    • 1-79
      7-1 認識Web Scraper 的分頁處理
    • 1-80
      7-2 爬取頁碼分頁巡覽的網站
    • 1-81
      7-3 爬取AJAX 分頁巡覽的網站
    • 1-82
      7-3-1 認識AJAX 分頁按鈕
    • 1-83
      7-3-2 爬取AJAX 分頁巡覽的網站
    • 1-84
      7-4 爬取更多按鈕巡覽的網站
    • 1-85
      7-5 爬取捲動頁面巡覽的網站
    • 1-86
      Ch08 Web Scraper 爬蟲實戰:新聞、商務和金融數據爬取
    • 1-87
      8-1 網路爬蟲實戰:爬取新聞和BBS 貼文
    • 1-88
      8-2 網路爬蟲實戰:爬取商務資料
    • 1-89
      8-3 網路爬蟲實戰:爬取金融數據
    • 1-90
      第二篇 Python 網路爬蟲:網路資料擷取「全方位」實戰
    • 1-91
      Ch09 認識Python 網路爬蟲
    • 1-92
      9-1 網頁設計技術與JavaScript
    • 1-93
      9-1-1 認識網頁設計技術
    • 1-94
      9-1-2 JavaScript 語言
    • 1-95
      9-1-3 Quick JavaScript Switcher 擴充功能
    • 1-96
      9-2 如何產生瀏覽器顯示的網頁內容
    • 1-97
      9-2-1 在伺服端產生網頁內容
    • 1-98
      9-2-2 在客戶端產生網頁內容
    • 1-99
      9-2-3 混合產生網頁內容
    • 1-100
      9-3 建立Python 網路爬蟲
    • 1-101
      9-3-1 認識Python 網路爬蟲
    • 1-102
      9-3-2 Python 網路爬蟲的基本步驟
    • 1-103
      9-4 開發人員工具的使用
    • 1-104
      9-4-1 切換開啟開發人員工具
    • 1-105
      9-4-2 檢視HTML 元素
    • 1-106
      9-4-3 取得選取元素的網頁定位資料
    • 1-107
      9-4-4 主控台標籤頁
    • 1-108
      9-5 使用Python 處理CSV 資料
    • 1-109
      9-5-1 讀取CSV 檔案內容
    • 1-110
      9-5-2 寫入清單資料建立CSV 檔案
    • 1-111
      Ch10 使用requests 和Selenium 取得網路資料
    • 1-112
      10-1 使用requests 取得網路資料
    • 1-113
      10-1-1 requests 的GET 請求
    • 1-114
      10-1-2 requests 的POST 請求
    • 1-115
      10-1-3 處理URL 網址參數
    • 1-116
      10-1-4 處理HTTP 標頭資訊和Cookie
    • 1-117
      10-2 使用Selenium 取得網路資料
    • 1-118
      10-2-1 下載和安裝Selenium
    • 1-119
      10-2-2 使用Selenium 取得網路資料
    • 1-120
      10-3 取得HTML 表單送回的網路資料
    • 1-121
      10-3-1 使用RestMan 擴充功能測試HTTP 請求
    • 1-122
      10-3-2 取得HTML 表單送回的網路資料
    • 1-123
      10-4 Python 爬蟲實戰:取得無限捲動分頁的網路資料
    • 1-124
      10-5 Python 爬蟲實戰:取得台鐵列車時刻 / 車次的查詢資料
    • 1-125
      Ch11 Beautiful Soup 剖析與擷取網頁資料
    • 1-126
      11-1 用BeautifulSoup 擷取網頁資料
    • 1-127
      11-1-1 BeautifulSoup 模組的基本使用
    • 1-128
      11-1-2 取得擷取HTML 標籤的相關資訊
    • 1-129
      11-1-3 使用BeautifulSoup 搜尋HTML 標籤
    • 1-130
      11-2 使用正規表達式擷取網頁資料
    • 1-131
      11-2-1 Python 的re 模組的使用
    • 1-132
      11-2-2 使用正規表達式剖析HTML 網頁
    • 1-133
      11-3 Selenium+BeautifulSoup 擷取網頁資料
    • 1-134
      11-3-1 Selenium+BeautifulSoup 擷取網頁資料
    • 1-135
      11-3-2 在Selenium 使用XPath 表達式定位網頁資料
    • 1-136
      11-4 Python 爬蟲實戰:爬取HTML 表單的互動網頁
    • 1-137
      Ch12 使用Python 爬取AJAX、互動網頁與Web API
    • 1-138
      12-1 AJAX 與JSON 的基礎
    • 1-139
      12-1-1 AJAX 的基礎
    • 1-140
      12-1-2 認識JSON
    • 1-141
      12-2 使用開發人員工具分析和測試AJAX 請求
    • 1-142
      12-2-1 使用開發人員工具分析AJAX 請求
    • 1-143
      12-2-2 使用RestMan 擴充功能測試AJAX 請求
    • 1-144
      12-3 Python 處理JSON 資料
    • 1-145
      12-4 使用Web API 取得網路資料
    • 1-146
      12-4-1 認識Web API
    • 1-147
      12-4-2 直接從網站下載資料
    • 1-148
      12-4-3 Google 圖書查詢的Web API
    • 1-149
      12-5 Python 爬蟲實戰:爬取景氣對策信號分數
    • 1-150
      Ch13 Python 爬蟲實戰(一):爬取清單、表格與分頁資料
    • 1-151
      13-1 Python 爬蟲的常見問題
    • 1-152
      13-2 爬取臺北鐵路餐廳的便當菜單
    • 1-153
      13-3 爬取HouseFun 的台北市租房資料
    • 1-154
      13-4 爬取台灣證交所的券商資料
    • 1-155
      13-5 爬取Momo 購物網站NBA 球衣的商品資料
    • 1-156
      Ch14 Python 爬蟲實戰(二): Web API、AJAX 與互動網頁資料爬取
    • 1-157
      14-1 OpenWeatherMap 天氣資料的Web API
    • 1-158
      14-2 HTML 表單送回的集保戶股權分散表
    • 1-159
      14-3 AJAX 網頁的富時中國A50 指數期貨
    • 1-160
      14-4 互動操作爬取NBA 官網球員的下一頁資料
    • 1-161
      第三篇 Python 大數據分析:資料清理與資料視覺化
    • 1-162
      Ch15 Pandas 資料清理 - pandas
    • 1-163
      15-1 Pandas 基本使用
    • 1-164
      15-1-1 認識Pandas 的資料結構
    • 1-165
      15-1-2 建立Series 和DataFrame 物件
    • 1-166
      15-1-3 顯示DataFrame 資訊與取出資料
    • 1-167
      15-1-4 選擇、過濾與排序DataFrame 資料
    • 1-168
      15-2 Pandas 資料讀取與儲存
    • 1-169
      15-3 Pandas 常用的資料處理
    • 1-170
      15-4 Pandas 資料清理
    • 1-171
      15-4-1 處理遺漏值
    • 1-172
      15-4-2 處理重複資料
    • 1-173
      15-4-3 轉換分類資料成數值資料
    • 1-174
      15-5 資料清理實戰:清理欄位和重複標題列
    • 1-175
      Ch16 Python 資料視覺化 - plotly
    • 1-176
      16-1 認識資料視覺化
    • 1-177
      16-2 使用Matplotlib 繪製圖表
    • 1-178
      16-2-1 繪製折線圖
    • 1-179
      16-2-2 繪製散佈圖
    • 1-180
      16-2-3 繪製長條圖
    • 1-181
      16-2-4 繪製派圖
    • 1-182
      16-3 使用Plotly 套件繪製網頁互動圖表
    • 1-183
      16-3-1 Plotly 套件的基本使用
    • 1-184
      16-3-2 使用Plotly 套件繪製基本互動圖表
    • 1-185
      16-4 資料視覺化實戰:使用Pandas 繪製視覺化圖表
    • 1-186
      16-5 資料視覺化實戰:Plotly 繪製股票的OHLC 圖表和時序圖
    • 1-187
      附錄 A Python程式設計入門
    • 1-188
      附錄 B 離線安裝本書使用的瀏覽器擴充功能
    • 1-189
      附錄 C Web Scraper 爬蟲網站地圖
    • 1-190
      版權頁
    • 1-191
      封底頁

    FAQ

    您可以透過手機、平板或是電腦登入 HiSKIO 平台,在【我的學習】>【我的書籍】頁面,選擇想看的電子書。

    Recommendations

    Reviews

    | Collecting

    Sales Plans