使用 Python 3 進行網路爬蟲實戰
python 基礎語法
網路爬蟲基礎概念
實作一隻基本網路爬蟲的流程
爬蟲是一個可以自動化抓取網頁內容的程式,相信大家都遇過需要抓取網頁資訊的時候,也許是因為要做報告、或是出於興趣想研究,需要相關參考資料。最簡單的方法就是一筆筆複製,然後貼到文字編輯器儲存,再做後續的分析,如果只有幾十筆還好,那假如有上百筆、上千筆怎麼辦呢?重複的動作做個幾次,大致上就可以拆解出每個步驟:先進入到某個網頁、複製所需要的資訊、貼入文字編輯器,接著不斷重複以上動作,直到所有頁面都被翻完,就大功告成啦,過程用敘述的都很輕鬆,一句話就結束了,但如果實際下來做,在反覆機器式的複製貼上過程,真的會使人非常煩躁,相信每個經歷過的使用者都想過,要是可以自動化該有多好?而爬蟲就是解決這個問題的好幫手。
首先我們簡單的介紹網路爬蟲在做些什麼,然後開始安裝 python3,再來會說明一些 python3 的基礎語法,語法都有了一定的基礎以後,會說明網頁的構成,因為要對網頁有一定的基礎了解,才可以更精確的抓取想要的資訊,以上都說明完了以後,就會開始本章的主題,網路爬蟲實戰教學,在教學裡我們是以抓取PPT文章作為範例,相信學完以後,一定可以對 python 及網路爬蟲有一定的解了。
感謝作者/蘇炳立(Su Billy) 在HiSKIO 分享此課程, 對Python興趣的朋友,也能關注他的 Youtube 頻道
如果您購買的是募資課程,請在課程的【簡介】中查看開課時間,募資課程將於開課時間所述日期開放同學上課。
若您購買的是一般課程(開放上課課程),則在購買完成後可以立即開始觀看。
所有線上課程皆不受時間限制,享無限次永久觀看!