Don't miss the limited offer!
2 course bundle
Click for settings
# 利用爬蟲實現資料收集,善用工具增加作業效率
這堂課將帶你從網頁爬蟲延伸,帶你強化 Python 爬蟲技巧,學會擷取不同資料來源,並使用最熱門的 NoSQL 資料庫儲存及處理數據,再輔以現行最熱門的兩個工具「kafka」、「airflow」來實現「自動化資料流串接」的功能。
# 老師都幫你想好了,在這堂課裡就能找到相對應的解決工具
# 完整學習從資料庫的整合,到數據載入自動化管理工具
1. 最著名、最簡單的 NoSQL 數據庫 MongoDB
|適用於資料來源多樣、格式不確定、經常調整變動的情境|
2. 數據讀取一秒鐘幾十萬上下就靠 Kafka
|用戶行為追蹤、追蹤訂閱、日誌紀錄等場景都能高效處理|
3. 你的自動化痛點由 Airflow 解決
|協助監控流程,工作自動排程,維護管理都輕鬆|
# 數據為王的時代,能將數據工作自動化將讓你的職場角色更穩固