整合 Prometheus 指標採集、DeepSeek 智慧分析與 Dify 工作流,打造自動巡檢到異常報告的維運閉環
從被動告警升級到主動巡檢,在問題擴大前就挑出潛在異常
用 Dify 工作流把維運 SOP 編排起來,讓 AI 照著你的邏輯跑
整合 Prometheus + AlertManager + DeepSeek,打通告警到 AI 分析的完整鏈路
用知識庫與向量索引,讓 AI 給出貼合自家環境的答案,而非通用建議
建立手動觸發 + 定時排程兩種模式,形成完整維運閉環
按一下 进入设定
維運工程師的日常循環是這樣的:
告警響了、開監控面板、看哪個指標異常、憑經驗判斷根因、決定處理方式、事後寫報告。
但這個循環有個根本問題——你永遠是被動的。
告警響了才動手,代表問題已經發生、使用者可能已經受影響。
真正好的維運狀態,是在告警響之前就知道「這裡不太對勁」。
過去做不到,是因為主動巡檢太貴。
要一個工程師每小時去看一輪各項指標、對照歷史趨勢、判斷有沒有異常苗頭——
沒人有這種時間。於是大家只能設告警、等它響、再救火。
但現在不一樣了。
LLM 能讀懂告警語意、對照知識庫、給出處理建議;
Dify 工作流能把整套巡檢 SOP 編排起來,定時自己跑。
這代表:你可以讓 AI 每小時、每天自動巡檢一輪,在告警響之前就把潛在問題挑出來。
告警真的響了,AI 也已經準備好一份含原因分析與處理建議的報告等你。
問題是,真的要把 AI 接進 Prometheus 做到自動巡檢,馬上會遇到幾件事:
說到底,難的不是單點技術,而是如何把整條鏈路串起,讓維運能自動且長期運作。
這堂課以「讓 AI 自動巡檢、主動出報告」為終點目標,從零搭建整套技術鏈路。
你會先用 Docker 完整建起 Prometheus + AlertManager,讓它採集使用者登入的業務指標、設定告警規則。
這是傳統的被動告警機制,讓告警響時能自動轉發出去。
然後才是這堂課最有份量的部分——用 Dify 工作流把維運 SOP 編排成自動化系統。
光讓 AI 分析一條告警不夠,真正的智慧維運,是把「收到告警 → 查指標 → 對照知識庫 → 給出處理建議 → 產出報告」這整條 SOP 變成一個 AI 工作流,讓它在告警觸發時自動跑,或是按排程定時主動巡檢。
從 Dify 安裝、節點設計、參數擷取、知識庫向量索引到 AI Agent 整合——你將學會讓自動巡檢真正跑起來的關鍵能力。因為 Prometheus 告警之後的自動化,才是真正把工程師從救火中解放出來的關鍵。
整堂課以「電商使用者登入異常」為貫穿場景,手動觸發和定時排程兩種巡檢模式都實作一遍。
學完跑過一套從「被動告警」升級到「主動巡檢」的完整系統。
同一套工作流架構,可以延伸到你維運中所有需要定時巡檢的場景。
| 模組 | 你會學到什麼 |
|---|---|
| 課程導覽與架構思路 | 整體技術鏈路拆解、Prometheus + DeepSeek + Dify 各司其職的角色分工、課程學習路徑 |
| Prometheus 指標採集與告警設定 | Docker 安裝 Prometheus Server、資料採集原理與指標定義、Client 端生成登入指標、設定檔配置、告警規則撰寫 |
| AlertManager 告警轉發 | AlertManager 安裝與設定、Prometheus Server 與 AlertManager 的網路環境配置 |
| DeepSeek 智慧分析 | 分析服務程式碼撰寫、生成含原因分析與處理建議的報告、整體測試與案例總結 |
| Dify 工作流自動巡檢實戰 | Dify 安裝與介面介紹、LLM 節點設定、參數擷取與變數設定、知識庫與向量索引、AI Agent 整合、手動觸發與定時巡檢兩種模式實作 |
| 特色 | 說明 |
|---|---|
| 從被動告警升級到主動巡檢 | 不是等告警響才動手,而是讓 AI 按排程定時主動掃一輪,在問題擴大前就挑出潛在異常 |
| Dify 工作流深度實作 | 從安裝、節點設計、參數擷取、知識庫向量索引到 AI Agent 整合,15 個單元把 Dify 當成主角完整講透,不是擦邊講一下就過 |
| 把維運 SOP 編排成 AI 工作流 | 不只是呼叫 AI 給建議,而是把「查指標 → 對照知識庫 → 產出報告」整條 SOP 編排進工作流,讓 AI 照著你的維運邏輯跑 |
| 知識庫讓 AI 給出企業級答案 | 接上知識庫之後,AI 不再只會給通用建議,而是能結合你們系統的歷史經驗、對應的處理流程,給出貼合自家環境的方案 |
| 電商登入異常貫穿全場 | 所有實作圍繞「使用者登入異常」這個真實業務場景,從指標定義到最後的巡檢報告都是同一條故事線,學完可以直接對應自己工作中的類似情境 |
| 從零安裝到整合測試 | Docker 安裝、網路環境配置、AlertManager 整合、Dify 部署,每一步都示範 |
崔皓 AI 架構師/大模型技術講師 |
技術背景與專長
如果您購買的是募資課程,請在課程的【簡介】中查看開課時間,募資課程將於開課時間所述日期開放同學上課。
若您購買的是一般課程(開放上課課程),則在購買完成後可以立即開始觀看。
所有線上課程皆不受時間限制,享無限次永久觀看!
| 收集中