架構師
互聯(lián)網
架構設計
DevOps
運維
數據庫
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

百度智能運維AIOps專場

百度 智能運維AIOps團隊

曾國偉,百度資深數據庫架構師、資深研發(fā)工程師,私有云數據庫技術負責人,主導百度泛數據庫運維框架構建。2012年入職百度,先后負責百度分布式數據庫運維,數據庫高可用、資源管理等技術方向,百度公有云數據庫開發(fā),私有云數據庫的架構設計與開發(fā)工作。
王博,先后參與異常檢測系統(tǒng)、報警收斂、故障診斷等相關工作。目前是異常檢測系統(tǒng)的技術負責人。
王藝,智能運維團隊架構負責人。先后負責百度鏈接庫、百度志愿計算、百度統(tǒng)一資源管理的研發(fā),經歷過千億級鏈接的洗禮,也調度過數十萬量級的服務器,熱衷于直面架構技術挑戰(zhàn),在分布式計算,分布式資源、任務調度方面經驗豐富。
哈晶晶, 百度智能云架構師。先后負責服務管理、資源管理、變更管理、故障管理的業(yè)務分析和架構設計工作,熱衷于基礎運維平臺和智能運維解決方案的探索。當前主要關注支持百度搜索、廣告、FEED流等核心業(yè)務故障發(fā)現(xiàn)、定位和自愈解決方案,推進AIOps應用落地。

曾國偉,百度資深數據庫架構師、資深研發(fā)工程師,私有云數據庫技術負責人,主導百度泛數據庫運維框架構建。2012年入職百度,先后負責百度分布式數據庫運維,數據庫高可用、資源管理等技術方向,百度公有云數據庫開發(fā),私有云數據庫的架構設計與開發(fā)工作。 王博,先后參與異常檢測系統(tǒng)、報警收斂、故障診斷等相關工作。目前是異常檢測系統(tǒng)的技術負責人。 王藝,智能運維團隊架構負責人。先后負責百度鏈接庫、百度志愿計算、百度統(tǒng)一資源管理的研發(fā),經歷過千億級鏈接的洗禮,也調度過數十萬量級的服務器,熱衷于直面架構技術挑戰(zhàn),在分布式計算,分布式資源、任務調度方面經驗豐富。 哈晶晶, 百度智能云架構師。先后負責服務管理、資源管理、變更管理、故障管理的業(yè)務分析和架構設計工作,熱衷于基礎運維平臺和智能運維解決方案的探索。當前主要關注支持百度搜索、廣告、FEED流等核心業(yè)務故障發(fā)現(xiàn)、定位和自愈解決方案,推進AIOps應用落地。

課程費用

6800.00 /人

課程時長

3小時

成為教練

課程簡介

一、《百度云金融級數據庫高可用保障》
數據庫的高可用和數據一致性一直是業(yè)務對數據庫的強需求,在金融級業(yè)務場景下更為突出。本演講為各位分享百度多年積累的數據庫高可用經驗和架構設計,介紹百度云如何快速、準確地感知故障,并進行故障恢復,盡可能地降低數據庫服務故障的RTO、RPO,為百度云支撐金融級業(yè)務數據庫服務保駕護航。
二、《百度海量指標異常檢測設計與實踐》
自動異常檢測是智能監(jiān)控系統(tǒng)的精髓所在。百度的業(yè)務種類繁多,業(yè)務的監(jiān)控需求也不盡相同,面對監(jiān)控系統(tǒng)所采集的數以億計的監(jiān)控指標,如何能夠實現(xiàn)全自動化的異常檢測,是一個巨大的挑戰(zhàn)。怎樣支持百度各類業(yè)務的流量、收入、PVLOST、響應時間等業(yè)務指標監(jiān)測?如何解決海量指標的自動算法選擇與參數自動訓練問題?這次演講,我們將介紹百度自動異常檢測系統(tǒng)面臨的主要挑戰(zhàn),在各種典型場景下的智能異常檢測算法以及系統(tǒng)架構和策略模型。此外,我們不僅會展示百度自動異常檢測系統(tǒng)在實際場景中的良好效果,還會開放一個試用的站點,歡迎大家申請試用。
三、《AIOps平臺架構實踐》
AIOps近年來已經逐漸代替DevOps,成為運維領域最具曝光度的名詞。本次分享將從百度智能運維的整體架構開始,按照數據流和控制流兩條線,介紹百度在智能運維研發(fā)領域的工程經驗,討論如何以可擴展的方式,將人的智慧融入到運維系統(tǒng)當中。
四、《基于AIOps的故障自愈實踐》
在業(yè)務規(guī)模龐大、架構復雜,迭代速度快、服務可用性要求高的背景下,故障處理對運維人員的挑戰(zhàn)與日俱增,故障處理的質量和效率不但影響業(yè)務的可用性還影響運維人員工作的幸福度。百度在2014年開始智能故障處理的探索,制定了一套基于AIOps的故障自愈方案,提高故障處理可靠性,同時降低故障時間。此方案在百度內部應用廣泛,在搜索、廣告、FEED流、地圖、AI等核心業(yè)務均取得了較好應用效果。本次分享將介紹百度故障處理從人工處理、工具輔助、部分自動化、有條件的自動化到高度自動化的演進過程,并且以單機器、單實例、單集群和全局故障場景為例分享百度故障自愈實踐。

目標收益

培訓對象

課程內容

一、《百度云金融級數據庫高可用保障》
數據庫的高可用和數據一致性一直是業(yè)務對數據庫的強需求,在金融級業(yè)務場景下更為突出。本演講為各位分享百度多年積累的數據庫高可用經驗和架構設計,介紹百度云如何快速、準確地感知故障,并進行故障恢復,盡可能地降低數據庫服務故障的RTO、RPO,為百度云支撐金融級業(yè)務數據庫服務保駕護航。
二、《百度海量指標異常檢測設計與實踐》
自動異常檢測是智能監(jiān)控系統(tǒng)的精髓所在。百度的業(yè)務種類繁多,業(yè)務的監(jiān)控需求也不盡相同,面對監(jiān)控系統(tǒng)所采集的數以億計的監(jiān)控指標,如何能夠實現(xiàn)全自動化的異常檢測,是一個巨大的挑戰(zhàn)。怎樣支持百度各類業(yè)務的流量、收入、PVLOST、響應時間等業(yè)務指標監(jiān)測?如何解決海量指標的自動算法選擇與參數自動訓練問題?這次演講,我們將介紹百度自動異常檢測系統(tǒng)面臨的主要挑戰(zhàn),在各種典型場景下的智能異常檢測算法以及系統(tǒng)架構和策略模型。此外,我們不僅會展示百度自動異常檢測系統(tǒng)在實際場景中的良好效果,還會開放一個試用的站點,歡迎大家申請試用。
三、《AIOps平臺架構實踐》
AIOps近年來已經逐漸代替DevOps,成為運維領域最具曝光度的名詞。本次分享將從百度智能運維的整體架構開始,按照數據流和控制流兩條線,介紹百度在智能運維研發(fā)領域的工程經驗,討論如何以可擴展的方式,將人的智慧融入到運維系統(tǒng)當中。
四、《基于AIOps的故障自愈實踐》
在業(yè)務規(guī)模龐大、架構復雜,迭代速度快、服務可用性要求高的背景下,故障處理對運維人員的挑戰(zhàn)與日俱增,故障處理的質量和效率不但影響業(yè)務的可用性還影響運維人員工作的幸福度。百度在2014年開始智能故障處理的探索,制定了一套基于AIOps的故障自愈方案,提高故障處理可靠性,同時降低故障時間。此方案在百度內部應用廣泛,在搜索、廣告、FEED流、地圖、AI等核心業(yè)務均取得了較好應用效果。本次分享將介紹百度故障處理從人工處理、工具輔助、部分自動化、有條件的自動化到高度自動化的演進過程,并且以單機器、單實例、單集群和全局故障場景為例分享百度故障自愈實踐。

課程費用

6800.00 /人

課程時長

3小時

預約體驗票 我要分享

近期公開課推薦

近期公開課推薦

活動詳情

提交需求