工程師
其他
大數(shù)據(jù)
運(yùn)維
Spark
大數(shù)據(jù)平臺
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

大數(shù)據(jù)平臺運(yùn)維和優(yōu)化實(shí)戰(zhàn)培訓(xùn)

劉老師

某知名咨詢公司 云平臺系統(tǒng)架構(gòu)師

畢業(yè)于?連理??學(xué)
簡介:
精通開源的?數(shù)據(jù)?態(tài)技術(shù)和架構(gòu),Hadoop、Hive、Hbase、 Spark、Flink等開源技術(shù)棧。
有10年左右基于?數(shù)據(jù)解決?案平臺、數(shù)據(jù)架構(gòu)、數(shù)據(jù)中臺、數(shù)據(jù)治理、數(shù)據(jù)分析和挖掘的?型數(shù)據(jù)湖和數(shù)
據(jù)中臺項(xiàng)?架構(gòu)實(shí)施經(jīng)驗(yàn),
?前任職國內(nèi)知名咨詢公司,先后服務(wù)于北京?學(xué)軟件研究所、阿?巴巴、Teradata,實(shí)施過基于開源?數(shù)據(jù)技術(shù)
棧的數(shù)據(jù)湖解決?案和實(shí)施、湖倉?體架構(gòu)咨詢和實(shí)施、數(shù)據(jù)中臺的咨詢和設(shè)施
最近主要項(xiàng)?介紹:
某移動?數(shù)據(jù)平臺架構(gòu)設(shè)計和設(shè)施 (Hadoop、Spark)
四??之?的數(shù)據(jù)湖咨詢和實(shí)施
某?型商業(yè)銀?數(shù)據(jù)中臺咨詢
某銀?基于開源?數(shù)據(jù)技術(shù)棧數(shù)據(jù)中臺的咨詢和實(shí)施
某航空公司數(shù)據(jù)平臺流批?體解決?案和實(shí)施
特長:
在?數(shù)據(jù)架構(gòu)、開發(fā)、運(yùn)維和優(yōu)化、數(shù)據(jù)集成、 數(shù)據(jù)湖(Data Lake)、數(shù)據(jù)建模、數(shù)據(jù)挖掘/機(jī)器學(xué)習(xí)、數(shù)據(jù)
中臺等??有豐富經(jīng) 驗(yàn)。

畢業(yè)于?連理??學(xué) 簡介: 精通開源的?數(shù)據(jù)?態(tài)技術(shù)和架構(gòu),Hadoop、Hive、Hbase、 Spark、Flink等開源技術(shù)棧。 有10年左右基于?數(shù)據(jù)解決?案平臺、數(shù)據(jù)架構(gòu)、數(shù)據(jù)中臺、數(shù)據(jù)治理、數(shù)據(jù)分析和挖掘的?型數(shù)據(jù)湖和數(shù) 據(jù)中臺項(xiàng)?架構(gòu)實(shí)施經(jīng)驗(yàn), ?前任職國內(nèi)知名咨詢公司,先后服務(wù)于北京?學(xué)軟件研究所、阿?巴巴、Teradata,實(shí)施過基于開源?數(shù)據(jù)技術(shù) 棧的數(shù)據(jù)湖解決?案和實(shí)施、湖倉?體架構(gòu)咨詢和實(shí)施、數(shù)據(jù)中臺的咨詢和設(shè)施 最近主要項(xiàng)?介紹: 某移動?數(shù)據(jù)平臺架構(gòu)設(shè)計和設(shè)施 (Hadoop、Spark) 四??之?的數(shù)據(jù)湖咨詢和實(shí)施 某?型商業(yè)銀?數(shù)據(jù)中臺咨詢 某銀?基于開源?數(shù)據(jù)技術(shù)棧數(shù)據(jù)中臺的咨詢和實(shí)施 某航空公司數(shù)據(jù)平臺流批?體解決?案和實(shí)施 特長: 在?數(shù)據(jù)架構(gòu)、開發(fā)、運(yùn)維和優(yōu)化、數(shù)據(jù)集成、 數(shù)據(jù)湖(Data Lake)、數(shù)據(jù)建模、數(shù)據(jù)挖掘/機(jī)器學(xué)習(xí)、數(shù)據(jù) 中臺等??有豐富經(jīng) 驗(yàn)。

課程費(fèi)用

6800.00 /人

課程時長

4

成為教練

課程簡介

1.掌握基于大數(shù)據(jù)平臺核心組件(HDFS、Yarn、Hive、Hbase、Spark和Flink等)的搭建、使用、運(yùn)維
2.掌握大數(shù)據(jù)使用場景和性能優(yōu)化
3.能夠掌握700+節(jié)點(diǎn)集群的運(yùn)維和優(yōu)化
4.掌握大數(shù)據(jù)平臺性能優(yōu)化的思路,同時能夠?qū)park、Flink和Hive組件進(jìn)行性能優(yōu)化
5.能夠?qū)Υ髷?shù)據(jù)平臺組件出現(xiàn)的問題進(jìn)行有條不紊的分析和解決

目標(biāo)收益

培訓(xùn)對象

1.大數(shù)據(jù)開發(fā)工程師
2.大數(shù)據(jù)架構(gòu)師
3.大數(shù)據(jù)運(yùn)維工程師
4.對大數(shù)據(jù)開發(fā)感興趣的一線開發(fā)人員

課程大綱

Day1
大數(shù)據(jù)集群搭建實(shí)戰(zhàn)(1小時)
?Master節(jié)點(diǎn)角色部署實(shí)戰(zhàn)
?Slave節(jié)點(diǎn)角色部署實(shí)戰(zhàn)
?工具節(jié)點(diǎn)角色部署實(shí)戰(zhàn)
?Edge節(jié)點(diǎn)角色部署實(shí)戰(zhàn)
?不同角色節(jié)點(diǎn)配置建議(內(nèi)存、磁盤和CPU)
?不同服務(wù)磁盤使用規(guī)劃實(shí)戰(zhàn)(DN、NN、JN和ZK等)
?小于100節(jié)點(diǎn)大數(shù)據(jù)集群角色部署實(shí)戰(zhàn)
?100-200節(jié)點(diǎn)大數(shù)據(jù)集群角色部署實(shí)戰(zhàn)
?大于300節(jié)點(diǎn)大數(shù)據(jù)集群角色部署實(shí)戰(zhàn)
?Hive服務(wù)HMS和HS2高可用和loadbalance部署實(shí)戰(zhàn)
大數(shù)據(jù)平臺權(quán)限認(rèn)證和授權(quán)解決方案(LDAP+SSSD+Kerberos+Ranger)
Day1
HDFS原理介紹(1小時)
?HDFS架構(gòu)介紹
?HDFS運(yùn)行原理介紹
?NameNode功能詳解
?DataNode功能詳
?HDFS HA功能詳解
?HSFD的fsimage和editslog詳解
?HDFS的block詳解
HDFS的block的備份策略
Day1
HDFS運(yùn)維和優(yōu)化(3小時)
?機(jī)架感知對性能的提升
?HDFS+Ranger權(quán)限控制運(yùn)維
?Small Files and Java Heap Tuning
?HDFS集群通過文件書和block數(shù)來估算NN的內(nèi)存使用和性能瓶頸
?元數(shù)據(jù)FSImage和Edit文件的工作原理和合并機(jī)制解析
?NN RPC processing is too long
?生產(chǎn)環(huán)境NN active 和 Standby切換失敗,導(dǎo)致集群癱瘓
?DN日志出現(xiàn)大量"Slow.*?(took|cost)"問題診斷
?Namenode checkpoint status again
?Disk Slowness問題排查
?Slow LDAP通過日志觀察常見的現(xiàn)象
?HDFS服務(wù)最佳實(shí)踐
— number of DataNodes,
— Amount of data,
— number of blocks & files,
— number of snapshots,
— number of RPCs per second,
Other limits
Day1
Yarn運(yùn)維和優(yōu)化(2小時)
?Yarn架構(gòu)和原理
?ResourceManager工作原理
?NodeManager工作原理
?ApplicationMaster工作原理
?Yarn的資源控制機(jī)制
?Yarn資源封裝Container介紹
?Yarn資源都租戶配置和實(shí)戰(zhàn)
?Yarn replacement rules權(quán)限配置和實(shí)操
?Yarn 隊(duì)列+Ranger控制詳解和實(shí)操
?Yarn Container資源最大最小設(shè)置
?Yarn Queue核心參數(shù)解釋和優(yōu)化,提升資源使用效率
?MapReduce配置參數(shù)設(shè)置和優(yōu)化
?Yarn任務(wù)調(diào)度策略CS和FA深度比較
Yarn核心參數(shù)解釋和優(yōu)化實(shí)戰(zhàn)
Day1
大數(shù)據(jù)集群搭建實(shí)戰(zhàn)(1小時)
?Master節(jié)點(diǎn)角色部署實(shí)戰(zhàn)
?Slave節(jié)點(diǎn)角色部署實(shí)戰(zhàn)
?工具節(jié)點(diǎn)角色部署實(shí)戰(zhàn)
?Edge節(jié)點(diǎn)角色部署實(shí)戰(zhàn)
?不同角色節(jié)點(diǎn)配置建議(內(nèi)存、磁盤和CPU)
?不同服務(wù)磁盤使用規(guī)劃實(shí)戰(zhàn)(DN、NN、JN和ZK等)
?小于100節(jié)點(diǎn)大數(shù)據(jù)集群角色部署實(shí)戰(zhàn)
?100-200節(jié)點(diǎn)大數(shù)據(jù)集群角色部署實(shí)戰(zhàn)
?大于300節(jié)點(diǎn)大數(shù)據(jù)集群角色部署實(shí)戰(zhàn)
?Hive服務(wù)HMS和HS2高可用和loadbalance部署實(shí)戰(zhàn)
大數(shù)據(jù)平臺權(quán)限認(rèn)證和授權(quán)解決方案(LDAP+SSSD+Kerberos+Ranger)
Day1
HDFS原理介紹(1小時)

?HDFS架構(gòu)介紹
?HDFS運(yùn)行原理介紹
?NameNode功能詳解
?DataNode功能詳
?HDFS HA功能詳解
?HSFD的fsimage和editslog詳解
?HDFS的block詳解
HDFS的block的備份策略
Day1
HDFS運(yùn)維和優(yōu)化(3小時)
?機(jī)架感知對性能的提升
?HDFS+Ranger權(quán)限控制運(yùn)維
?Small Files and Java Heap Tuning
?HDFS集群通過文件書和block數(shù)來估算NN的內(nèi)存使用和性能瓶頸
?元數(shù)據(jù)FSImage和Edit文件的工作原理和合并機(jī)制解析
?NN RPC processing is too long
?生產(chǎn)環(huán)境NN active 和 Standby切換失敗,導(dǎo)致集群癱瘓
?DN日志出現(xiàn)大量"Slow.*?(took|cost)"問題診斷
?Namenode checkpoint status again
?Disk Slowness問題排查
?Slow LDAP通過日志觀察常見的現(xiàn)象
?HDFS服務(wù)最佳實(shí)踐
— number of DataNodes,
— Amount of data,
— number of blocks & files,
— number of snapshots,
— number of RPCs per second,
Other limits
Day1
Yarn運(yùn)維和優(yōu)化(2小時)
?Yarn架構(gòu)和原理
?ResourceManager工作原理
?NodeManager工作原理
?ApplicationMaster工作原理
?Yarn的資源控制機(jī)制
?Yarn資源封裝Container介紹
?Yarn資源都租戶配置和實(shí)戰(zhàn)
?Yarn replacement rules權(quán)限配置和實(shí)操
?Yarn 隊(duì)列+Ranger控制詳解和實(shí)操
?Yarn Container資源最大最小設(shè)置
?Yarn Queue核心參數(shù)解釋和優(yōu)化,提升資源使用效率
?MapReduce配置參數(shù)設(shè)置和優(yōu)化
?Yarn任務(wù)調(diào)度策略CS和FA深度比較
Yarn核心參數(shù)解釋和優(yōu)化實(shí)戰(zhàn)

課程費(fèi)用

6800.00 /人

課程時長

4

預(yù)約體驗(yàn)票 我要分享

近期公開課推薦

近期公開課推薦

活動詳情

提交需求