架構(gòu)師
互聯(lián)網(wǎng)
電商
支付平臺
傳統(tǒng)金融
互聯(lián)網(wǎng)金融
可穿戴設(shè)備
醫(yī)療
智能家居
物聯(lián)網(wǎng)
車聯(lián)網(wǎng)
安全
制造
電信
政府機構(gòu)
稅務(wù)
快消品
其他
大數(shù)據(jù)
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

大數(shù)據(jù)建模與分析挖掘應(yīng)用實戰(zhàn)

劉老師

某知名咨詢公司 云平臺系統(tǒng)架構(gòu)師

畢業(yè)于?連理??學(xué)
簡介:
精通開源的?數(shù)據(jù)?態(tài)技術(shù)和架構(gòu),Hadoop、Hive、Hbase、 Spark、Flink等開源技術(shù)棧。
有10年左右基于?數(shù)據(jù)解決?案平臺、數(shù)據(jù)架構(gòu)、數(shù)據(jù)中臺、數(shù)據(jù)治理、數(shù)據(jù)分析和挖掘的?型數(shù)據(jù)湖和數(shù)
據(jù)中臺項?架構(gòu)實施經(jīng)驗,
?前任職國內(nèi)知名咨詢公司,先后服務(wù)于北京?學(xué)軟件研究所、阿?巴巴、Teradata,實施過基于開源?數(shù)據(jù)技術(shù)
棧的數(shù)據(jù)湖解決?案和實施、湖倉?體架構(gòu)咨詢和實施、數(shù)據(jù)中臺的咨詢和設(shè)施
最近主要項?介紹:
某移動?數(shù)據(jù)平臺架構(gòu)設(shè)計和設(shè)施 (Hadoop、Spark)
四??之?的數(shù)據(jù)湖咨詢和實施
某?型商業(yè)銀?數(shù)據(jù)中臺咨詢
某銀?基于開源?數(shù)據(jù)技術(shù)棧數(shù)據(jù)中臺的咨詢和實施
某航空公司數(shù)據(jù)平臺流批?體解決?案和實施
特長:
在?數(shù)據(jù)架構(gòu)、開發(fā)、運維和優(yōu)化、數(shù)據(jù)集成、 數(shù)據(jù)湖(Data Lake)、數(shù)據(jù)建模、數(shù)據(jù)挖掘/機器學(xué)習(xí)、數(shù)據(jù)
中臺等??有豐富經(jīng) 驗。

畢業(yè)于?連理??學(xué) 簡介: 精通開源的?數(shù)據(jù)?態(tài)技術(shù)和架構(gòu),Hadoop、Hive、Hbase、 Spark、Flink等開源技術(shù)棧。 有10年左右基于?數(shù)據(jù)解決?案平臺、數(shù)據(jù)架構(gòu)、數(shù)據(jù)中臺、數(shù)據(jù)治理、數(shù)據(jù)分析和挖掘的?型數(shù)據(jù)湖和數(shù) 據(jù)中臺項?架構(gòu)實施經(jīng)驗, ?前任職國內(nèi)知名咨詢公司,先后服務(wù)于北京?學(xué)軟件研究所、阿?巴巴、Teradata,實施過基于開源?數(shù)據(jù)技術(shù) 棧的數(shù)據(jù)湖解決?案和實施、湖倉?體架構(gòu)咨詢和實施、數(shù)據(jù)中臺的咨詢和設(shè)施 最近主要項?介紹: 某移動?數(shù)據(jù)平臺架構(gòu)設(shè)計和設(shè)施 (Hadoop、Spark) 四??之?的數(shù)據(jù)湖咨詢和實施 某?型商業(yè)銀?數(shù)據(jù)中臺咨詢 某銀?基于開源?數(shù)據(jù)技術(shù)棧數(shù)據(jù)中臺的咨詢和實施 某航空公司數(shù)據(jù)平臺流批?體解決?案和實施 特長: 在?數(shù)據(jù)架構(gòu)、開發(fā)、運維和優(yōu)化、數(shù)據(jù)集成、 數(shù)據(jù)湖(Data Lake)、數(shù)據(jù)建模、數(shù)據(jù)挖掘/機器學(xué)習(xí)、數(shù)據(jù) 中臺等??有豐富經(jīng) 驗。

課程費用

5800.00 /人

課程時長

2

成為教練

課程簡介

大數(shù)據(jù)建模與分析挖掘技術(shù)已經(jīng)逐步地應(yīng)用到新興互聯(lián)網(wǎng)企業(yè)(如電子商務(wù)網(wǎng)站、搜索引擎、社交網(wǎng)站、互聯(lián)網(wǎng)廣告服務(wù)提供商等)、銀行金融證券企業(yè)、電信運營等行業(yè),給這些行業(yè)帶來了一定的數(shù)據(jù)價值增值作用。

目標(biāo)收益

1.本課程讓學(xué)員充分掌握大數(shù)據(jù)平臺技術(shù)架構(gòu)、大數(shù)據(jù)分析的基本理論、大數(shù)據(jù)分析挖掘應(yīng)用實戰(zhàn)技能、國內(nèi)外主流的大數(shù)據(jù)分析與BI商業(yè)智能分析解決方案、以及大數(shù)據(jù)分析在搜索引擎、廣告服務(wù)推薦、電商數(shù)據(jù)分析、金融客戶分析方面的應(yīng)用案例。
2.本課程強調(diào)主流的大數(shù)據(jù)分析挖掘算法技術(shù)的應(yīng)用和分析平臺的實施,讓學(xué)員掌握主流的基于大數(shù)據(jù)Hadoop和Spark、R的大數(shù)據(jù)分析平臺架構(gòu)和實際應(yīng)用,并用結(jié)合實際的生產(chǎn)系統(tǒng)案例進行教學(xué),掌握基于Hadoop大數(shù)據(jù)平臺的數(shù)據(jù)挖掘和數(shù)據(jù)倉庫分布式系統(tǒng)平臺應(yīng)用,以及商業(yè)和開源的數(shù)據(jù)分析產(chǎn)品加上Hadoop平臺形成大數(shù)據(jù)分析平臺的應(yīng)用剖析。

培訓(xùn)對象

課程大綱

數(shù)據(jù)建模概念 ?為什么要數(shù)據(jù)建模
?數(shù)據(jù)建模解決哪些問題
?什么是邏輯數(shù)據(jù)模型
?模型設(shè)計的流程
?邏輯模型設(shè)計
?物理模型設(shè)計
?數(shù)據(jù)建模的工具介紹
基于大數(shù)據(jù)平臺分析和挖掘工具 ?業(yè)界主流的基于Hadoop和Spark的大數(shù)據(jù)分析挖掘項目解決方案
?業(yè)界數(shù)據(jù)倉庫與數(shù)據(jù)分析挖掘平臺軟件工具
?Hadoop數(shù)據(jù)倉庫工具Hive、Tez、Kylin和Presto
?Spark實時數(shù)據(jù)倉庫工具SparkSQL
?Spark機器學(xué)習(xí)與數(shù)據(jù)分析挖掘工具MLlib和SparkR
?大數(shù)據(jù)分析挖掘項目的實施步驟
數(shù)據(jù)集成 ?日志數(shù)據(jù)解析和導(dǎo)入導(dǎo)出到數(shù)據(jù)倉庫的操作訓(xùn)練
?從原始搜索數(shù)據(jù)集中抽取、集成數(shù)據(jù),整理后形成規(guī)范的數(shù)據(jù)倉庫
?數(shù)據(jù)分析挖掘模塊從大型的集中式數(shù)據(jù)倉庫中訪問數(shù)據(jù),一個數(shù)據(jù)倉庫面向一個主題,構(gòu)建兩個數(shù)據(jù)倉庫
?同一個數(shù)據(jù)倉庫中的事實表數(shù)據(jù),可以給多個不同類型的分析挖掘任務(wù)調(diào)用
?去除噪聲
HIVE數(shù)據(jù)倉庫集群的多維分析建模應(yīng)用實踐 ?基于Hadoop的大型分布式數(shù)據(jù)倉庫在行業(yè)中的數(shù)據(jù)倉庫應(yīng)用案例
?Hive數(shù)據(jù)倉庫集群的平臺體系結(jié)構(gòu)、核心技術(shù)剖析
?Hive Server的工作原理、機制與應(yīng)用
?Hive數(shù)據(jù)倉庫集群的安裝部署與配置優(yōu)化
?Hive應(yīng)用開發(fā)技巧
?Hive SQL剖析與應(yīng)用實踐
?Hive數(shù)據(jù)倉庫表與表分區(qū)、表操作、數(shù)據(jù)導(dǎo)入導(dǎo)出、客戶端操作技巧
?Hive數(shù)據(jù)倉庫報表設(shè)計
?將原始的日志數(shù)據(jù)集,經(jīng)過整理后,加載至Hadoop + Hive數(shù)據(jù)倉庫集群中,用于共享訪問
R語言介紹 ?R語言介紹
?R語言常用的分析庫介紹
?R語言開發(fā)環(huán)境介紹
?R分析分析和挖掘案例實戰(zhàn)
?Spark和R的整合
聚類分析建模與挖掘算法的實現(xiàn)原理和技術(shù)應(yīng)用 ?聚類分析建模與算法原理及其在Spark MLlib中的實現(xiàn)與應(yīng)用,包括:
a)Canopy聚類(canopy clustering)
b)K均值算法(K-means clustering)
c)模糊K均值(Fuzzy K-means clustering)
d)EM聚類,即期望最大化聚類(Expectation Maximization)
e)以上算法在Spark MLib中的實現(xiàn)原理和實際場景中的應(yīng)用案例。
?Spark聚類分析算法程序示例
分類分析建模與挖掘算法的實現(xiàn)原理和技術(shù)應(yīng)用 ?分類分析建模與算法原理及其在Spark MLlib中的實現(xiàn)與應(yīng)用, 包括:
a.Spark決策樹算法實現(xiàn)
b.邏輯回歸算法(logistics regression)
c.貝葉斯算法(Bayesian與Cbeyes)
d.支持向量機(Support vector machine)
e.以上算法在Spark MLlib中的實現(xiàn)原理和實際場景中的應(yīng)用案例。
?Spark客戶資料分析與給用戶貼標(biāo)簽的程序示例
?Spark實現(xiàn)給商品貼標(biāo)簽的程序示例
?Spark實現(xiàn)用戶行為的自動標(biāo)簽和深度技術(shù)
推薦分析挖掘模型與算法技術(shù)應(yīng)用 ?推薦算法原理及其在Spark MLlib中的實現(xiàn)與應(yīng)用,包括:
a)Spark協(xié)同過濾算法程序示例
b)Item-based協(xié)同過濾與推薦
c)User-based協(xié)同過濾與推薦
?交叉銷售推薦模型及其實現(xiàn)
回歸分析模型與預(yù)測算法 ?利用線性回歸(多元回歸)實現(xiàn)訪問量預(yù)測
?利用非線性回歸預(yù)測成交量和訪問量的關(guān)系
?基于SparkR實現(xiàn)回歸分析模型及其應(yīng)用操作
?Spark回歸程序?qū)崿F(xiàn)異常點檢測的程序示例
Spark Graphx數(shù)據(jù)挖掘 ?Spark Graphx介紹
?GraphxFrame介紹
?復(fù)雜社交網(wǎng)落分析實戰(zhàn)
?圖分析實戰(zhàn)
數(shù)據(jù)建模概念
?為什么要數(shù)據(jù)建模
?數(shù)據(jù)建模解決哪些問題
?什么是邏輯數(shù)據(jù)模型
?模型設(shè)計的流程
?邏輯模型設(shè)計
?物理模型設(shè)計
?數(shù)據(jù)建模的工具介紹
基于大數(shù)據(jù)平臺分析和挖掘工具
?業(yè)界主流的基于Hadoop和Spark的大數(shù)據(jù)分析挖掘項目解決方案
?業(yè)界數(shù)據(jù)倉庫與數(shù)據(jù)分析挖掘平臺軟件工具
?Hadoop數(shù)據(jù)倉庫工具Hive、Tez、Kylin和Presto
?Spark實時數(shù)據(jù)倉庫工具SparkSQL
?Spark機器學(xué)習(xí)與數(shù)據(jù)分析挖掘工具MLlib和SparkR
?大數(shù)據(jù)分析挖掘項目的實施步驟
數(shù)據(jù)集成
?日志數(shù)據(jù)解析和導(dǎo)入導(dǎo)出到數(shù)據(jù)倉庫的操作訓(xùn)練
?從原始搜索數(shù)據(jù)集中抽取、集成數(shù)據(jù),整理后形成規(guī)范的數(shù)據(jù)倉庫
?數(shù)據(jù)分析挖掘模塊從大型的集中式數(shù)據(jù)倉庫中訪問數(shù)據(jù),一個數(shù)據(jù)倉庫面向一個主題,構(gòu)建兩個數(shù)據(jù)倉庫
?同一個數(shù)據(jù)倉庫中的事實表數(shù)據(jù),可以給多個不同類型的分析挖掘任務(wù)調(diào)用
?去除噪聲
HIVE數(shù)據(jù)倉庫集群的多維分析建模應(yīng)用實踐
?基于Hadoop的大型分布式數(shù)據(jù)倉庫在行業(yè)中的數(shù)據(jù)倉庫應(yīng)用案例
?Hive數(shù)據(jù)倉庫集群的平臺體系結(jié)構(gòu)、核心技術(shù)剖析
?Hive Server的工作原理、機制與應(yīng)用
?Hive數(shù)據(jù)倉庫集群的安裝部署與配置優(yōu)化
?Hive應(yīng)用開發(fā)技巧
?Hive SQL剖析與應(yīng)用實踐
?Hive數(shù)據(jù)倉庫表與表分區(qū)、表操作、數(shù)據(jù)導(dǎo)入導(dǎo)出、客戶端操作技巧
?Hive數(shù)據(jù)倉庫報表設(shè)計
?將原始的日志數(shù)據(jù)集,經(jīng)過整理后,加載至Hadoop + Hive數(shù)據(jù)倉庫集群中,用于共享訪問
R語言介紹
?R語言介紹
?R語言常用的分析庫介紹
?R語言開發(fā)環(huán)境介紹
?R分析分析和挖掘案例實戰(zhàn)
?Spark和R的整合
聚類分析建模與挖掘算法的實現(xiàn)原理和技術(shù)應(yīng)用
?聚類分析建模與算法原理及其在Spark MLlib中的實現(xiàn)與應(yīng)用,包括:
a)Canopy聚類(canopy clustering)
b)K均值算法(K-means clustering)
c)模糊K均值(Fuzzy K-means clustering)
d)EM聚類,即期望最大化聚類(Expectation Maximization)
e)以上算法在Spark MLib中的實現(xiàn)原理和實際場景中的應(yīng)用案例。
?Spark聚類分析算法程序示例
分類分析建模與挖掘算法的實現(xiàn)原理和技術(shù)應(yīng)用
?分類分析建模與算法原理及其在Spark MLlib中的實現(xiàn)與應(yīng)用, 包括:
a.Spark決策樹算法實現(xiàn)
b.邏輯回歸算法(logistics regression)
c.貝葉斯算法(Bayesian與Cbeyes)
d.支持向量機(Support vector machine)
e.以上算法在Spark MLlib中的實現(xiàn)原理和實際場景中的應(yīng)用案例。
?Spark客戶資料分析與給用戶貼標(biāo)簽的程序示例
?Spark實現(xiàn)給商品貼標(biāo)簽的程序示例
?Spark實現(xiàn)用戶行為的自動標(biāo)簽和深度技術(shù)
推薦分析挖掘模型與算法技術(shù)應(yīng)用
?推薦算法原理及其在Spark MLlib中的實現(xiàn)與應(yīng)用,包括:
a)Spark協(xié)同過濾算法程序示例
b)Item-based協(xié)同過濾與推薦
c)User-based協(xié)同過濾與推薦
?交叉銷售推薦模型及其實現(xiàn)
回歸分析模型與預(yù)測算法
?利用線性回歸(多元回歸)實現(xiàn)訪問量預(yù)測
?利用非線性回歸預(yù)測成交量和訪問量的關(guān)系
?基于SparkR實現(xiàn)回歸分析模型及其應(yīng)用操作
?Spark回歸程序?qū)崿F(xiàn)異常點檢測的程序示例
Spark Graphx數(shù)據(jù)挖掘
?Spark Graphx介紹
?GraphxFrame介紹
?復(fù)雜社交網(wǎng)落分析實戰(zhàn)
?圖分析實戰(zhàn)

課程費用

5800.00 /人

課程時長

2

預(yù)約體驗票 我要分享

近期公開課推薦

近期公開課推薦

活動詳情

提交需求