課程價(jià)格分析:
隨著云計(jì)算、大數(shù)據(jù)迅速發(fā)展,亟需用hadoop解決大數(shù)據(jù)量高并發(fā)訪問的瓶頸。谷歌、淘寶、百度、京東等底層都應(yīng)用hadoop。越來越多的企 業(yè)急需引入hadoop技術(shù)人才。由于掌握Hadoop技術(shù)的開發(fā)人員并不多,直接導(dǎo)致了這幾年hadoop技術(shù)的薪水遠(yuǎn)高于JavaEE及 Android程序員。
Hadoop入門薪資已經(jīng)達(dá)到了 8K 以上,工作1年可達(dá)到 1.2W 以上,具有2-3年工作經(jīng)驗(yàn)的hadoop人才年薪可以達(dá)到 30萬—50萬 。
一般需要大數(shù)據(jù)處理的公司基本上都是大公司,所以學(xué)習(xí)hadoop技術(shù)也是進(jìn)大公司的捷徑!
本課程講師擁有多年Greenplum和Hadoop實(shí)戰(zhàn)經(jīng)驗(yàn),課程注重實(shí)踐,原理剖析,實(shí)踐分享,讓學(xué)員能快速全面地掌握Greenplum操作和調(diào)優(yōu),以及Hadoop的搭建與運(yùn)用實(shí)戰(zhàn)。
課程實(shí)戰(zhàn)、實(shí)用、實(shí)際,總共 96 課時(shí),系史上最全最深入的講解Greenplum、Hadoop、云計(jì)算相關(guān)領(lǐng)域的技能課程,北風(fēng)僅以此課程獻(xiàn)給有志于從事大數(shù)據(jù)行業(yè),追求高薪的有想法的程序員。
課程亮點(diǎn)多多:
亮點(diǎn)一、技術(shù)混搭
Greenplum+Hadoop,讓你全面掌握玩轉(zhuǎn)大數(shù)據(jù)的倚天劍和屠龍刀,讓你學(xué)到不一樣的精彩,成為不一樣的復(fù)合型人才!
亮點(diǎn)二、高成低也就
亮點(diǎn)三、既注重技術(shù)基礎(chǔ),手把手傳授技術(shù),通過實(shí)操實(shí)戰(zhàn)的講授過程讓學(xué)員沉淀技術(shù),打好牢固堅(jiān)實(shí)的基礎(chǔ);另外,也不 忘從行業(yè)、架構(gòu)的高度,幫助大家擴(kuò)寬視野,游刃有余。
亮點(diǎn)四、注重實(shí)踐:原理剖析,實(shí)踐分享;讓學(xué)員能快速全面地掌握Greenplum操作和調(diào)優(yōu),以及Hadoop的搭建與運(yùn)用實(shí)戰(zhàn)。實(shí)戰(zhàn)、實(shí)用、實(shí)際
亮點(diǎn)五、 全面覆蓋了Greenplum完整知識(shí)體系,及關(guān)系型數(shù)據(jù)庫管理和調(diào)優(yōu)思想;
亮點(diǎn)六、課程涵蓋Hadoop生態(tài)系統(tǒng)中所有常用組件;
亮點(diǎn)七、 學(xué)完此課程可以獲得IT行業(yè)高薪職業(yè)發(fā)展能力。
你 了 解 大 數(shù) 據(jù) 嗎 ?
“大數(shù)據(jù)”時(shí)代來臨您準(zhǔn)備好了么? 從十大技術(shù)和十大巨頭了解大數(shù)據(jù) Greenplum轉(zhuǎn)身:Hadoop是數(shù)據(jù)庫的未來
?
?
GREENPLUM適用場(chǎng)景:Greenplum的架構(gòu)采用了MPP(大規(guī)模并行處理)。在 MPP 系統(tǒng)中,每個(gè) SMP 節(jié)點(diǎn)也可以運(yùn)行自己的操作系統(tǒng)、數(shù)據(jù)庫等,它的特點(diǎn)主要就是查詢速度快,數(shù)據(jù)裝載速度快,批量DML處理快。而且性能可以隨著硬件的添加,呈線性增加,擁有非常良好的可擴(kuò)展性。因此,它主要適用于面向分析的應(yīng)用。比如構(gòu)建企業(yè)級(jí)ODS/EDW,或者數(shù)據(jù)集市等等。
GREENPLUM的前景:GREENPLUM 誕生于2003年硅谷,2010/07 EMC收購了GREENPLUM,并把GREENPLUM作為EMC面向分析云的戰(zhàn)略核心產(chǎn)品,加以大力發(fā)展。該產(chǎn)品不僅在國際市場(chǎng)發(fā)展很快,在國內(nèi)市場(chǎng)發(fā)展也很快。最著名的案例就是阿里巴巴集團(tuán),經(jīng)過多種產(chǎn)品的精心選型,最終選擇GREENPLUM作為它們的數(shù)據(jù)倉庫平臺(tái)存放數(shù)百TB的業(yè)務(wù)數(shù)據(jù)去高效支持各種分析應(yīng)用。正是由于產(chǎn)品發(fā)展速度很快,但是在相關(guān)人才上存在很大缺口。
Greenplum Hadoop大數(shù)據(jù)分析平臺(tái):大量的半結(jié)構(gòu)化和非結(jié)構(gòu)化信息無法管理和存儲(chǔ),大數(shù)據(jù)增長(zhǎng)速度驚人,每年以幾何級(jí)數(shù)速度增長(zhǎng),需要有專業(yè)化的解決方案應(yīng)對(duì)大數(shù)據(jù)挑戰(zhàn)。EMC收購了Greenplum之后,推出的針對(duì)Hadoop的Greenplum的數(shù)據(jù)庫軟件。采用Greenplum HD技術(shù)管理半結(jié)構(gòu)化和非結(jié)構(gòu)化信息,整體TCO更低,除了進(jìn)行有效存儲(chǔ)和管理,可以通過MapReduce技術(shù)進(jìn)行并行的分析和挖掘,把大量的數(shù)據(jù)存儲(chǔ)變成有價(jià)值的數(shù)據(jù)資產(chǎn)。
課程內(nèi)容簡(jiǎn)介:本課程分兩大部分:第一部分全面深入地介紹了Greenplum數(shù)據(jù)庫,包括架構(gòu)特性、部署、管理、開發(fā)和調(diào)優(yōu)等,由淺入深,理論結(jié)合實(shí)戰(zhàn),讓同學(xué)全面徹底掌握這把大數(shù)據(jù)利劍。第二部分深入闡述了Hadoop的架構(gòu)原理,Hadoop整體技術(shù)架構(gòu),包括HBase、Hive、Pig、ZooKeeper、Chukwa等實(shí)戰(zhàn)運(yùn)用。另外還介紹了云計(jì)算的基礎(chǔ)知識(shí)和Hadoop在云計(jì)算領(lǐng)域的運(yùn)用,以及剖析了Hadoop在各個(gè)互聯(lián)網(wǎng)巨頭商業(yè)環(huán)境的運(yùn)用。
本課程適合于有一定java基礎(chǔ)知識(shí),對(duì)數(shù)據(jù)庫和sql語句有一定了解,熟練使用linux系統(tǒng)的技術(shù)人員,特別適合于想換工作或?qū)で蟾咝铰殬I(yè)的人士。課程結(jié)束時(shí),幫助學(xué)員實(shí)現(xiàn)如下目標(biāo):1、了解Greenplum和Hadoop的歷史及目前發(fā)展的現(xiàn)狀、以及它們的技術(shù)特點(diǎn),從而把握分布式計(jì)算框架及未來發(fā)展方向,在大數(shù)據(jù)時(shí)代能為企業(yè)的技術(shù)選型及架構(gòu)設(shè)計(jì)提供決策參考。2、深入理解Greenplum的技術(shù)核心和管理操作,以此為基礎(chǔ),進(jìn)而掌握MPP架構(gòu)數(shù)據(jù)庫的使用和調(diào)優(yōu)的思想。3、全面掌握Hadoop的架構(gòu)原理和使用場(chǎng)景,并通過貫穿課程的項(xiàng)目進(jìn)行實(shí)戰(zhàn)鍛煉,從而熟練使用Hadoop進(jìn)行MapReduce程序開發(fā)。4、深入理解Hadoop整體技術(shù)架構(gòu),包括HBase、Hive、Pig、ZooKeeper、Chukwa等,對(duì)Hadoop運(yùn)作機(jī)制有清晰全面的認(rèn)識(shí),可以獨(dú)立規(guī)劃及部署生產(chǎn)環(huán)境的Hadoop集群,掌握Hadoop基本運(yùn)維思路和方法,對(duì)Hadoop集群進(jìn)行管理和優(yōu)化。5、理解什么是云計(jì)算和Hadoop在云計(jì)算領(lǐng)域的運(yùn)用,以及理解Hadoop在各個(gè)互聯(lián)網(wǎng)巨頭商業(yè)環(huán)境的運(yùn)用。
第一部分 Greenplum 分布式數(shù)據(jù)庫基礎(chǔ)(41課時(shí))1 Greenplum架構(gòu)什么是GreenplumGreenplum體系結(jié)構(gòu)Greenplum高可用性架構(gòu)2 安裝Greenplum配置環(huán)境安裝并初始化GPDB系統(tǒng)啟停數(shù)據(jù)庫配置GP系統(tǒng)3 分布式數(shù)據(jù)庫存儲(chǔ)數(shù)據(jù)是如何存儲(chǔ)的分布策略4 GBDB查詢處理查詢命令的執(zhí)行SQL查詢處理機(jī)制并行查詢計(jì)劃5 角色權(quán)限及客戶端認(rèn)證管理客戶端認(rèn)證管理用戶和組6 客戶端接口和程序pgAdmin IIIPSQL7 定義數(shù)據(jù)庫對(duì)象創(chuàng)建并管理數(shù)據(jù)庫創(chuàng)建并管理表空間創(chuàng)建并管理模式創(chuàng)建并管理表分區(qū)表數(shù)據(jù)分布與分區(qū)壓縮存儲(chǔ)與行列存儲(chǔ)序列、索引與視圖8 管理數(shù)據(jù)插入、更新、刪除記錄事務(wù)管理空間回收和統(tǒng)計(jì)9 查詢數(shù)據(jù)定義查詢使用函數(shù)和運(yùn)算符查詢分析10 工作負(fù)載及資源管理GP工作負(fù)載管理概述配置工作負(fù)載管理創(chuàng)建資源隊(duì)列分配資源隊(duì)列檢查資源隊(duì)列狀態(tài)11 裝載和卸載數(shù)據(jù)GP裝載命令概述裝載數(shù)據(jù)到GP從GP卸載數(shù)據(jù)格式化數(shù)據(jù)文件12 備份恢復(fù)串行備份和恢復(fù)并行恢復(fù)和恢復(fù)13 性能調(diào)優(yōu)如何進(jìn)行調(diào)優(yōu)常見的性能問題14 GP系統(tǒng)配置參數(shù)關(guān)于GP的Master參數(shù)與本地化參數(shù)設(shè)置配置參數(shù)配置參數(shù)種類15 開啟高可用性GP高可用概述開啟GP的Mirror獲知Segment何時(shí)失敗恢復(fù)失敗的Segment恢復(fù)失敗的Master16 GP MapReduceMapReduce基礎(chǔ)GP MapReduce編程MapReduce作業(yè)執(zhí)行和故障診斷第二部分 Hadoop分布式平臺(tái)(55課時(shí))1 Hadoop的起源和體系Hadoop思想起源:GoogleHadoop子項(xiàng)目家族Hadoop的架構(gòu)2 Hadoop的安裝與配置準(zhǔn)備和配置環(huán)境三種運(yùn)行模式完全分布式模式安裝3 HDFS-大數(shù)據(jù)存儲(chǔ)HDFS概念與體系結(jié)構(gòu)HDFS的可靠性HDFS文件操作HDFS API4 關(guān)于MapReduceMapReduce編程模型MapReduce的集群行為MapReduce任務(wù)的優(yōu)化MapReduce工作機(jī)制錯(cuò)誤處理及作業(yè)調(diào)度機(jī)制5 MapReduce應(yīng)用開發(fā)Hadoop Eclipse插件開發(fā)數(shù)據(jù)篩選程序開發(fā)倒排索引程序開發(fā)6 Hadoop監(jiān)控與管理頁面監(jiān)控hadoop備份7 HBase數(shù)據(jù)庫Hbase體系結(jié)構(gòu)HBase shellHBase API應(yīng)用實(shí)例HBase場(chǎng)景應(yīng)用HBase模式設(shè)計(jì)8 Hive數(shù)據(jù)倉庫Hive組件與體系架構(gòu)Hive安裝配置Hive的服務(wù)接口HiveQL常用操作Hive的優(yōu)化Hive UDF編程Hive綜合實(shí)戰(zhàn)9 Pig數(shù)據(jù)分析平臺(tái)Pig框架Pig安裝配置Pig的使用Pig的數(shù)據(jù)模型常用Pig Latin操作Pig UDF編程Pig數(shù)據(jù)分析實(shí)戰(zhàn)10 ZooKeeper分布式服務(wù)框架ZooKeeper工作原理ZooKeeper設(shè)計(jì)目標(biāo)ZooKeeper的數(shù)據(jù)結(jié)構(gòu)和組成ZooKeeper的安裝配置ZooKeeper命令行工具ZooKeeper APIZooKeeper實(shí)戰(zhàn):Hadoop任務(wù)調(diào)度11 Chukwa集群監(jiān)控系統(tǒng)Chukwa的組成Chukwa架構(gòu)和設(shè)計(jì)Chukwa安裝與配置常用Chukwa命令實(shí)現(xiàn)自定義數(shù)據(jù)處理12 Hadoop商業(yè)應(yīng)用案例云計(jì)算概念和特征云計(jì)算服務(wù)模式和形態(tài)Hadoop在云計(jì)算的運(yùn)用京東商城百度阿里巴巴騰訊13 Greenplum Hadoop集群集成架構(gòu)的特征集成架構(gòu)的優(yōu)勢(shì)配置gphdfs協(xié)議使用環(huán)境使用HDFS外部表課程總目錄:
以下職位在向你招手:
1. Greenplum數(shù)據(jù)倉庫工程師
2. Hadoop運(yùn)維工程師
3.大數(shù)據(jù)平臺(tái)架構(gòu)師
并可有機(jī)會(huì)向以下高薪職位發(fā)出挑戰(zhàn)
一、Q:學(xué)這個(gè)課程需要什么基礎(chǔ)?
A、講師回答本課程適合于有一定java基礎(chǔ)知識(shí),對(duì)數(shù)據(jù)庫和sql語句有一定了解,熟練使用linux系統(tǒng)的技術(shù)人員,特別適合于想換工作或?qū)で蟾咝铰殬I(yè)的人士
二、Q:講師水平如何?值得信賴嗎?
A:講師迪倫,10年以上IT行業(yè)從業(yè)經(jīng)驗(yàn),某知名500強(qiáng)企業(yè)大數(shù)據(jù)平臺(tái)架構(gòu)師,資深大數(shù)據(jù)處理專家。熟練掌握和應(yīng)用多種技術(shù)架構(gòu)和數(shù)據(jù)庫,包括UNIX,Greenplum、Hadoop、Oracle、Cognos等,以及熟悉數(shù)據(jù)倉庫、ETL、報(bào)表、數(shù)據(jù)分析等領(lǐng)域的技術(shù)運(yùn)用。
三、Q:我該怎么學(xué),如何才能學(xué)好這門課程,給些建議 ?
A: 講師回答:
1.時(shí)間上的安排建議
本課程96講,建議每天以2-3課程的進(jìn)度進(jìn)行學(xué)習(xí),并在課后盡量獨(dú)立完成課堂所講的實(shí)例。
2.學(xué)習(xí)要求
不要只是做一名忠實(shí)的聽眾,請(qǐng)跟隨我一起搭環(huán)境、做實(shí)驗(yàn)。遇到問題多想多問多嘗試,享受解決問題的快感吧!
3.講師建議
a. 如果沒有學(xué)習(xí)基礎(chǔ),建議先補(bǔ)充一點(diǎn)Linux、Java基礎(chǔ),會(huì)更加得心應(yīng)手;
b. 活學(xué)活用,舉一反三。只有在熟練掌握各種技術(shù)在各種情況下的應(yīng)用之后,才能掌握實(shí)現(xiàn)一個(gè)業(yè)務(wù)需求的最佳路徑和最優(yōu)方案;
c. 學(xué)海無涯苦作舟,堅(jiān)持最重要,讓現(xiàn)在的努力成就你不后悔的將來吧!
四、Q:課程涉及到哪些技術(shù),版本是多少?
A:課程涉及到以下技術(shù),目前基本都是最新版本:
1. Linux RedHat 版本是5.2
2. Ant 版本是1.8
3 Java 版本是 JDK1.6
4.Mysql 版本是5.6.16
5.Greenplum 版本是4.2
6.Hadoop 版本是1.2.1
7.Hbase 版本是0.94.16
8.Hive 版本是0.11
9.Pig 版本是0.12
10.ZooKeeper 版本是3.4.5
11.Chukwa 版本是0.4
![]()