微信号:

微信扫码咨询互动吧微信客服

周一至周五 9:00-18:00

AI创建方案
发布活动
修改本活动
广州互动吧 互动吧 广州互联网 互动吧 广州人工智能 互动吧 2019年3月大数据平台搭建与高性能计算**实战培训班
该活动访问人数过多,因主办方未实名认证,应相关要求,{{visitLimitDateShow}}后对该页面限流。请联系主办方进行认证,即可解锁访问限制。
尊敬的商家, 您的活动访问人数已达警戒线, 因您未实名认证,应相关要求,{{visitLimitDateShow}}后将停止访问该页面。为不影响召集报名,请您进行认证,即可解锁访问限制。 立即认证>>
活动《2019年3月大数据平台搭建与高性能计算**实战培训班》访问人数已经达到警戒线,因主办方未实名认证,应相关要求,已经限流,停止访问该页面。
请联系主办方进行认证,即可解锁访问限制。
尊敬的商家, 您的活动《2019年3月大数据平台搭建与高性能计算**实战培训班》访问人数已达警戒线,因您未实名认证, 应相关要求已限流,停止访问该页面。
为了不影响召集报名,请您进行认证,即可解锁访问限制。
立即认证>>
互动吧-2019年3月大数据平台搭建与高性能计算**实战培训班

2019年3月大数据平台搭建与高性能计算**实战培训班

{{shopName|html}}

该主办方未认证,请注意风险防范!

该主办方已完成互动吧个人认证 企业认证 组织认证
真实姓名
{{authName}}
证件号码
{{authCode}}
认证时间
{{authTime}}完成认证,每年互动吧都会对其资料进行审核
互动吧认证申明
个人认证是互动吧对主办方帐号背后运营主体真实身份的认证,不代表互动吧对主办方所使用名称、介绍及真实营业情况的认证。
企业全称
{{authName}}
统一社会信用代码/工商执照注册号
{{authCode}}
认证时间
{{authTime}}完成认证,每年互动吧都会对其资料进行审核
互动吧认证申明
企业认证是互动吧对主办方帐号背后运营主体真实身份的认证,不代表互动吧对主办方所使用名称、介绍及真实营业情况的认证。
组织机构名称
{{authName}}
统一社会信用代码/组织机构代码
{{authCode}}
认证时间
{{authTime}}完成认证,每年互动吧都会对其资料进行审核
互动吧认证申明
组织认证是互动吧对主办方帐号背后运营主体真实身份的认证,不代表互动吧对主办方所使用名称、介绍及真实营业情况的认证。
我也要认证 >
{{info_hits}} {{info_share}} {{favorite_count}}
展开
收起
时间

{{list.startDate}} ~ {{list.overDate}}

{{list.overDate}}结束

{{list.startDate}}开始

更多场次
{{list.name}}

该活动{{partyStateMark}}

关注主办方,不错过主办方任何一个活动。

活动嘉宾({{guestCount}}) 查看全部嘉宾
{{list.guestName}}
“{{list.guestDesc}}”
“很期待您的参与”
{{tag}} 无标签内容

该主办方未认证,请注意风险防范!

该主办方已完成
互动吧个人认证企业认证组织认证
真实姓名
{{authName}}
证件号码
{{authCode}}
认证时间
{{authTime}}完成认证,每年互动吧都会对其资料进行审核
互动吧认证申明
个人认证是互动吧对主办方帐号背后运营主体真实身份的认证,不代表互动吧对主办方所使用名称、介绍及真实营业情况的认证。
企业全称
{{authName}}
统一社会信用代码/工商执照注册号
{{authCode}}
认证时间
{{authTime}}完成认证,每年互动吧都会对其资料进行审核
互动吧认证申明
企业认证是互动吧对主办方帐号背后运营主体真实身份的认证,不代表互动吧对主办方所使用名称、介绍及真实营业情况的认证。
组织机构名称
{{authName}}
统一社会信用代码/组织机构代码
{{authCode}}
认证时间
{{authTime}}完成认证,每年互动吧都会对其资料进行审核
互动吧认证申明
组织认证是互动吧对主办方帐号背后运营主体真实身份的认证,不代表互动吧对主办方所使用名称、介绍及真实营业情况的认证。
我也要认证 >

{{pub_count}}

活动

{{fansCount}}

粉丝

{{shopDesc|html}}进店 >

Ta组织活动太忙,还没腾出空写简介进店 >

关于举办大数据平台搭建与高性能计算最佳实战

培训班的通知

培训地点

珠海

武汉

烟台

郑州

贵阳

培训时间

326-29

5

17-20

7月

23-26

9月

17-20

11

15-18

 

本课程全国常年开班,如部分地区课程已结束,请致电:18911709446(微信同步)QQ:546462637咨询最新培训信息!也可点击课程点播在线视频学习!此课程也可以供企业做内训,欢迎咨询!

一、 培训收益

通过此次课程培训,可使学习者获得如下收益:

1.深刻理解在“互联网+”时代下大数据的产生背景、发展历程和演化趋势;

2.了解业界市场需求和国内外最新的大数据技术潮流,洞察大数据的潜在价值;

3.理解大数据项目解决方案及业界大数据应用案例,从而为企业在大数据项目中的技术选型及技术架构设计提供决策参考;

4.掌握业界最流行的Hadoop与Spark大数据技术体系;

5.掌握大数据采集技术;

6.掌握大数据分布式存储技术;

7.掌握NoSQL与NewSQL分布式数据库技术;

8.掌握大数据仓库与统计机器学习技术;

9.掌握大数据分析挖掘与商业智能(BI)技术;

10.掌握大数据离线处理技术;

11.掌握Storm流式大数据处理技术;

12.掌握基于内存计算的大数据实时处理技术;

13.掌握大数据管理技术的原理知识和应用实战;

14.深入理解大数据平台技术架构和使用场景;

15.娴熟运用Hadoop与Spark大数据技术体系规划解决方案满足实际项目需求;

16.熟练地掌握基于Hadoop与Spark大数据平台进行应用程序开发、集群运维管理和性能调优技巧。

二、 培训特色

1.课程培训业界最流行、应用最广泛的Hadoop与Spark大数据技术体系。强化大数据平台的分布式集群架构和核心关键技术实现、大数据应用项目开发和大数据集群运维实践、以及Hadoop与Spark大数据项目应用开发与调优的全过程沙盘模拟实战。

2.通过一个完整的大数据开发项目及一组实际项目训练案例,完全覆盖Hadoop与Spark生态系统平台的应用开发与运维实践。课堂实践项目以项目小组的形式进行沙盘实操练习,重点强化理解Hadoop与Spark大数据项目各个阶段的工作重点,同时掌握作为大数据项目管理者的基本技术与业务素养。

3.本课程的授课师资都是有着多年在一线从事Hadoop与Spark大数据项目的资深讲师,采用原理技术剖析和实战案例相结合的方式开展互动教学、强化以建立大数据项目解决方案为主体的应用开发、技术讨论与交流咨询,在学习的同时促进讲师学员之间的交流,让每个学员都能在课程培训过程中学到实实在在的大数据技术知识体系,以及大数据技术应用实战技能,具备实际大数据应用项目的动手开发实践与运维管理部署能力。授课过程中,根据学员需求,增设交流环节,可将具体工作中遇到的实际问题展开讨论,讲师会根据学员的实际情况微调授课内容,由讲师带着全部学员积极讨论,并给出一定的时间让学员上台发言,现场剖析问题的症结,规划出可行的解决方案。

三、 日程安排

日程

培训模块

培训内容

第一天

上午

大数据技术基础

1. 大数据的产生背景与发展历程

2. 大数据的4V特征,以及与云计算的关系

3. 大数据应用需求以及潜在价值分析

4. 业界最新的大数据技术发展态势与应用趋势

5. 大数据思维的转变

6. 大数据项目的系统与技术选型,及落地实施的挑战

7. “互联网+”时代下的电子商务、制造业、交通行业、电信运营商、银行金融业、电子政务、移动互联网、教育信息化等行业应用实践与应用案例介绍

业界主流的大数据技术方案

1. 大数据软硬件系统全栈与关键技术介绍

2. 大数据生态系统全景图

3. 主流的大数据解决方案介绍

4. Apache大数据平台方案剖析

5. CDH大数据平台方案剖析

6. HDP大数据平台方案剖析

7. 基于云的大数据平台方案剖析

8. 大数据解决方案与传统数据库方案比较

9. 国内外大数据平台方案与厂商对比

大数据计算模型(一)——批处理MapReduce

1. MapReduce产生背景与适用场景

2. MapReduce计算模型的基本原理

3. MapReduce作业执行流程

4. MapReduce编程模型: Map处理和Reduce处理

5. MapReduce处理流程:数据读取collect、中间数据sort、中间数据spill、中间数据shuffle、聚合分析reduce

6. MapReduce开发高级应用:Combiner技术与应用场景、Partitioner技术与应用场景、多Reducers应用

7. MapReduce开发与应用实战:Hadoop平台搭建与运行;MapReduce安装与部署;

8. 应用案例:基于HDFS+MapReduce集成的服务器日志分析采集、存储与分析MapReduce程序实例开发与运行

9. MapReduce参数调优与性能优化技巧

第一天

下午

大数据存储系统与应用实践

1. 分布式文件系统HDFS产生背景与适用场景

2. HDFS master-slave系统架构与读写工作原理

3. HDFS核心组件技术讲解,NameNode与fsimage、editslog,DataNode与数据块

4. HDFS Federation机制,viewfs机制,使用场景讲解

5. HDFS高可用保证机制,SecondaryNameNode,NFS冷备份,基于zookeeper的HA方案

6. HDFS参数调优与性能优化

大数据实战练习一

1. Hadoop平台搭建、部署与应用实践,包含HDFS分布式文件系统,YARN资源管理软件,MapReduce计算框架软件

2. HDFS 文件、目录创建、上传、下载等命令操作,HDFS合并、归档操作,HDFS监控平台使用

3. MapReduce程序在YARN上运行,YARN监控平台使用

第二天

上午

Hadoop框架与生态发展,以及应用实践操作

1. Hadoop的发展历程

2. Hadoop 1.0的核心组件JobTracker,TaskTracker,以及适用范围

3. Hadoop 2.0的核心组件YARN工作原理,以及与Hadoop 1.0的联系与区别

4. Hadoop关键机制:任务推测执行,任务容错,任务选择执行,心跳机制

5. Hadoop YARN的资源管理与作业调度机制:FIFO调度,Capacity调度器,Fair调度器

6. Hadoop 常用参数调优与性能优化技术

大数据计算模型(二)——实时处理/内存计算 Spark

 

1. MapReduce计算模型的瓶颈

2. Spark产生动机、基本概念与适用场景

3. Spark编程模型与RDD弹性分布式数据集的工作原理与机制

4. Spark实时处理平台运行架构与核心组件

5. Spark RDD主要Transformation:map, flatMap, filter, union, sample, join, reduceByKey, groupByKey

6. Spark RDD主要action:count,collect,reduce,saveAsTextFile

7. Spark宽、窄依赖关系与DAG图分析

8. Spark容错机制

9. Spark作业调度机制

10. Spark缓存机制:Cache操作,Persist操作与存储级别

11. Spark作业执行机制:执行DAG图、任务集、executor执行模型、 BlockManager管理

12. Spark standardalone,Spark on YARN运行模式

13. Scala开发介绍与Spark常用Transformation函数介绍

14. Spark调优:序列化机制、RDD复用、Broadcast机制、高性能算子、资源参数调优

第二天

下午

大数据仓库查询技术HiveSparkSQLImpala,以及应用实践

1. 基于MapReduce的大型分布式数据仓库Hive基础知识与应用场景

2. Hive数据仓库的平台架构与核心技术剖析

3. Hive metastore的工作机制与应用

4. Hive内部表和外部表

5. Hive 分区、分桶机制

6. Hive行、列存储格式

7. 基于Spark的大型分布式数据仓库SparkSQL基础知识与应用场景

8. Spark SQL实时数据仓库的实现原理与工作机制

9. SparkSQL数据模型DataFrame

10. SparkSQL程序开发与

11. SparkSQL数据读取与结果保存:json,Hive table,Parquet file,RDD

12. SparkSQL和Hive的区别与联系

13. SparkSQL操作实战

14. 基于MPP的大型分布式数据仓库Impala基础知识与应用场景

15. Impala实时查询系统平台架构、关键技术介绍,以及与Hive,SparkSQL的对比

Hadoop集群运维监控工具

1. Hadoop运维管理监控系统Ambari工具介绍

2. 第三方运维系统与工具Ganglia, Nagios

大数据实战练习二

1. 基于 Hadoop平台搭建、部署与配置Spark集群,Spark shell环境实践操作,Spark案例程序分析

2. 基于sbt的Spark程序编译、开发与提交运行

3. 应用案例一:基于Spark的服务器运行日志TopN分析、程序实例开发

4. 应用案例二: 基于Spark的搜索引擎日志热词与用户分析、程序实例开发

5. 基于MapReduce的Hive数据仓库实践,Hive集群安装部署,基于文件的Hive数据仓库表导入导出与分区操作,Hive SQL操作,Hive客户端操作

6. SparkSQL shell实践操作:数据表读取、查询与结果保存

第三天

上午

大数据计算模型(三)——流处理Storm, SparkStreaming

 

1. 流数据处理应用场景与流数据处理的特点

2. 流数据处理工具Storm的平台架构与集群工作原理

3. Storm关键技术与并发机制

4. Storm编程模型与基本开发模式

5. Storm数据流分组

6. Storm可靠性保证与Acker机制

7. Storm应用案例分析

8. 流数据处理工具Spark Streaming基本概念与数据模型

9. SparkStreaming工作机制

10. SparkStreaming程序开发介绍

11. SparkStreaming的全局统计和窗口函数

12. Storm与SparkStreaming的对比

13. SparkStreaming开发案例:基于文件流的SparkStreaming程序开发;基于socket消息的SparkStreaming程序开发

大数据与机器学习技术

1. 机器学习发展历程

2. 机器学习与大数据关联与区别

3. 数据挖掘经典算法

4. 预测算法:线性回归与应用场景,非线性回归与应用场景

5. 分类算法:逻辑回归与应用场景,决策树与应用场景,朴素贝叶斯算法与应用场景,支持向量机算法与应用场景

6. 聚类算法; k-means与应用场景

7. 基于Hadoop的大数据机器学习技术

8. 基于MapReduce的机器学习库Mahout

9. Mahout支持的数据挖掘算法

10. Mahout编程模型与发

11. 基于Spark的机器学习库Spark MLlib

12. Spark MLlib支持的数据挖掘算法

13. Spark MLlib编程模型与开发:基于Spark MLlib的文本分类,基于Spark MLlib的聚类

第三天

下午

大数据ETL操作工具,与大数据分布式采集系统

1. HadoopDBMS之间数据交互工具的应用

2. Sqoop导入导出数据的工作原理

3. Flume-NG数据采集系统的数据流模型与系统架构

4. Kafka分布式消息订阅系统的应用介绍与平台架构,及其使用模式

面向OLTP型应用的NoSQL数据库及应用实践

1. 关系型数据库瓶颈,以及NoSQL数据库的发展,概念,分类,及其在半结构化和非结构化数据场景下的适用范围

2. 列存储NoSQL数据库HBase简介与数据模型剖析

3. HBase分布式集群系统架构与读写机制,ZooKeeper分布式协调服务系统的工作原理与应用

4. HBase表设计模式与primary key设计规范

5. 文档NoSQL数据库MongoDB简介与数据模型剖析

6. MongoDB集群模式、读写机制与常用API操作

8.键值型NoSQL数据库Redis简介与数据模型剖析

9.Redis多实例集群架构与关键技术

10.NewSQL数据库技术简介及其适用场景

大数据实战练习三

1.Sqoop安装、部署与配置,基于Sqoop、MySQL与Hive操作MySQL数据库与Hive数据仓库数据导入导出

2.Kafka安装、部署与配置,基于Kafka创建和消费topic实践操作

3.Flume+HDFS+MapReduce/Spark大数据采集、存储与分析实践操作

大数据项目选型、实施、优化等问题交流讨论

大数据项目的需求分析、应用实施、系统优化,以及解决方案等咨询与交流讨论

第四天

学习考核与业内经验交流

四、 授课专家

蒋老师  清华大学博士,云计算专家 熟悉主流的云计算平台,并有商业与开源云计算平台的实践经验,对云计算关键技术有深刻了解和实践经验,如分布式系统、虚拟化、分布式文件系统、云存储等,参与并领导多个大型云计算项目。对大数据关键技术有深刻了解和实践经验,如NoSQL数据库、大数据处理、Hadoop、Hive、HBase、Spark等。

赵老师  清华大学计算机双学士,甲骨文(中国)软件系统有限公司高级技术顾问,大数据、数据库、中间件技术和Java专家。15年IT行业从业经历,10年培训授课经验。具有丰富的大数据方法论、数据科学、大数据生态圈技术知识和大数据规划建设、应用实施和客户培训经验。

张老师  天津大学软件工程硕士,10多年的IT领域相关技术研究和项目开发工作,在长期软件领域工作过程中,对软件企业运作模式有深入研究,熟悉软件质量保障标准ISO9003和软件过程改进模型CMM/CMMI,在具体项目实施过程中总结经验,有深刻认识。通晓多种软件设计和开发工具。对软件开发整个流程非常熟悉,能根据项目特点定制具体软件过程,并进行项目管理和监控,有很强的软件项目组织管理能力。对C/C++ 、HTML 5、pythonHadoop、java、java EE、android、IOS、大数据、云计算有比较深入的理解和应用,具有较强的移动互联网应用需求分析和系统设计能力,熟悉Android框架、IOS框架等技术,了解各种设计模式,能在具体项目中灵活运用。

五、 培训费用

培训费5800/人(含培训费、场地费、资料费、学习期间午餐),食宿可统一安排,费用自理。请学员带身份证复印件一张。

本课程由中国信息化培训中心颁发《大数据平台搭建与高性能计算高级工程师》证书,证书查询网址:www.zpedu.org; 证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。


分享到:

二维码

扫一扫,分享给好友

二维码

扫一扫,分享至朋友圈

微信扫一扫,分享小程序

声明:活动内容与服务由主办方自行提供,互动吧仅提供技术支持,请用户仔细阅读活动规则,以便保护自身的合法权益;互动吧不拥有活动的所有权及相关知识产权,亦不承担法律责任。如果您发现有涉嫌侵权的内容,请发邮件至hudongba@jootun.com,一经查实,将立刻删除涉嫌侵权内容。
温馨提示:

在付费报名之前请仔细甄别主办方的资质及服务能力。部分主办方会私下与报名者沟通承诺参与活动后的权益,并夸大参与后的收益效果等,以此来收取高额的报名费。这类活动通常有基于抖音、淘宝等平台的推广、代理加盟、引流变现等相关内容。

为保障您的权益,避免相关的经济损失,互动吧平台特此说明,平台仅提供相关的技术支持,不承担参与者与主办方在活动过程中的相关纠纷,若出现相关纠纷,平台会积极协助处理。

已报名 ({{join_total_num}})
其中{{join_unpay_num}}人正在支付

还木有人报名,快来成为活动第一人吧!

一键开通“活动提醒助手”全国已有1000万活动达人开通 一键开通
  • 为你推荐

加载中

该主办方未认证,请注意风险防范!

该主办方已完成互动吧 个人认证 企业认证 组织认证
真实姓名
{{authName}}
证件号码
{{authCode}}
认证时间
{{authTime}}完成认证,每年互动吧都会对其资料进行审核
互动吧认证申明
个人认证是互动吧对主办方帐号背后运营主体真实身份的认证,不代表互动吧对主办方所使用名称、介绍及真实营业情况的认证。
企业全称
{{authName}}
统一社会信用代码/工商执照注册号
{{authCode}}
认证时间
{{authTime}}完成认证,每年互动吧都会对其资料进行审核
互动吧认证申明
企业认证是互动吧对主办方帐号背后运营主体真实身份的认证,不代表互动吧对主办方所使用名称、介绍及真实营业情况的认证。
组织机构名称
{{authName}}
统一社会信用代码/组织机构代码
{{authCode}}
认证时间
{{authTime}}完成认证,每年互动吧都会对其资料进行审核
互动吧认证申明
组织认证是互动吧对主办方帐号背后运营主体真实身份的认证,不代表互动吧对主办方所使用名称、介绍及真实营业情况的认证。
我也要认证 >

{{pub_count}}

活动

{{fansCount}}

粉丝

{{shopDesc|html}}进店>

Ta组织活动太忙,还没腾出空写简介进店>

该主办方其他进行中的活动
添加专属客服
一对一为您答疑解惑
立即扫码添加我吧~
精选活动
  • {{selectlist.title}}
    {{selectlist.infoDate}}
    {{selectlist.priceWithSign}} {{selectlist.plusDiscountPriceRange}} {{selectlist.highlight}}
查看更多 加载中...
你的活动正在火热报名中...

去除底部“为你推荐”栏目,不再显示其他主办方的活动,独享用户全部注意力,提升报名量

马上去除
去广告权益包
去除报名页“为你推荐”栏目的所有广告和活动
  • {{list.shortName}}
    {{list.desc1}}
    {{list.desc2}}
商家会员免费获得去广告权益包,更有享有流量支持、1对1服务、功能独享等惊喜 了解详情>
选择支付方式
微信支付
支付宝支付
马上支付
可在主办方中心开具发票

支付成功

  • 增值服务 7 30 90 天{{functionName}}
  • 有效期 {{effectDate}}至{{expiryDate}}
  • 支付金额 {{price}}元
×

成为银牌会员

{{infoText}}

  • 高端模板免费用

    提升活动人气

  • 活动排名加权

    提升活动排名

  • 去除报名页广告

    提升活动报名效果

  • 高端邀请海报

    全场无限使用

  • 活动优先审核

    快人一步上架曝光

  • 大额提现

    限额提升4倍

  • 报名渠道监测

    掌握各渠道业绩

  • 发布多场次活动

    发布一次一劳永逸

  • 免认证服务

    免99元审核服务费

  • 更多特权
    敬请期待

马上开通

了解详情>

×
请选择高级认证主办方服务套餐查看特权>
  • {{item.type}}

    ¥{{item.price}}/{{item.viewType}}

    ¥{{item.oriPrice}}/{{item.viewType}}

季卡、半年卡、年卡均已包含认证审核服务费,支持开具发票

使用微信或支付宝扫码完成支付

支付金额:¥{{selectGrItem.price}}/{{selectGrItem.viewType}}(已省¥{{selectGrItem.oriPrice - selectGrItem.price}})

购买成功

已购买{{orderName}}

支付金额:¥{{payMoney}}

购买商品:{{orderName}}

扫码支付更轻松

购买成功

已购买{{orderName}}

×
{{curMemberData.title}}
{{curMemberData.tip}}
  • {{item.name}}

查看更多权益>

{{curMemberData.tags[0].name}}

查看更多权益>

{{item.imgText}}

  • {{temp.text}}

购买成功

您已成功购买{{checkMemberData.name}}

取消关注
确定取消关注吗?
取消关注后将无法再关注列表查看Ta的动态
前往互动吧小程序
在线沟通0距离
扫描上方小程序码,立即沟通
售后电话
{{joinMobile}}

你将要打开一个非互动吧页面,建议不要在该网页输入互动吧帐号、银行资料等隐私信息。

取消关注
确定取消关注吗?
取消关注后将无法再关注列表查看Ta的动态
关注成功
微信扫码关注公众号
实时接收主办方最新活动通知
微信
扫码
  • 下载App
  • 关注微信公众号
  • 扫一扫下方二维码下载App,获取完整体验

提示
确定删除本条讨论?
讨论删除后,将不可恢复,您确定继续删除吗?
您已成功报名此活动
加载中...
扫码
取票
扫码领取电子票
便于您随时出示、使用
扫码自动开通
“智能提醒助手”
活动报名提醒、行程提醒、
福利提醒、抢票提醒......
全国已有1000万活动达人开通
客服咨询
微信扫码 联系客服咨询
工作时间: 周一至周五 09:00~18:00
广告合作
你好, 我是互动吧销售经理
扫码加我微信, 立即沟通合作
微信号: 507003742
185-1971-5119
品牌合作
你好, 我是互动吧市场经理
扫码加我微信, 立即沟通合作
工作时间:周一至周五09:00~18:00
本次活动邀约了{{guestCount}}位嘉宾,期待与大家的见面
{{list.guestName}}
{{list.guestDesc}}
{{tag}}
返回
嘉宾介绍
{{guestInfo.guestName}}
{{guestInfo.guestDesc}}
{{tag}}
嘉宾介绍