星点互联教育课程学习演示站
标题:
Spark 2.0从入门到精通:Scala编程
[打印本页]
作者:
于泽文
时间:
2018-1-28 19:43
标题:
Spark 2.0从入门到精通:Scala编程
本课程主要讲解目前大数据领域热门、火爆、有前景的技术——Spark。在本课程中,会从浅入深,基于大量案例实战,深度剖析和讲解Spark,并且会包含完全从企业真实复杂业务需求中抽取出的案例实战。课程会涵盖Scala编程详解、Spark核心编程、Spark SQL和Spark Streaming、Spark内核以及源码剖析、性能调优、企业级案例实战等部分。完全从零起步,让学员可以一站式精通Spark企业级大数据开发,提升自己的职场竞争力,实现更好的升职或者跳槽,或者从j2ee等传统软件开发工程师转型为Spark大数据开发工程师,或是对于正在从事hadoop大数据开发的朋友可以拓宽自己的技术能力栈,提升自己的价值。
1.课程研发环境
开发工具: Eclipse、Scala IDE for Eclipse;
Spark: 1.3.0和1.5.1
Hadoop: 2.4.1
Hive: 0.13
ZooKeeper: 3.4.5
Kafka: 2.9.2-0.8.1
其他工具: SecureCRT、WinSCP、VirtualBox等
2.内容简介
本课程主要讲解的内容包括:Scala编程、Hadoop与Spark集群搭建、Spark核心编程、Spark内核源码深度剖析、Spark性能调优、Spark SQL、Spark Streaming。
本课程的特色包括:
1、代码驱动讲解Spark的各个技术点(绝对不是照着PPT空讲理论);
2、现场动手画图讲解Spark原理以及源码(绝对不是干讲源码和PPT);
3、覆盖Spark所有功能点(Spark RDD、Spark SQL、Spark Streaming,初级功能到高级特性,一个不少);
4、Scala全程案例实战讲解(近百个趣味性案例);
5、Spark案例实战的代码,几乎都提供了Java和Scala两个版本和讲解(一次性同时精通Java和Scala开发Spark);
6、大量全网独有的知识点:基于排序的wordcount,Spark二次排序,Spark分组取topn,DataFrame与RDD的两种转换方式,Spark SQL的内置函数、开窗函数、UDF、UDAF,Spark Streaming的Kafka Direct API、updateStateByKey、transform、滑动窗口、foreachRDD性能优化、与Spark SQL整合使用、持久化、checkpoint、容错与事务。
7、多个从企业实际需求抽取出的复杂案例实战:每日uv和销售额统计案例、top3热卖商品统计案例、每日top3热点搜索词统计、广告计费日志实时黑名单过滤案例、热点搜索词滑动统 计案例、top3热门商品实时统计案例
8、深度剖析Spark内核源码与Spark Streaming源码,给源码进行详细的注释和讲解
9、全面讲解Spark、Spark SQL、Spark Streaming的性能调优,其中包括全网独有的Shuffle性能调优(详细讲解性能调优的各个技术点)
10、涵盖Spark两个重要版本,Spark 1.3.0和Spark 1.5.1的讲解(走在Spark前沿,涵盖新高级特性)
本次Spark 2.0课程升级,总计30讲内容,大约15个课时。主要是深入浅出讲解了Spark2.0版本的相关内容。主要内容大纲如下:
1. Spark 2.0新特性深入浅出剖析:主要讲解了Spark 2.0都有哪些新特性,同时深入浅出剖析了Spark 2.0的第二代Tungsten引擎的工作原理。
2. Dataset/Dataframe开发详解:主要完整讲解了Spark 2.0开始,API-Dataset/Dataframe的开发,包括主要的各种计算操作以及常用函数等。
3. Structured Streaming开发详解:主要深入浅出讲解了Spark 2.0新增加的下一代流式计算引擎——Structured Streaming,包括其设计理念和思想,以及开发模式,以及开发的一些细节。
4. Spark简历编写、面试以及如何找工作:主要为大家分析了学完课程之后,对自己如何定位?如何深入了解企业的招聘需求?如何将自己的技术背景补齐到与公司需求相match?如何编写简历?如何拥有属于自己的独一无二的大数据项目?如何掌握面试的关键技巧?目前大数据行业的薪资现状以及如何谈一个合适的薪资?
5. 具体的升级内容大纲,见“课程大纲”底部新增内容。
这里需要提前特别提醒的是,新手如何看待Spark 1.x和Spark 2.x的关系,以及学习的建议。大家千万不要以为Spark 2.x完全颠覆了Spark 1.x,因此Spark 1.x的东西不用学了,那是完全错误的想法!事实恰恰相反,实际上Spark 2.x与Spark 1.x一脉相承,2.x完全是在1.x的基础上进行了功能的完善,底层引擎的优化,以及新的功能模块的增加。spark官方也发出了声明,spark 1.x的所有东西在未来都完全是有其价值和意义的,绝对不是被淘汰!
因此对于新人来说,课程里讲解的Spark 1.x,不仅完全没有过时,而且在目前以及未来都是绝对有用的!实际上Spark 1.x只有极其少数的一些东西是被标记为淘汰的!因此,新人必须从本课程讲解的Spark 1.x开始,一点一点学习,循序渐进,千万不能急于求成!而且Spark 2.0还很不稳定,因此本次升级讲解的内容,主要是希望大家能够跟上技术的发展潮流,站在技术发展的前沿,而不是让大家马上学了spark 2.0后就开始投入生产环境使用!具体的分析,在课程里都有讲解,希望大家踏踏实实地学习。
超重磅免费升级通知!
本次课程升级,总计132讲,60课时左右,内容扩充近一倍。将从入门到精通的各个阶段都进行了阶段升级。主要内容概述如下:
1、Scala编程进阶:讲解Scala高级编程技巧。
2、Spark核心编程进阶:本版本展示细致的Spark核心编程讲解,包括standalone集群操作以及spark-submit所有细节,补充大量实验,并补充讲解几乎所有的算子操作,并增添大量实战案例以及移动端app访问流量日志分析综合案例。
3、Spark内核原理进阶:全网独家讲解Spark常用的10个算子的内部原理。
4、Spark SQL实战开发:讲解Thrift JDBC/ODBC Server等高级内容,并增添新闻网站关键指标离线统计综合案例。
5、Spark Streaming实战开发:讲解Flume数据源等高级内容,并增添新闻网站关键指标实时统计综合案例。
6、Spark运维管理进阶:完全实战讲解与演练Spark的运维与管理的各种高阶技术,包括基于ZooKeeper和文件系统实现HA以及主从切换、多种作业监控方式,以及全网独家的Spark动态资源分配技术和Fair Scheduler技术。
作者:
admin
时间:
2018-1-29 09:02
这套课很有帮助,我已经学会并入职了中国500强
欢迎光临 星点互联教育课程学习演示站 (http://47.100.112.22/demo/nuke/)
Powered by Discuz! X3.5