大数据建模与分析挖掘应用实战(广州,5月20-22日)
价格:6800.00
大数据建模与分析挖掘应用实战(广州,5月20-22日)【举办单位】北京曼顿培训网中国培训资讯网【咨询电话】4006820825010-5613399813810210257【培训日期】上海,2018年4月22-24日;广州,2018年5月20-22日成都,2018年6月3-5日【培训地点】上海、广州、成都【培训对象】1.大数据分析应用开发工程师2.大数据分析项目的规划咨询管理人员3.大数据分析项目的IT项目高管人员4.大数据分析与挖掘处理算法应用工程师5.大数据分析集群运维工程师6.大数据分析项目的售前和***技术支持服务人员【课程背景】大数据建模与分析挖掘技术已经逐步地应用到新兴互联网企业(如电子商务网站、搜索引擎、社交网站、互联网广告服务提供商等)、******证券企业、电信运营等行业,给这些行业带来了一定的数据价值增值作用。■本次课程面向有一定的数据分析挖掘算法基础的工程师,带大家实践大数据分析挖掘平台的项目训练,系统地讲解数据准备、数据建模、挖掘模型建立、大数据分析与挖掘算法应用在业务模型中,结合主流的Hadoop与Spark大数据分析平台架构,实现项目训练。■结合业界使用***广泛的主流大数据平台技术,***剖析基于大数据分析算法与BI技术应用,包括分类算法、聚类算法、预测分析算法、推荐分析模型等在业务中的实践应用,并根据讲师给定的数据集,实现两个基本的日志数据分析挖掘系统,以及电商(或内容)推荐系统引擎。■本课程基本的实践环境是Linux集群,JDK1.8,Hadoop2.7.*,Spark2.1.*。■学员需要准备的电脑***好是i7三代及以上CPU,8GB及以上内存,硬盘空间预留50GB(可用移动硬盘),基本的大数据分析平台所依赖的软件包和依赖库等,讲师已经提前部署在虚拟机镜像(VMware镜像),学员根据讲师的操作任务进行实践。■本课程采用技术原理与项目实战相结合的方式进行教学,在讲授原理的过程中,穿插实际的系统操作,本课程讲师也精心准备的实际的应用案例供学员动手训练。【培训目标】1.本课程让学员充分掌握大数据平台技术架构、大数据分析的基本理论、机器学习的常用算法、国内外主流的大数据分析与BI商业智能分析解决方案、以及大数据分析在搜索引擎、广告服务推荐、电商数据分析、***客户分析方面的应用案例。2.本课程强调主流的大数据分析挖掘算法技术的应用和分析平台的实施,让学员掌握主流的基于大数据Hadoop和Spark的大数据分析平台架构和实际应用,并用结合实际的生产系统案例进行教学,掌握基于Hadoop、spark大数据平台的数据挖掘和数据仓库分布式系统平台应用,以及商业和开源的数据分析产品加上Hadoop平台形成大数据分析平台的应用剖析。。3.让学员掌握常见的机器学习算法,深入讲解业界成熟的大数据分析挖掘与BI平台的实践应用,并以客户分析系统、日志分析和电商推荐系统为案例,串联常用的数据挖掘技术进行应用教学。【培训特色】定制授课+实战案例训练+互动咨询讨论,共3天【课程大纲】模块一SparkML基础入门1.1Spark介绍1.2SparkML介绍1.3课程的基础环境1.4SparkSparkSession1.5SparkDatasets操作1.6Datasets操作的代码实操模块二SparkMLPipelines(ML管道)2.1Pipelines的主要概念2.2Pipelines实例讲解2.3ML操作的代码实操2.4使用MLPipeline构建机器学习工作流案例展示2.5实例的代码实操声模块三SparkML数学基础3.1ML矩阵向量计算3.2分类效果评估指标及ML实现详解3.3交叉-验证方法及ML实现详解3.4实例的代码实操3.5特征的提取及ML实现详解3.6特征的转换及ML实现详解3.7特征的选择及ML实现详解3.8实例的代码实操模块四SparkML特征的提取、转换和选择4.1线性回归算法4.2逻辑回归算法4.3ML回归算法参数详解4.4ML实例4.5实例的代码实操模块五SparkML线性回归/逻辑回归算法5.1决策树算法5.2随机森林算法5.3GDBT算法5.4ML树模型参数详解5.5ML实例5.6实例的代码实操模块六SparkML决策树/随机森林/GBDT算法6.1KMeans聚类算法6.2MLKMeans模型参数详解6.3ML实例6.4实例的代码实操模块七SparkMLKMeans聚类算法7.1LDA主题聚类算法7.2MLLDA主题聚类模型参数详解7.3ML实例7.4实例的代码实操模块八SparkMLLDA主题聚类算法8.1协同过滤推荐算法8.2ML协同过滤分布式实现逻辑8.3ML协同过滤源码开发8.4实现实例8.5实例的代码实操模块九SparkML协同过滤推荐算法9.1案例背景9.2架构设计9.3数据准备9.4模型训练9.5模型预测9.6脚本封装模块十项目实践大型案例:基于Spark的推荐模型开发模块十一培训总结项目方案的课堂讨论,讨论实际业务中的分析需求,剖析各个环节的难点、痛点、瓶颈,启发出解决之道;完成讲师布置的项目案例,巩固学过的大数据分析挖掘处理平台技术知识以及应用技能【讲师介绍】张老师,曼顿培训网()***讲师。阿里大数据******,国内***的Spark、Hadoop技术***、虚拟化***,对HDFS、MapReduce、HBase、Hive、Mahout、Storm、spark和openTSDB等Hadoop生态系统中的技术进行了多年的深入的研究,更主要的是这些技术在大量的实际项目中得到广泛的应用,因此在Hadoop开发和运维方面积累了丰富的项目实施经验。近年主要典型的项目有:某电信集团网络优化、中国移动某省移动公司请账单系统和某省移动详单实时查询系统、中国银联大数据数据***详单平台、某大型***大数据记录系统、某大型通信运营商***用户上网记录、某省***门***系统、某区域***大数据应用项目、互联网公共数据大云(DAAS)和构建游戏云(WebGameDaas)平台项目等。【费用及报名】1、费用:培训费6800元(含培训费、讲义费);如需食宿,会务组可统一安排,费用自理。2、报名咨询:4006820825010-561339985602809013810210257鲍老师3、报名流程:电话登记-->填写报名表-->发出培训确认函4、备注:如课程已过期,请访问我们的网站,查询***新课程5、详细资料请访问北京曼顿培训网:(每月在***开设四百多门公开课,欢迎报名学习))
北京曼顿企业管理咨询有限公司
业务 QQ: 1017196103