中国电子标准协会培训中心

  
培训课程筛选


大数据分析与可视化技术应用实战

关键字:大数据分析与可视化技术应用实战 
       大数据分析与可视化技术应用实战 word版       课程提纲
主讲专家
---------------------------------
游老师  谢老师  
  开课信息:   课程编号:KC19226  
  开课日期(天数) 上课地区 费用  
  2018年07月20日~2018年07月23日 山东-青岛市 5800  
  2018年10月28日~2018年10月31日 四川-成都市 5800  
  2018年12月09日~2018年12月12日 浙江-宁波市 5800  
更多:  
招生对象
---------------------------------
1.大数据分析应用开发工程师
课程内容
---------------------------------
一、 培训收益
通过此次课程培训,可使学习者获得如下收益:
1.理解数据分析及R语言;
2.理解并掌握数据结构;
3.掌握数据导入导出的方法;
4.掌握基本数据管理方法;
5.理解并掌握数据探索;
6.掌握如何进行描述性统计分析;
7.掌握R语言绘图基础;
8.掌握聚类分析;
9.掌握关联规则;
10.掌握KNN近邻分类;
11.通过案例掌握用户行为挖掘算法;
12.掌握C5.0算法原理;
13.掌握CART算法原理;
14.理解并掌握Rattle工具使用及如何搭建数据分析平台。
二、 培训特色
1. 本课程尽量避开数学公式,按照“讲清思想方法原理—结合具体案例—R语言实现细节”思路,让即使是几乎没有什么基础的学员,掌握数据挖掘和可视化的基本思路和模式,打下未来深入的良好基础,能在工作和学习中结合具体问题立马上手操作解决;
2. 课程注重学练结合的方法,会采取课中练习的方法,充分调动大家思考的积极性,在做中掌握相关知识和技能;
3. 课程紧紧抓住基于R语言的数据挖掘和可视化的重点和难点,详细的分析和讲解,在理解难、容易出错的地方反复提醒,以便学员在课后容易的进行自己复习和相关拓展。
三、 日程安排
时间 培训模块 培训内容
第一天
上午 数据处理及复杂数据可视化(一) R语言入门及数据挖掘基本概念
 R语言简介
常量、向量、矩阵、数组、数据框、列表、数据处理、编写程序、基本统计计算、R语言绘图基础、帮助及包的用法
 R语言数据处理秘笈
介绍填、剪、揉太极三式的数据处理原理、方法、案例、技巧,以及Dplyr包、Tidyr包、Data.Table包的具体用法和代码讲解
 数据挖掘基础
讲解数据挖掘的基本概念、典型问题,通过场景举例说明数据挖掘的用途;同时,结合数据挖掘标准流程讲解开展数据挖掘工作的各环节及主要技术。介绍数据挖掘常用算法及适合场景,比较不同数据挖掘工具的优缺点。
第一天
下午 数据处理及复杂数据可视化(二) R语言数据挖掘与可视化分析
 数据挖掘关键技术
详细讲解抽样、分区、样本平衡、特征选择、训练模型、评估模型的技术,并结合R语言讲解其代码实现。
 Rattle数据挖掘工具
介绍Rattle在业界的使用情况,安装及具体使用方法,包括数据源、数据探索、统计检验、数据变换、聚类分析、关联挖掘、建模、评估模型以及日志功能。通过实际的数据演示各环节的具体操作过程,分析挖掘结果。
 可视化分析
介绍可视化基本概念,可视化设计流程以及R语言可视化的优势;其次,介绍24种常见图表(拆线图、柱状图、散点图、雷达图、词云图、玫瑰图、桑基图、河流图等等)的适用场景和使用方法;最后,重点对Lattice、Rcharts、Recharts、Ggplot2包进行了详细讲解和案例演示。
第二天
上午 数据挖掘模型实战(一) 关联规则算法原理与案例分析
 算法讲解
关联规则概念、基本术语、Apriori算法实现原理、流程及手动演算案例;Arules包的介绍等等
 案例:利用超市购物篮Groceries数据进行关联规则分析
介绍Groceries数据集、事务数据集以及常见操作;介绍数据转换为事务数据集的方法以及使用Apriori算法建立关联规则模型,同时,对分析关联规则结果的常用技术进行了讲解和演示。
聚类算法原理与案例分析
 Kmeans算法讲解
介绍Kmeans聚类基本思路及算法流程;Kmeans函数介绍;数据标准化技术介绍
 案例:对Iris数据集进行K均值聚类分析
介绍Iris数据集,并试图通过使用基本数值指标建立聚类分析模型,验证其与真实分类的区别
 案例:对Mtcars数据集进行K均值聚类分析
介绍Mtcars数据集,并使用Kmeans算法对其进行聚类分析,以了解汽车的类别细分,同时给出合理解释并提炼判断规则
 层次聚类算法讲解
介绍样本距离、类间距离的概念和计算方法,介绍层次聚类算法流程以及通过手动演算详细讲解层次聚类实现的过程;Hclust函数讲解
 案例:对洛杉机街区数据进行层次聚类
介绍洛杉机数据,并使用层次聚类算法对其进行细分;通过细分进一步对数据进行了详细了解,并给出各类的详细描述与说明
 案例:对哺乳动物的睡眼数据进行层次聚类
介绍哺乳动物的睡眠数据,使用层次聚类的方法对其进行细分,并给出各类的特点,并给出详细描述与说明
第二天
下午 数据挖掘模型实战(二) KNN算法原理与案例分析
 算法原理
介绍Knn基本概念、原理以及实现流程,同时给出Knn算法的优缺点和适用场景;详细介绍Kknn包
 案例:对Iris数据集进行Knn分类
介绍使用Knn算法对Iris数据进行分类的方法、流程及代码演示,并对分类的结果进行分析
 案例:对乳腺癌数据进行Knn分类
介绍乳腺癌数据集,并使用Knn算法对乳腺癌数据进行分类,同时给出实现的方法、流程及代码,并对分类效果进行分析
 案例:对新闻文本数据进行Knn分类
介绍新闻文本数据,并使用Knn分类算法对新闻文本数据进行分类,同时给出实现的方法、流程及代码,并对分类效果进行分析
决策树原理与案例分析
介绍决策树基本概念、分类与回归问题的区别与联系、说明决策树建模的通用过程。
 CART算法原理
介绍分类回归树的基本思路、算法实现流程,并通过案例说明其实现细节;介绍选择分割点的方法,拆分规则,代价复杂度以及Rpart包和Prune函数的介绍
 案例:对Iris数据集运用CART算法进行分类
介绍使用CART算法对Iris数据进行分类的方法、原理和代码实现流程,并对分类效果进行比较分析
 案例:对汽车数据运用CART对汽车重量进行预测
介绍使用CART算法对Mtcars数据中汽车的重量进行预测的方法、原理和代码实现流程,并对预测效果进行分析
 C5.0算法原理
介绍ID3算法的算法实现原理和流程,同时讲解信息熵、后验熵、信息增益等基本概念;通过案例讲解ID3算法的具体过程以及ID3自身的问题;介绍C4.5算法的实现原理和流程,讲解增益比例的来源和优点,同时介绍C4.5对连续属性及有缺失样本的算法办法,此外,还将会对剪枝、规则的产生、交叉验证等问题进行讲解;C50包的介绍
 案例:对Iris数据集运用C50算法分类
介绍使用C50算法对Iris数据集进行分类的方法、原理和代码实现流程,同时对分类效果进行分析
第三天
上午 行业应用案例分享(一) 分析案例剖析
 购物篮分析案例
Onlineretail数据集,包含用户购买商品的交易信息,本案例旨在从中挖掘出用户购买商品的关联规则规律,并分析各模式对应的含义及应用可行性。
 航空公司客户价值分析案例
面对激烈的市场竞争,各航空公司都推出了更优惠的营销方式来吸引更多的客户,国内某航空公司面临着旅客流失、竞争力下降和航空资源未充分利用等经营危机。通过建立合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相应的营销策略
 Lending Club信贷违约分析案例
Lending Club 信用贷款违约数据是美国网络贷款平台 Lendingclub 在2007-2015年间的信用贷款情况数据,主要包括贷款状态和还款信息。本例基于该数据对多维度信息进行详细的数据分析,主要结合词云、地图等分析方法,另外,针对贷款违约建立了预测模型,本节会介绍详细的建模过程及预测效果分析
第三天
下午 行业应用案例分享(二) 用户行为挖掘算法及案例
 推荐系统
介绍推荐系统的基本概念、以及常见推荐算法(包括基于人口统计学的推荐、基于内容的推荐、协同过滤推荐、基于关联规则的推荐、基于效用的推荐、基于知识推荐、基于标签的推荐、基于图的推荐等等),同时对不同的推荐算法进行比较;另外,针对构建推荐系统,给出了详细的说明;介绍了推荐系统评测的关键指标(包括用户满意度、准确度、覆盖率、多样性、惊喜度等等);接着,对R语言中的Recommenderlab包的用法进行详细介绍
 案例:基于Onlineretail数据建立推荐系统
介绍Onlineretail数据集,以及开展推荐系统搭建过程的方法及具体实现,案例中使用了RANDOM、UBCF、IBCF三种方法建立了预测模型,并给出了比较分析
 序列模式挖掘
介绍序列模式挖掘的基本概念、术语、实现的思路及具体过程。主要介绍SPADE算法的原理以及其实现过程。针对具体的实现,详细介绍了R语言中的Arulessequences包
 对Onlineretail数据集进行序列模式挖掘
基于Onlineretail数据集,使用Spade算法建立序列模式挖掘算法进行序列模式挖掘,并对挖掘出的结果进行解释分析
第四天 学习考核与业内经验交流
讲师介绍
---------------------------------
此次课程由以下其中一位老师授课:
游老师  计算机硕士,大数据分析、挖掘、可视化专家,高级培训讲师,曾服务于华为技术有限公司等多家企业,专注于机器学习、数据挖掘、大数据、知识图谱等领域的研究、设计与实现,在互联网、电信、电力、军工等行业具有丰富的工程实践经验,对空间分析、欺诈检测、广告反作弊、推荐系统、客户画像、客户营销建模、知识抽取、智能问答、可视化分析、预测分析、系统架构、大数据端到端解决方案等方面具有深刻理解,多次作为R语言会议重要嘉宾出席会议并发表主题演讲,著有《R语言预测实战》等多本书籍。
谢老师  某集团上市公司数据分析部负责人,主要利用R语言进行大数据的挖掘和可视化工作。从事数据挖掘建模工作已有10年,曾经从事过咨询、电商、金融、电购、电力、游戏等行业,了解不同领域的数据特点。有丰富的利用R语言进行数据挖掘实战经验,部分研究成果曾获得国家专利。
 
开课时间:2018-07-20 温馨提示:本课程可邀请老师到企业内部培训!
机构名称:深圳市威硕企业管理咨询有限公司 咨询电话:0755-26506757 33558698
课程地区:山东
联 系 人:李正华先生 彭静小姐 郑江波先生
浏览次数:
电子信箱:martin@ways.org.cn


中国电子标准协会培训中心(http://www.ways.org.cn)专业提供可靠性设计、热设计、SMT工艺、电路设计、架构设计、硬件测试、研发管理、嵌入式软件测试、EMC培训、软件技术等课程及服务。欢迎来电来函咨询:0755-26506757 13798472936 martin@ways.org.cn

免费咨询/报名 请仔细填写以便我们安排此课程专业人士第一时间回复您!
您的姓名:
参加人数: 数据探索;
6.掌握如何进行描述性统计分析;
7.掌握R语言绘图基础;
8.掌握聚类分析;
9.掌握关联规则;
10.掌握KNN近邻分类;
11.通过案例掌握用户行为挖掘算法;
12.掌握C5.0算法原理;
13.掌握CART算法原理;
14.理解并掌握Rattle工具使用及如何搭建数据分析平台。
二、 培训特色
1. 本课程尽量避开数学公式,按照“讲清思想方法原理—结合具体案例—R语言实现细节”思路,让即使是几乎没有什么基础的学员,掌握数据挖掘和可视化的基本思路和模式,打下未来深入的良好基础,能在工作和学习中结合具体问题立马上手操作解决;
2. 课程注重学练结合的方法,会采取课中练习的方法,充分调动大家思考的积极性,在做中掌握相关知识和技能;
3. 课程紧紧抓住基于R语言的数据挖掘和可视化的重点和难点,详细的分析和讲解,在理解难、容易出错的地方反复提醒,以便学员
*人,报名参加2018-07-20开始,在山东举办的《大数据分析与可视化技术应用实战》(课程编号:19226)。
联系电话: *  移动电话或传真:
电子邮件: * 所在单位:
咨询内容:
(或备注)
*
 

  近期推荐课程
·[山东]大数据分析(Hadoop)与云计算实 ·[湖北]卓越需求分析与管理培训班
·[上海]产品需求分析与需求管理 ·[上海]企业竞争情报实战搜集、分析与利用
·[广东]大数据时代企业商业模式的成功转型 ·[北京]商业模式分析与设计
·[山东]卓越需求分析与管理培训班 ·[上海]《培训需求分析与计划制定》-TTM
·[北京]年度培训需求分析与计划制定 ·[浙江]“微行动学习工作坊”问题导向式年度培
 
官方微信号 pxke02 
相关课程
·[北京-2018-04-20] 大数据分析与可视化技术应用实战 培训班
·[山东-2018-07-20] 大数据分析与可视化技术应用实战
·[山东-2018-07-20] 大数据分析与可视化技术应用实战
                                更多...
推荐公开课
                                更多...
推荐内训课
                                更多...
资讯中心

中国电子标准协会培训中心(深圳市威硕企业管理咨询有限公司)成立于2006年,经过十多年的发展,在国内外业界技术顾问及广大客户的支持下,我培训中心已成为一家专业的电子技术、研发、管理、企业资格及电子标准培训服务提供商,致力为各企业提供成熟的企业技术、管理及标准培训服务。借鉴国际先进的电子技术应用与管理理念,让协会整合以“技术”为核心的企业资源体系,解决企业运营过程中的技术难题,提升生产、运作与工作效率,增强企业核心能力,赢得竞争优势,最终实现企业长期追求的使命与愿景。
经典课程:可靠性设计各种设计技术(包括可靠性降额设计、硬件测试、可靠性余度设计、可靠性动态设计、电路设计、可靠性环境防护设计、EMC培训、热设计、硬件测试、可靠性安全设计、缓冲减振设计、静电防护设计等)、SMT技术管理培训、EMC培训、硬件测试、IPC标准(IPC-A-610E标准、IPC-A-7711/21标准、IPC-A-620A标准、IPC-A-600H标准、IPC J-STD-001标准)、电路设计、硬件测试、ESD防静电防护、ESD设计、硬件测试、EMC培训、电路设计、硬件测试技术及信号完整性分析、硬件测试、DFM电子可制造性设计、机械结构设计、加速试验和筛选技术和模拟仿真技术、硬件测试、EMC培训、失效分析、EMC培训、电路设计、EMC培训、故障模式影响及危害性(FMEA、FMECA)和故障树分析(FTA)、元器件可靠性设计、硬件测试、电路设计、软件可靠性设计、硬件测试、软件测试(黑盒和白盒)、电路设计、可靠性设计各种试验技术(环境应力筛选试验、EMC培训、硬件测试、可靠性工程试验、可靠性统计试验等)以及可靠性管理是我协会的强项;软件类:架构设计、EMC培训、硬件测试、C语言、电路设计、UI设计、硬件测试、需求分析、电路设计、软件项目管理、硬件测试、电路设计、Oracle、软件敏捷、.NET、EMC培训、硬件测试、Android、硬件测试、软件配置管理、Linux、硬件测试、CMMI、软件重构、C++等等

服务热线:0755-33558698 26506757 传真:0755-33119039 电子邮件:martin@ways.org.cn
客服 QQ:52630255 751959468 1305933375 385326049
中国电子标准协会培训中心(http://www.ways.org.cn)网站 ICP注册号:ICP备257378787号