【精益管理网】 时间:2019-01-29 作者:大数据傅一航 来源:大数据傅一航 H - 小 + 大
数据分析过程数据分析,不是一个简单的操作,而是一个完整的过程。 一般地,一个完整的数据分析包括了六个步骤,后一个步骤依赖前一个步骤,也是前一个过程的深入。 数据分析过程 第一步:明确目的。 首先,任何数据分析都是为了解决业务问题。因此,明确目的是数据分析有效进行的先决条件,也为后续提供清晰的指引方向。明确目的要做的工作如下: 1、 确定分析目的。即为什么要做数据分析,分析的背景以及目的是什么,要解决什么业务问题,并进一步对业务分析进行分解。 2、 确定分析思路。围绕业务目的,梳理分析思路,搭建分析框架。比如,要从哪几个角度进行分析,采用哪些分析指标,等等。 分析思路 第二步:收集数据。 当确定分析目的之后,接下来就需要围绕业务问题来收集相关的数据,数据收集为分析数据提供素材与依据。需要明确下面工作: 1、 明确收集范围。即需要收集哪些数据,数据的名称、类型、时间范围等等。 2、 确定收集来源。数据的来源可以是多样性的,可以是互联网、公开出版物,以及一些专门的咨询机构,当然更多的数据来源是本企业的IT系统及数据库(比如CRM、BOSS、营销系统等)。 3、 确定收集方法。采用哪些方法可以快速获得想要的数据呢?是抽样,还是需要普查?是只需要样本还是数据全集?调查的渠道有哪些?对于一些特定的分析任务,还需要进行市场调查,通过专门的市场调查机构来获取数据。 第三步:整理数据。 数据预处理是对收集到的数据进行加工、整理,形成适合分析的格式,是分析前不可缺少的阶段。一般情况下,数据预处理所花费的时间占整个数据分析的60~80%的工作。预处理经常要做的工作包括: 1、 数据预处理 a) 数据清洗。去掉或合并重复的数据,删除无效数据,补齐缺失数据。 b) 数据转化。将原始的数据转化为新的数据格式,比如,将性别(男,女)转换为数值(1,0)等等。 c) 数据提取。将几个字段进行抽取、合并等形成新的字段,比如,从身份证中提取出性别,以及出生年月。 d) 数据计算。对数据进行基本的汇总、统计,比如,根据单价和数量,计算出总的消费金额。 2、 数据质量评估 a) 有效性评估。数据的取值、单位是否有效。 b) 可靠性评估。来源是否专业,可信度如何。 3、 合并多个表格 大多数分析方法都是基于一个数据集进行的,所以需要将众多的数据表格进行合并,形成一个数据集。 第四步:分析数据。 分析数据,就是用适当的分析方法和工具,对数据进行分析,提取有价值的信息。这一步包含如下内容: 1、 选择分析方法。基于业务问题,需要选择合适的分析方法,比如:分组分析、结构分析、趋势分析,不同的分析目的要采用不同的分析方法。 2、 选择分析模型。对于复杂的业务问题,有可能还需要重新构建分析模型,或者选择已有的数据分析模型,比如回归模型、聚类、决策树分类,等等。 3、 选择合适工具。常用的分析工具有通用的Excel数据分析,也有较专业的数据分析工具SPSS和SAS,各种不同的工具,其适用范围及能够解决的问题也不同。选择合适的工具能够让你的分析工作更加有效。 4、选择合适的分析语言。如果前面的分析工具都无法满足业务的需求,那么就需要学习一些分析语言了,比如Python/R语言,来编写业务数据的处理分析流程,以实现业务数据的自动化分析,满足定制的业务流程需求。 第五步:呈现数据 数据呈现,或者叫做数据可视化。数据可视化,能够将数据很直观地表达出来,让阅读者能够一眼看出数据所要表达的业务逻辑,所谓一图胜千言。分析师需要掌握最基本的可视化技术: 1、 常用图形。包括柱状图、条件图、饼图、折线图、散点图、雷达图,等等。 2、 图表工具。最常用的图形工具,有Excel、水晶易表、SwiffChart等等。 掌握常用的图形工具,能够让你的分析结果更直观有效,更易理解,更容易找出数据中蕴含的业务规律和业务问题,从而能够辅助决策。 第六步:撰写报告 分析报告,是整个数据分析过程的一个总结。一个好的分析报告,需要图文并茂,层次清晰,要有明确的分析结论,以及可行的建议和业务解决方案。 撰写报告的过程,其实就是思考业务策略的过程,这是从数据分析转换成业务策略最重要的一步。 所以,数据分析是一个完整的业务解决过程,发源于业务(业务问题),也回归于业务(业务策略)。 |
【版权声明】本站文章版权属原作者,转载请注明作者和来源,如对本网所转文章有异议,请联系我们处理,谢谢!