项目数据分析的步骤是什么?

如题所述

业务理解(Business Understanding)
最初的阶段集中在理解项目目标和从业务的角度理解需求,同时将这个知识转化为数据挖掘问题的定义和完成目标的初步计划。

数据理解(Data Understanding)
数据理解阶段从初始的数据收集开始,通过一些活动的处理,目的是熟悉数据,识别数据的质量问题,首次发现数据的内部属性,或是探测引起兴趣的子集去形成隐含信息的假设。

数据准备(Data Preparation)
数据准备阶段包括从未处理数据中构造最终数据集的所有活动。这些数据将是模型工具的输入值。这个阶段的任务有个能执行多次,没有任何规定的顺序。任务包括表、记录和属性的选择,以及为模型工具转换和清洗数据。

建模(Modeling)
在这个阶段,可以选择和应用不同的模型技术,模型参数被调整到最佳的数值。一般,有些技术可以解决一类相同的数据挖掘问题。有些技术在数据形成上有特殊要求,因此需要经常跳回到数据准备阶段。

评估(Evaluation)
到项目的这个阶段,你已经从数据分析的角度建立了一个高质量显示的模型。在开始最后部署模型之前,重要的事情是彻底地评估模型,检查构造模型的步骤,确保模型可以完成业务目标。这个阶段的关键目的是确定是否有重要业务问题没有被充分的考虑。在这个阶段结束后,一个数据挖掘结果使用的决定必须达成。

部署(Deployment)
通常,模型的创建不是项目的结束。模型的作用是从数据中找到知识,获得的知识需要便于用户使用的方式重新组织和展现。根据需求,这个阶段可以产生简单的报告,或是实现一个比较复杂的、可重复的数据挖掘过程。在很多案例中,这个阶段是由客户而不是数据分析人员承担部署的工作。

sc-cpda 数据分析公众交流平台
温馨提示:答案为网友推荐,仅供参考
第1个回答  2020-11-03
第一步:起点是真实的商业场景,行业思考 精通业务,
第二步:接下来数据采集(公司和外部数据结合),
第三步:数据整理和清洗 (数据来源不同 建立规则进行清理),
第四步:探索性分析和数据挖掘 (数据分布 薪酬收入 变量间的相关性 )
第五步:数据建模 :比如线性回归:变量和变量之间的线性相关性
第六步:数据产品化,结合需求提出一套解决方案
第2个回答  2020-03-12
第一、对于任何的项目数据分析来说,首要的就是数据采集,一些移动客户端中的数据进行快速而又广泛的搜集,同时它还能够迅速的将一些其他的平台中的数据源中的数据导入到该工具中,对数据进行清洗、转换、集成等,从而形成在该工具的数据库中或者是数据集市当中,为联系分析处理和数据挖掘提供了基础。
第二、数据在采集之后,大数据分析的另一个技术数据存取将会继续发挥作用,方便用户在使用中储存原始性的数据,再有就是基础性的架构,比如说运储存和分布式的文件储存等,都是比较常见的一种。
第三、数据处理可以说是一站式数据分析工具亿信ABI的核心技术之一,面对庞大而又复杂的数据,运用一些计算方法或者是统计的方法等对数据进行处理,包括对它的统计、归纳、分类等,从而能够让用户深度的了解到数据所具有的深度价值。
第四、统计分析可以帮助用户分析出现某一种数据现象的原因是什么,差异分析则可以比较出企业的产品销售在不同的时间和地区中所显示出来的巨大差异,以便未来更合理的在时间和地域中进行布局。
第五、某一种数据现象和另外一种数据现象之间存在怎样的关系,此外,聚类分析以及主成分分析和对应分析等都是常用的技术,这些技术的运用会让数据开发更接近人们的应用目标。
第3个回答  2018-06-26
典型的数据分析可能包含以下三个步:
1、探索性数据分析,当数据刚取得时,可能杂乱无章,看不出规律,通过作图、造表、用各种形式的方程拟合,计算某些特征量等手段探 索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性。
2、模型选定分析,在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。
3、推断分析,通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。数据分析过程实施数据分析过程的主要活动由识别信息需求、收集数据、分析数据、评价并改进数据分析的有效性组成。本回答被网友采纳
相似回答