怎样学习大数据？

如题所述

推荐答案 2019-11-20

首先我们要了解Java语言和Linux操作系统，这两个是学习大数据的基础，学习的顺序不分前后。

Java ：只要了解一些基础即可，做大数据不需要很深的Java 技术，学java SE 就相当于有学习大数据基础。

Linux：因为大数据相关软件都是在Linux上运行的，所以Linux要学习的扎实一些，学好Linux对你快速掌握大数据相关技术会有很大的帮助，能让你更好的理解hadoop、hive、hbase、spark等大数据软件的运行环境和网络环境配置，能少踩很多坑，学会shell就能看懂脚本这样能更容易理解和配置大数据集群。还能让你对以后新出的大数据技术学习起来更快。

Hadoop：这是现在流行的大数据处理平台几乎已经成为大数据的代名词，所以这个是必学的。Hadoop里面包括几个组件HDFS、MapReduce和YARN，HDFS是存储数据的地方就像我们电脑的硬盘一样文件都存储在这个上面，MapReduce是对数据进行处理计算的，它有个特点就是不管多大的数据只要给它时间它就能把数据跑完，但是时间可能不是很快所以它叫数据的批处理。

Zookeeper：这是个万金油，安装Hadoop的HA的时候就会用到它，以后的Hbase也会用到它。它一般用来存放一些相互协作的信息，这些信息比较小一般不会超过1M，都是使用它的软件对它有依赖，对于我们个人来讲只需要把它安装正确，让它正常的run起来就可以了。

Mysql：我们学习完大数据的处理了，接下来学习学习小数据的处理工具mysql数据库，因为一会装hive的时候要用到，mysql需要掌握到什么层度那?你能在Linux上把它安装好，运行起来，会配置简单的权限，修改root的密码，创建数据库。这里主要的是学习SQL的语法，因为hive的语法和这个非常相似。

Sqoop：这个是用于把Mysql里的数据导入到Hadoop里的。当然你也可以不用这个，直接把Mysql数据表导出成文件再放到HDFS上也是一样的，当然生产环境中使用要注意Mysql的压力。

Hive：这个东西对于会SQL语法的来说就是神器，它能让你处理大数据变的很简单，不会再费劲的编写MapReduce程序。有的人说Pig那?它和Pig差不多掌握一个就可以了。

Oozie：既然学会Hive了，我相信你一定需要这个东西，它可以帮你管理你的Hive或者MapReduce、Spark脚本，还能检查你的程序是否执行正确，出错了给你发报警并能帮你重试程序，最重要的是还能帮你配置任务的依赖关系。我相信你一定会喜欢上它的，不然你看着那一大堆脚本，和密密麻麻的crond是不是有种想屎的感觉。

Hbase：这是Hadoop生态体系中的NOSQL数据库，他的数据是按照key和value的形式存储的并且key是唯一的，所以它能用来做数据的排重，它与MYSQL相比能存储的数据量大很多。所以他常被用于大数据处理完成之后的存储目的地。

Kafka：这是个比较好用的队列工具，队列是干吗的?排队买票你知道不?数据多了同样也需要排队处理，这样与你协作的其它同学不会叫起来，你干吗给我这么多的数据(比如好几百G的文件)我怎么处理得过来，你别怪他因为他不是搞大数据的，你可以跟他讲我把数据放在队列里你使用的时候一个个拿，这样他就不在抱怨了马上灰流流的去优化他的程序去了，因为处理不过来就是他的事情。而不是你给的问题。当然我们也可以利用这个工具来做线上实时数据的入库或入HDFS，这时你可以与一个叫Flume的工具配合使用，它是专门用来提供对数据进行简单处理，并写到各种数据接受方(比如Kafka)的。

Spark：它是用来弥补基于MapReduce处理数据速度上的缺点，它的特点是把数据装载到内存中计算而不是去读慢的要死进化还特别慢的硬盘。特别适合做迭代运算，所以算法流们特别稀饭它。它是用scala编写的。Java语言或者Scala都可以操作它，因为它们都是用JVM的。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/BBXz7WBXt.html

其他回答

第1个回答 2018-10-28

人们想开始学习大数据的时候，最常问我的问题是，“我应该学Hadoop（hadoop是一款开源软件，主要用于分布式存储和计算，他由HDFS和MapReduce计算框架组成的，他们分别是Google的GFS和MapReduce的开源实现。由于hadoop的易用性和可扩展性，因此成为最近流行的海量数据处理框架。）, 分布式计算，Kafka（Kafka是由LinkedIn开发的一个分布式基于发布/订阅的消息系统）,NoSQL（泛指非关系型的数据库）还是Spark（Spark 是一种与 Hadoop 相似的开源集群计算环境，但是两者之间还存在一些不同之处）？”而我通常只有一个答案：“这取决于你究竟想做什么。”与大数据相关的工作？

(1)大数据系统研发工程师：负责大数据系统研发工作，包括大规模非结构化数据业务模型构建、大数据存储、数据库架构设计以及数据库详细设计、优化数据库构架、解决数据库中心建设设计问题。他们还负责集群的日常运作、系统的监测和配置、Hadoop与其他系统的集成。(2)大数据应用开发工程师：负责搭建大数据应用平台、开发分析应用程序。他们熟悉工具或算法、编程、包装、优化或者部署不同的MapReduce事务。他们以大数据技术为核心，研发各种基于大数据技术的应用程序及行业解决方案。(3)大数据分析师：运用算法来解决分析问题，并且从事数据挖掘工作。他们最大的本事就是能够让数据道出真相;此外，他们还拥有某个领域的专长，帮助开发数据产品，推动数据解决方案的不断更新。(4)数据可视化工程师：具备良好的沟通能力与团队精神，责任心强，拥有优秀的解决问题的能力。他们负责在收集到的高质量数据中，利用图形化的工具及手段的应用，一目了然地揭示数据中的复杂信息，帮助企业更好的进行大数据应用开发，发现大数据背后的巨大财富。

你适合大数据什么方向呢？现在我们已经了解了行业中可供选择的职业种类，让我们想办法来确定哪个领域适合你。这样，我们才能确定你在这个行业中的位置。通常来说，基于你的教育背景和行业经验可以进行分类。例1：“我是一名计算机科学毕业生，不过没有坚实的数学技巧。”你对计算机科学或者数学有兴趣，但是之前没有相关经验，你将被定义为一个新人。例2：“我是一个计算机科学毕业生，目前正从事数据库开发工作。”你的兴趣在计算机科学方向，你适合计算机工程师（数据相关工程）的角色。

大数据学习之路核心是，大部分大数据技术都是用Java或Scala编写的。但是别担心，如果你不想用这些语言编写代码，那么你可以选择Python或者R，因为大部分的大数据技术现在都支持Python和R。因此，你可以从上述任何一种语言开始。我建议选择Python或Java。接下来，你需要熟悉云端工作。这是因为如果你没有在云端处理大数据，没有人会认真对待。请尝试在AWS，softlayer或任何其他云端供应商上练习小型数据集。他们大多数都有一个免费的层次，让学生练习。如果你想的话，你可以暂时跳过此步骤，但请务必在进行任何面试之前在云端工作。接下来，你需要了解一个分布式文件系统。最流行的分布式文件系统就是Hadoop分布式文件系统。在这个阶段你还可以学习一些你发现与你所在领域相关的NoSQL数据库。

大数据学习之路核心是，大部分大数据技术都是用Java或Scala编写的。但是别担心，如果你不想用这些语言编写代码，那么你可以选择Python或者R，因为大部分的大数据技术现在都支持Python和R。因此，你可以从上述任何一种语言开始。我建议选择Python或Java。接下来，你需要熟悉云端工作。这是因为如果你没有在云端处理大数据，没有人会认真对待。请尝试在AWS，softlayer或任何其他云端供应商上练习小型数据集。他们大多数都有一个免费的层次，让学生练习。如果你想的话，你可以暂时跳过此步骤，但请务必在进行任何面试之前在云端工作。接下来，你需要了解一个分布式文件系统。最流行的分布式文件系统就是Hadoop分布式文件系统。在这个阶段你还可以学习一些你发现与你所在领域相关的NoSQL数据库。

第2个回答 2019-12-03

1.首先，我们想学习大数据，就要了解一下大数据的前景。大数据广泛应用于电网运行、经营管理及优质服务等各大领域，并正在改变着各行各业，也引领了大数据人才的变革。大数据就业前景怎么样?这对于在就业迷途中的我们是一个很重要的信息。随着国家重视大数据，政府扶持大数据，大数据在企业中生根发芽，开花结果。未来三至五年，中国需要180万数据人才，但目前只有约30万人。到2020年，企业基于大数据计算分析存储、数据挖掘、数据分析等数据产业的发展，我国需要更多的数据人才。
2.学大数据之前，要有一定的电脑基础，如果对电脑一窍不通，那么无法快速接触，因为大数据就是电脑专业。大数据属于编程，学大数据JAVA这一块很重要，JAVA是学习大数据的基础。正所谓基础打捞才能学得更好。
3.我介意去专业的电脑学校学习，学校从办学开始就一张从事计算机专业，那么学校就会有专业的老师，专业的设备。

第3个回答 2020-08-13

大数据相对来说适合有基础的人学习，没有基础不建议学大数据学大数据一定要有方向，你可以按照大数据路线图的顺序学习，选择大数据培训机构的时候重点关注机构的口碑情况，好的大数据培训机构口碑都是比较不错的，除了口碑再了解一下机构的课程体系、就业信息、费用花销等等方面，多对比几家机构，希望你早日学有所成。

大数据路线图

第4个回答 2013-08-13

通个人观点，最通俗的讲就是：现在的市场模式是商场一般是在人居住最多的附近开，这样大家会集中去一个地方购物消费，类似于淘宝建立了一个商店，大家都集中在一个地方购物。
而大叔据是恰恰相反的市场模式，通过互联网大家之间没有什么距离了，剩下的就是靠商家搜集大家平时的搜索关键词，对产品的不满意，以及想法搜集整理，然后做出产品在满足市场需求的一个模式，这个包含了市场调研的工作。大大节省开发成本和人们需求的判断。

以前公司是自己去调研，然后开发产品，再通过销售中用户的意见进一步改进
而大叔据的来临，我们可以通过互联网非常方便的搜集信息，然后进行调研，问答然后做出更加完善的产品，就是产品的更新周期将大大压缩，凡是一成不变的公司将全部死掉

大叔据时代是人人创业的时代，谁发现需求，谁去满足需求就可以盈利
所以也算是一个乱世，群雄四起。也是细分化市场的年代

大叔据说到底就是人们的行为习惯而已，商人利用的只是数据中的需求数据部分本回答被网友采纳

1 2 3 4 5 下一页

相似回答

零基础学大数据,先掌握哪些知识点?答：️熟练掌握常用大数据工具熟练掌握一些常用的大数据工具也必不可少。例如excel等工具能大大提升你的工作效率。‍用心实践别忘了用心实践。从日常案例开始,锻炼自己的洞察力,或通过搜索引擎查找优秀的大数据案例来学习。掌握正确的学习方法大数据时代,机会与挑战并存。掌握正确的学习方法,你也能在这个时代...

零基础如何学习大数据答：人们对大数据是越来越不陌生,很多朋友已经领悟到,未来要想在IT行业中有所作为,掌握大数据技术是个相当大的突破口,学好大数据未来前途不愁,钱途自有,电脑培训发现很多零基础朋友也纷纷开始学大数据,那么0基础可以学大数据吗\零基础如何学习大数据参加专业的大数据培训零基础学大数据其实是存在窍门的,有什么样的窍门呢...

怎样学习大数据答：怎样学习大数据如下：1、数据汇集在进行大数据融合分析应用场景中，数据是最基础的保障，需要汇聚多类数据。面向多源异构数据源进行指标与标签的构建和融合，将不同的数据源的数据进行有效的整合，构建预警预测的能力，形成面向各个领域的动态感知能力。多渠道方式进行数据汇集，包括库表和文件的共享交换、数...

如何学习大数据分析的知识?答：学习大数据分析的知识需要掌握以下几个方面：1.数学基础：大数据分析涉及到很多数学知识，如线性代数、概率论、统计学等。因此，首先需要具备扎实的数学基础。2.编程技能：大数据分析通常使用编程语言进行数据处理和分析，如Python、R等。因此，需要学习并熟练掌握至少一种编程语言。3.数据库知识：大数据分析...

大数据技能:掌握必备技能,快速入行答：想要快速掌握大数据技能,尽早涉足这个充满机会的领域,为你的职业生涯添砖加瓦吗?许多有志于学习大数据的朋友们都在寻找学习的捷径。那么,如何才能最快地学会大数据呢?接下来,北大青鸟将为你揭晓这个问题的答案!掌握大数据技能的前提想要掌握大数据技能,了解它究竟涵盖哪些内容是至关重要的。从Java、Scala到Shell、...

如何学习大数据计算?答：1、了解大数据的理论知识学习一门课程，首先你对这门课程要有简单的了解，比如说要先学习这门课程的一些专业术语，学习一些入门的概念，知道这门课程是做什么的，主要学习的有那些知识。学习大数据开发也是一样，你要知道什么是大数据，一般大数据主要运用在那些领域。避免自己在对大数据一无所知的情况下就...

0基础如何学习大数据?答：第一阶段：Java语言基础，只需要学习Java的标准版JavaSE就可以了，做大数据不需要很深的Java 技术，当然Java怎么连接数据库还是要知道。第二阶段：Linux精讲(因为大数据相关软件都是在Linux上运行的，所以Linux要学习的扎实一些，学好Linux对你快速掌握大数据相关技术会有很大的帮助，能让你更好的理解hadoop...

如何选择大数据学习方式:自学会还是参加培训?答：大数据是一个庞大的领域,涵盖的知识面非常广泛。当你想要学习大数据时,你可能会遇到一个难题:自学还是参加培训?本文将为你提供一些参考意见,帮助你做出决策。自学的优点自学是一种省钱的学习方式,完全符合我们的DIY精神。但是,大数据涵盖的知识面非常广泛,自学可能会让你迷失在信息的海洋中。遇到难题时,你可能需要...

大家正在搜