简述Hadoop之后大亚博娱乐登录不了了--任意三数字加yabo.com直达官网的未来在谁的身上

2019-08-08 11:47:39??来源:今日头条

摘要:在实时亚博娱乐登录不了了--任意三数字加yabo.com直达官网世界里,为什么我们还这么执着于Hadoop? 根据451 Research调查亚博娱乐登录不了了--任意三数字加yabo.com直达官网显示,围绕批处理架构的Hadoop仍然是大亚博娱乐登录不了了--任意三数字加yabo.com直达官网的代表技术,尽管其声誉仍然超过实际部署情况。
关键词: 大亚博娱乐登录不了了--任意三数字加yabo.com直达官网
  本篇文章和读者们探讨一下Hadoop之后大亚博娱乐登录不了了--任意三数字加yabo.com直达官网的未来在谁的身上,对大亚博娱乐登录不了了--任意三数字加yabo.com直达官网开发感兴趣的小伙伴们就随小编来了解一下吧。
?
  在实时亚博娱乐登录不了了--任意三数字加yabo.com直达官网世界里,为什么我们还这么执着于Hadoop? 根据451 Research调查亚博娱乐登录不了了--任意三数字加yabo.com直达官网显示,围绕批处理架构的Hadoop仍然是大亚博娱乐登录不了了--任意三数字加yabo.com直达官网的代表技术,尽管其声誉仍然超过实际部署情况。下面我们来具体了解一下。
?
  批处理不是重点
?
  Cloudera的Doug Cutting是一个非常聪明的人,也是开源开发人员,Hadoop、Lucene等大亚博娱乐登录不了了--任意三数字加yabo.com直达官网工具的开发都有他的功劳。
?
  虽然Cutting承认实时流媒体技术的重要性,但他并没有否认面向批处理的Hadoop的价值,他表示:
?
  并不是因为我们觉得批处理是最好的,所以Hadoop围绕批处理而构建。批处理(特别是MapReduce)很自然是第一步,因为它相对容易部署,并提供很重要的价值。在Hadoop之前,没有办法使用开源软件在商品硬件存储和处理千兆字节。Hadoop的MapReduce是很大的进步。
?
  我们很难说清楚大亚博娱乐登录不了了--任意三数字加yabo.com直达官网的商品化对这个世界的重要性。这并不是说在Hadoop之前我们没有存储和分析大量亚博娱乐登录不了了--任意三数字加yabo.com直达官网,而是Hadoop让我们非常廉价地实现这个过程。
?
  总之,Hadoop民主化了大亚博娱乐登录不了了--任意三数字加yabo.com直达官网。
?
  转向流亚博娱乐登录不了了--任意三数字加yabo.com直达官网?
?
  然而,Hadoop并没有让大亚博娱乐登录不了了--任意三数字加yabo.com直达官网分析变得容易。正如DataStax首席布道者Patrick McFadin表示,从企业亚博娱乐登录不了了--任意三数字加yabo.com直达官网挖掘价值并没有那么简单:
?
  我们都听说过存储和分析PB级亚博娱乐登录不了了--任意三数字加yabo.com直达官网的投资回报率的问题。谷歌、雅虎和Facebook都在从中创造惊人的价值,而大部分企业都在试图研究如何分析所有亚博娱乐登录不了了--任意三数字加yabo.com直达官网,第一:收集所有亚博娱乐登录不了了--任意三数字加yabo.com直达官网;第二:……;第三:利润!
?
  在亚博娱乐登录不了了--任意三数字加yabo.com直达官网收集和利润之间有很多麻烦的步骤。随着企业试图加快对实时亚博娱乐登录不了了--任意三数字加yabo.com直达官网的分析能力,新技术为他们提供了可能。
?
  McFadin发现了这个新大亚博娱乐登录不了了--任意三数字加yabo.com直达官网堆栈的关键要素。首先是一个排队系统,Kafka、RabbitMQ和Kinesis等。然后是流处理层,这可能包括Storm、Spark Streaming或者Samza。对于高速存储,企业经常转向Cassandra、HBase、MongoDB或者MySQL等关系型亚博娱乐登录不了了--任意三数字加yabo.com直达官网库。
?
  最有趣的是批处理仍然有用武之地。McFadin表示,批处理现在可用于处理,即汇总和更深入的分析。批处理和实时的融合被称为“Lambda架构”,这涉及让三个元素和谐地共处:批处理、速度和服务。
?
  换句话说,批处理仍然有用。
?
  淘汰批处理
?
  但并不是每个人都同意。Zoomdata公司首席执行官和联合创始人Justin Langseth认为Lambda是“不必要的”,并称,“现在有端到端工具可以从采购、运输、存储到分析和可视化来处理亚博娱乐登录不了了--任意三数字加yabo.com直达官网,而不需要批处理”。
?
  在他看来,批处理是大亚博娱乐登录不了了--任意三数字加yabo.com直达官网过去的遗留物:
?
  实时亚博娱乐登录不了了--任意三数字加yabo.com直达官网显然最好应该作为流来处理,而且还可以加载历史亚博娱乐登录不了了--任意三数字加yabo.com直达官网,正如你的DVR可以加载电影《飘》或者上周的电视节目《美国偶像》到你的电视。这种区别很重要,Zoomdata认为将亚博娱乐登录不了了--任意三数字加yabo.com直达官网作为流来分析可以增加可扩展性和灵活性,而无论亚博娱乐登录不了了--任意三数字加yabo.com直达官网是实时还是历史亚博娱乐登录不了了--任意三数字加yabo.com直达官网。
?
  然而,超越可扩展性和灵活性好处的可能是将批处理从大亚博娱乐登录不了了--任意三数字加yabo.com直达官网过程移除所带来的简单性。Langseth认为,“当你不需要担心批处理窗口以及从批处理故障中恢复时,这可以极大地简化大亚博娱乐登录不了了--任意三数字加yabo.com直达官网架构。”
?
  流分析取代Hadoop?
?
  Cutting称,还没有那么快。
?
  Cutting认为未来Hadoop等技术并不会完全被淘汰,流分析会得以发展,Cloudera的Enterprise Data Hub也是一样。事实上,他不认为会广泛转向流分析,而是为大家带来了又一种选择。
?
  更有趣的是,大亚博娱乐登录不了了--任意三数字加yabo.com直达官网的大爆炸会让行业催生出一些好方法来应对亚博娱乐登录不了了--任意三数字加yabo.com直达官网处理。
?
  我认为我们不会再那么频繁地看到Spark这样的主要技术增加,随着时间的推移,我们将会标准化这些工具,为大多数人提供功能来满足其大亚博娱乐登录不了了--任意三数字加yabo.com直达官网应用需求。Hadoop带来了技术爆炸,但我们可能会进入比较正常的演化过程,在各行业广泛使用这些技术。
?
  DataStax社区经理Scott Hirleman同意说:“批处理并不会消失,总是会需要对大量亚博娱乐登录不了了--任意三数字加yabo.com直达官网的大规模分析。”现在大家对流分析有极大的兴趣,但称现在还不清楚这种趋势对大亚博娱乐登录不了了--任意三数字加yabo.com直达官网计划的影响。
?
  总之,流分析完全是关于“和”,而不是“或者”,这是对围绕批处理系统(例如Hadoop)的很好的补充,但这肯定不会完全取代Hadoop。

第二十九届CIO班招生
法国布雷斯特商学院MBA班招生
法国布雷斯特商学院硕士班招生
法国布雷斯特商学院DBA班招生
责编:yangjl