Apache Hadoop 是一种用于大数据分布式计算的开源解决方案

大数据是一个营销术语,涵盖了从搜索引擎、通过积分卡跟踪的杂货店购买模式等来源挖掘数据的整个概念。在现代世界中,互联网有很多数据源,通常情况下,如果不进行处理,规模会使其无法使用,并且任何一台服务器都需要花费大量时间。进入 Apache Hadoop

更短的数据处理时间

通过利用 Hadoop 架构将处理任务分布在网络上的多台机器上,处理时间显着减少,并且可以以合理的数量确定答案的时间。 Apache Hadoop 分为两个不同的组件:存储组件和处理组件。用最简单的话说,Hapood用多台物理机制作了一台虚拟服务器。实际上,Hadoop 管理多台机器之间的通信,以使它们足够紧密地协同工作,看起来好像只有一台机器在进行计算。数据分布在多台机器上进行存储和处理任务由 Hadoop 架构分配和协调。这种类型的系统是将原始数据转换为大数据输入规模的有用信息的要求。考虑一下谷歌每秒从用户输入搜索请求时收到的数据量。作为数据的总块,您不知道从哪里开始,但 Hadoop 会自动将数据集缩减为更小、有组织的数据子集,并将这些可管理的子集分配给特定资源。然后将所有结果报告回来并组合成可用信息

易于设置的服务器

虽然系统听起来很复杂,但大多数活动部件都被抽象化了。 设置 Hadoop 服务器相当简单,只需在满足系统要求的硬件上安装服务器组件即可。较难的部分是规划 Hadoop 服务器的计算机网络将用于分配存储和处理角色。这可能涉及设置局域网或通过 Internet 将多个网络连接在一起。您还可以利用现有的云服务并在 Microsoft Azure 和 Amazon EC2 等流行的云平台上购买 Hadoop 集群。这些更容易配置,因为您可以临时启动它们,然后在不再需要它们时停用集群。这些类型的集群非常适合测试,因为您只需为 Hadoop 集群处于活动状态的时间付费。

处理您的数据以获取您需要的信息

大数据是一种极其强大的资源,但除非能够正确分类并转化为信息,否则数据是无用的。目前,Hadoop 集群提供了一种极具成本效益的方法,用于将这些数据集合处理为信息。

  • 赞成

    • 利用强大的 MapReduce 和分布式文件功能来处理过大的数据集合的绝佳方式
    • 是开源的,可在您自己的硬件集群上使用
    • 可通过 Microsoft Azure 和 Amazon EC2 等流行的云平台使用
  • 反对

    • 不适合外行,应该有一些技术专长才能管理和利用
    • 基于Linux,不适合所有用户

应用参数

应用程式 提供其他语言版本



用户对 Apache Hadoop 的评分

您是否尝试过 Apache Hadoop?成为第一个离开您的意见!

您还可能喜欢:

Apache Hadoop 的替代软件

探索应用

有关使用此软件的法律因国家/地区而异。 如果违反这些法律,我们不鼓励或纵容此程序的使用。
Softonic
您对 Apache Hadoop 的评分
Softonic

Softonic,我们会扫描托管在我们的平台上的所有文件,以评估您的设备面临的任何潜在危害并帮您避免。 每当有新文件上传时,我们的团队都会执行检查,且会定期审核各个文件以确认或更新其状态。 通过这一全面的流程,我们能够设置任何可下载文件的状态,如下所示:

清洁

该软件程序极有可能是清洁程序。

这意味着什么?

我们已使用超过 50 个世界领先的防病毒服务扫描文件以及与该软件程序相关联的网址;没有检测到任何可能的威胁。

警告

该软件程序可能是恶意程序,或可能包含不必要的捆绑软件。

为什么该软件程序仍然可用?

根据我们的扫描系统,我们已确定这些举报可能是误报

什么是误报?

误报意味着由于防病毒程序中使用了过于宽泛的检测签名或算法,某个无害程序被错误地举报为恶意程序。

我们要不时强调以下这一点:我们可能会漏掉潜在恶意软件程序。 为继续向您做出程序目录和应用目录无恶意软件的承诺,我们的团队在每个目录页面集成了一项举报软件功能,该功能会将您的反馈回送给我们。

您可以举报遇到的任何特定问题,Softonic 会尽快为您解决相应问题。