个人理财 成功使用Hadoop - 傻瓜

成功使用Hadoop - 傻瓜

视频: 王家林Spark视频第1课:大数据最火爆语言Scala光速入门 2025

视频: 王家林Spark视频第1课:大数据最火爆语言Scala光速入门 2025
Anonim

在任何严肃的Hadoop项目中,您都应该首先将IT与VP的业务领导者联系起来,解决您的业务的难题 - 那些在每个人心中都会遇到的问题(真实的或感知的)。企业希望从IT投资中看到价值,而使用Hadoop可能会有多种方式。例如,您可能会追求一个项目,其目标是为仓库数据创建较低的许可和存储成本,或从大规模数据分析中找到洞察力。要请求资源来资助有趣的Hadoop项目,最好的方法是与您的业务领导合作。 <! --1 - >

还要检查组织中采用Hadoop的人员和流程的观点。当采用者通过促进实验和数据探索来努力创建支持数据科学的文化时,Hadoop部署往往是最成功的。很简单,在创建Hadoop集群之后,您仍然有工作要做 - 您仍然需要让人们以实际的方式进行实验。

<!实际上,您应该注意以下三个重要目标:确保您的业务用户和分析人员能够访问尽可能多的数据。

当然,您仍然必须尊重数据隐私等标准的监管要求。要求您的Hadoop开发人员公开其逻辑,以便可以通过组织中的标准工具访问结果。逻辑和任何结果必须保持容易消耗和可重用。

识别您计划在Hadoop中存储的数据的治理要求。

  • 在关系数据库管理系统(RDBMS)中的治理控制下的任何数据也需要在Hadoop中的相同控制之下。毕竟,无论存储在哪里,个人身份信息都具有相同的隐私要求。很简单,您应该确保您可以通过RDBMS和Hadoop的数据审计! 当您将Hadoop与更广泛的业务及其存储库(如数据库和文档存储)结合使用时,您可以更全面地了解业务中发生的情况。例如,在Hadoop中执行的社交情绪分析可能会提醒您

  • 人们在说什么,但是您知道他们为什么说他们是 吗?

    这个概念需要超越Hadoop的思考,并将公司的记录系统(例如销售)与其参与系统(如呼叫中心记录 - 您可能从中吸取的数据)联系起来。
成功使用Hadoop - 傻瓜

编辑的选择

记录您的思科网络配置与CDP - 傻瓜

记录您的思科网络配置与CDP - 傻瓜

记录思科网络配置有时没有思科发现协议)可能需要花费数小时在布线室跟踪电缆和记录端口。在某些情况下,配线室是一个真正的老鼠的电缆巢,并且可能需要几个小时的导航才能找出哪些交换机连接到哪个交换机,哪些路由器,...

以太网通道诊断信息收集 - 虚拟

以太网通道诊断信息收集 - 虚拟

诊断思科网络中的以太网通道问题,您首先必须能够收集您的交换机及其配置。为了执行这个任务,你一如既往地依靠Show和debug命令。首先,简要介绍一下show命令的内容。 Switch1> enable Switch1#configure terminal Switch2#show EtherChannel ...

扩展访问控制列表(ACL) - 虚拟

扩展访问控制列表(ACL) - 虚拟

扩展访问控制列表(ACL)允许您允许拒绝来自特定IP地址的流量到特定的目标IP地址和端口。它还允许您指定不同类型的流量,如ICMP,TCP,UDP等。不用说,它非常细化,可以使您非常具体。如果...

编辑的选择

电子项目计划步骤1:设想您的电子项目 - 傻瓜

电子项目计划步骤1:设想您的电子项目 - 傻瓜

设计和建立你的电子项目的细节,你应该退后一步,看看大局。首先,你需要确保你有一个坚实的想法为您的项目。你为什么要建立它?它会做什么,谁来使用它,为什么? ...

电子项目计划步骤4:构建您的电路 - 傻瓜

电子项目计划步骤4:构建您的电路 - 傻瓜

而且你对它的操作感到满意,你可以建立一个永久版本的电路。虽然有几种方法可以做到这一点,但最常见的是在印刷电路板(也称为PCB)上构建电路。请注意,在PCB上组装电路...

电子项目计划步骤3:原型电路 - 假人

电子项目计划步骤3:原型电路 - 假人

永久的电路板,你会想确保它的工作。最简单的方法就是在无焊面包板上构建电路。无焊料面包板可以让您快速组装电路元件而不需要焊接任何东西。相反,您只需将其裸露在外...

编辑的选择

如何替换R中的文本 - 虚拟变量

如何替换R中的文本 - 虚拟变量

R中的sub()函数在文本模式,并用替换文本替换此模式。你使用sub()来替代文本文本,并使用其表兄gsub()来替换所有出现的模式。 (gsub()中的g表示全局。)假设你有句子He ...

中如何成功地遵循命名惯例在R - 傻瓜

中如何成功地遵循命名惯例在R - 傻瓜

R是非常自由的,对象和功能。这个自由是一个很大的祝福,同时也是一个很大的负担。没有人不得不遵循严格的规则,所以在R中编程的人基本上可以按照自己的意愿去做。如何选择一个正确的名字...

中使用函数在R中创建并转换脚本后,如何使用R - dummies中的函数

中使用函数在R中创建并转换脚本后,如何使用R - dummies中的函数

再次使用前面显示的Source()命令将其加载到控制台中。现在你看...什么也没有。 R并不让你知道它已经加载了这个函数,但它已经在工作空间中了,你可以检查一下...