视频: 王家林Spark视频第1课:大数据最火爆语言Scala光速入门 2024
在任何严肃的Hadoop项目中,您都应该首先将IT与VP的业务领导者联系起来,解决您的业务的难题 - 那些在每个人心中都会遇到的问题(真实的或感知的)。企业希望从IT投资中看到价值,而使用Hadoop可能会有多种方式。例如,您可能会追求一个项目,其目标是为仓库数据创建较低的许可和存储成本,或从大规模数据分析中找到洞察力。要请求资源来资助有趣的Hadoop项目,最好的方法是与您的业务领导合作。 <! --1 - >
还要检查组织中采用Hadoop的人员和流程的观点。当采用者通过促进实验和数据探索来努力创建支持数据科学的文化时,Hadoop部署往往是最成功的。很简单,在创建Hadoop集群之后,您仍然有工作要做 - 您仍然需要让人们以实际的方式进行实验。
<!实际上,您应该注意以下三个重要目标:确保您的业务用户和分析人员能够访问尽可能多的数据。当然,您仍然必须尊重数据隐私等标准的监管要求。要求您的Hadoop开发人员公开其逻辑,以便可以通过组织中的标准工具访问结果。逻辑和任何结果必须保持容易消耗和可重用。
识别您计划在Hadoop中存储的数据的治理要求。
-
在关系数据库管理系统(RDBMS)中的治理控制下的任何数据也需要在Hadoop中的相同控制之下。毕竟,无论存储在哪里,个人身份信息都具有相同的隐私要求。很简单,您应该确保您可以通过RDBMS和Hadoop的数据审计! 当您将Hadoop与更广泛的业务及其存储库(如数据库和文档存储)结合使用时,您可以更全面地了解业务中发生的情况。例如,在Hadoop中执行的社交情绪分析可能会提醒您
-
人们在说什么,但是您知道他们为什么说他们是 吗?
这个概念需要超越Hadoop的思考,并将公司的记录系统(例如销售)与其参与系统(如呼叫中心记录 - 您可能从中吸取的数据)联系起来。 -