目录:
- 第一定律:企业目标
- 这里是数据挖掘的第二定律,或者“商业知识法”:
- 第四定律:右模
- 这里是数据挖掘的第五定律:
- 第七定律:预测
- 数据挖掘结果的值不是由预测模型的准确性或稳定性决定的。数据挖掘者对理论不感兴趣。作为一名数据挖掘者,你甚至可能永远不知道你使用的统计模型背后的理论。也许这也是一样,因为在数据挖掘中,你将会以不一定与其背后的理论相符的方式来使用这些模型。
视频: 民法 総則編#9 「法律行為」解説 【動画で民法がわかーる。】 2024
每个行业都有它的指导原则,提供结构和指导,在日常的工作思路。数据挖掘也不例外。以下是在您开始工作并成为数据挖掘者时指导您的九个基本想法。这是数据挖掘的9条定律,正如开拓性数据挖掘者Thomas Khabaza最初指出的那样。
第一定律:企业目标
下面是数据挖掘的第一定律,即“业务目标法”: 的经营宗旨是每一个数据挖掘解决方案的由来。
<! --1 - >您可以通过探索数据来查找有助于更好地开展业务的信息。这不应该是所有业务数据分析的口头禅吗?当然应该!然而,新手数据挖掘者往往把重点放在技术和其他细节上,这可能是有趣的,但并不符合执行决策者的需求和目标。
你要开发识别做其他事情之前的业务目标,并专注于这些目标在数据挖掘过程的每一步的习惯。这条法律首先是重要的。每个人都应该明白,数据挖掘是一个有目的的过程。
<!第二定律:商业知识这里是数据挖掘的第二定律,或者“商业知识法”:
商业知识是数据挖掘过程中每一步的核心。数据挖掘为人们(商人)提供了力量,他们利用他们的商业知识,经验和洞察力以及数据挖掘方法来找到数据中的含义。 您不必成为一名花哨的统计师来进行数据挖掘,但您必须了解数据的含义以及业务的运作方式。只有当你理解了数据和你需要解决的问题时,数据挖掘过程才能帮助你发现有用的信息并使用它。
<!数据准备
这里是数据挖掘的第三定律或“数据准备法”:
数据准备在每个数据挖掘过程中占一半以上。传统的统计学家通常有机会收集新的数据来解决特定的研究问题。他们可能会使用严格的流程来设计实验,设计调查问卷的研究或以其他方式收集是有针对性的具体的研究目标,高质量的数据。然而,毕竟,他们还是花了很多时间清理和准备数据进行分析。另一方面,数据挖掘者几乎总是要处理任何可用的数据。他们使用现有的业务记录,公共数据或他们可以购买的数据。有可能,所有这些数据都是为数据挖掘以外的其他目的而收集的,没有任何严格的计划或仔细的数据收集过程。所以数据挖掘者花费大量时间准备数据。第四定律:右模
这里是数据挖掘的第四定律,或者“NFL-DM”: 给定应用的正确模型只能通过实验发现。
这个规则也被速记NFL-DM所知,这意味着数据挖掘者没有免费的午餐。首先,什么是模型?这是一个代表在数据中观察到的模式的等式。至少,这是一个粗略的模式。真实事物的数学模型从来都不是完美的!这是生活中的事实,对于核物理学家来说,数据挖掘者也是如此。在数据挖掘中,通过反复试验来选择模型。您将尝试不同的模型类型。
第五定律:样式
这里是数据挖掘的第五定律:
总是有样式的。 作为一名数据挖掘者,您将探索数据来搜索有用的模式。换句话说,你会在数据中寻找有意义的关系。了解这些关系可以更好地理解业务,更好地预测未来会发生什么。最重要的是,了解数据中的模式可以让你影响将来发生的事情。你总是找到模式。数据总是有东西告诉你。有时候,它确认你所做的是对的。这可能看起来并不令人兴奋,但至少它告诉你,你一直在正确的轨道上。其他日子,数据可能会告诉你,你目前的商业行为不起作用。这是令人兴奋的,尽管在短期内可能并不愉快,但了解真相是朝着改进迈出的重要一步。
第六定律:放大
以下是数据挖掘的第六定律或“洞察法则”:数据挖掘放大了商业领域的感知。
数据挖掘方法使您能够比没有它们的情况更好地理解您的业务。数据挖掘方法可以帮助您像放大镜或显微镜,从而发现通过普通报告难以或不可能发现的效应。数据挖掘不是即时的。通过数据挖掘的发现和学习是一个交互过程。你会发现,从他们每个人中找出一点点,并用你发现的来采取行动。您尝试的每个操作的结果都会生成更多的数据,而且这些数据可以让您更加了解其他内容。这是一个发现的循环,只要你继续探索和实验,循环就会持续下去。
第七定律:预测
这里是数据挖掘的第七定律或“预测定律”: 预测通过泛化在局部增加信息。数据挖掘可帮助您使用您所知的数据来更好地预测(或估算)您不知道的事情。数据挖掘使用数据和建模方法,以数据驱动的,一致的和更准确的估计来取代您的非正式期望。
第八定律:价值
以下是数据挖掘的第八定律或“价值定律”:
数据挖掘结果的值不是由预测模型的准确性或稳定性决定的。数据挖掘者对理论不感兴趣。作为一名数据挖掘者,你甚至可能永远不知道你使用的统计模型背后的理论。也许这也是一样,因为在数据挖掘中,你将会以不一定与其背后的理论相符的方式来使用这些模型。
你会寻找能产生正确预测的模型(你将用测试而不是统计理论来判断)。但是,您可能更关心其他问题,例如模型是否具有商业意义,是否意识到意外的预测因素,或者是否适合在您的工作场所中使用。 第九定律:改变
这里是数据挖掘的第九定律,或者“变化规律”:
所有的模式都是可以改变的。世界总是在变化。今天给你很好的预测的模型明天可能没用。对于所有的数据分析师来说,这是一个事实,而不仅仅是数据挖掘者。