个人理财 测量用于机器学习的矢量之间的相似性 - 虚拟

测量用于机器学习的矢量之间的相似性 - 虚拟

目录:

Anonim

如果将每个变量视为矢量,可以使用计算方法轻松比较数据中的示例。以下信息描述了如何测量矢量之间的相似性以执行诸如计算用于学习目的的矢量之间的距离等任务。

了解相似性

在矢量形式中,可以将示例中的每个变量看作一系列坐标,每个坐标指向不同空间维度中的一个位置。如果一个矢量有两个元素,即它只有两个变量,那么使用它就好像在地图上检查一个物体的位置一样,使用第一个数字作为东西轴上的位置,南轴。

<! --1 - >

在图表上绘制的值的示例。例如,括号(1,2)(3,2)和(3,3)之间的数字都是点的例子。每个示例都是一个有序的值列表(称为元组),可以使用x(横轴)列表的第一个值和y(纵轴)的第二个值,轻松定位和打印在地图上。结果是散点图。

如果数据集以矩阵形式具有许多数字要素(列),理想情况下要素的数量表示数据空间的维度,而行(示例)表示每个点,这在数学上是一个矢量。当你的向量有两个以上的元素时,可视化变得麻烦,因为代表三维以上的维度是不容易的(毕竟,我们生活在一个三维世界)。

<!但是,您可以通过某种方便的方式努力传达更多的维度,例如通过使用尺寸,形状或其他维度的颜色。显然,这不是一件容易的事情,而且结果往往远非直观。但是,您可以通过系统地打印许多图形,同时考虑两维的维度,来掌握点在数据空间中的位置。这样的图被称为散点图的矩阵。

不要担心多维性。你将你在二维或三维中学到的规则扩展到多维,所以如果一个规则在二维空间中工作,它也可以工作在多维空间中。因此,所有的例子首先是指二维的例子。

计算学习距离

算法可以通过使用使用距离测量的数字向量来学习。通常你的向量所暗示的空间是一个度量空间,它的距离是相对于某些特定条件的:

不存在负距离,只有当起点和终点重合时,距离才为零(称为

非负性

  • )。 从一个点到另一个的距离是相同的,反之亦然(称为 对称
  • )。 初始点与最终点之间的距离始终大于或等于从初始点到第三个点的距离,从那里到最后一个点(称为 三角形不等式< - 这意味着没有捷径)。测量度量空间的距离是欧几里德距离,曼哈顿距离和切比雪夫距离。这些都是适用于数字向量的距离。欧几里得距离
  • 欧几里德距离最常见,也被描述为两个向量的l2范数(阅读关于l1,l2和linfinity范数的讨论)。在二维平面上,欧几里德距离以连接两点的直线为基准,并将其计算为两个向量元素之间的平方差之和的平方根。在前面的图中,点(1,2)和(3,3)之间的欧几里德距离可以在R中计算为sqrt((1-3)^ 2 +(2-3)^ 2),这导致了距离大约为2. 236. 曼哈顿距离 另一个有用的测量是曼哈顿距离(也被描述为两个向量的l1范数)。通过求和向量的元素之间的差值的绝对值来计算曼哈顿距离。如果欧几里得距离是最短路线,那么曼哈顿距离标志着最长的路线,类似于在城市中出租车的方向。 (距离也被称为出租车或城市距离)。例如,曼哈顿点(1,2)和(3,3)之间的距离是abs(1-3)和abs(2-3 ),结果为3.

切比雪夫距离

切比雪夫距离或最大度量取向矢量元素之间绝对差的最大值。这是一个距离度量,可以表示一个国王如何在国际象棋游戏中移动,或者在仓库物流中,由一个高架起重机将一个箱子从一个地方移动到另一个地方所需的操作。在机器学习中,切比雪夫距离可以被证明是有用的,当你有很多要考虑的维度时,它们中的大多数只是无关紧要或者多余的(在切比雪夫,你只是选择绝对差异最大的那个)。在上面使用的例子中,距离仅为2,(1-3)和abs(2-3)之间的最大值。

测量用于机器学习的矢量之间的相似性 - 虚拟

编辑的选择

特权的基础知识在Oracle 12c - 虚拟机

特权的基础知识在Oracle 12c - 虚拟机

用户可以在Oracle 12c数据库中完成。您可能希望允许用户能够登录,但是您可能需要限制用户是否可以执行以下任一任务:访问某些数据开始...

Oracle 12c恢复管理器(RMAN)目录 - 傻瓜

Oracle 12c恢复管理器(RMAN)目录 - 傻瓜

的基础知识Oracle 12c恢复管理器(RMAN)环境,请考虑恢复目录。恢复目录是所有RMAN配置参数,备份操作和元数据的存储库。该目录可以无限期地存储备份信息。如何在Oracle 12c中选择目录模式RMAN提供了两种用于存储备份数据的选项:NOCATALOG ...

如何验证,查看和关闭Oracle 12c审计 - 傻瓜

如何验证,查看和关闭Oracle 12c审计 - 傻瓜

打开数据库中的审计记录,跟踪您制定的审计,以便您了解所做的事情。幸运的是,Oracle 12c在数据库中提供了一些视图来帮助您跟踪自己的操作:要验证您为审计配置的系统特权,请使用视图AUDIT_UNIFIED_POLICIES。要查看...

编辑的选择

何时按摩你的宝宝 - 假人

何时按摩你的宝宝 - 假人

你不需要花哨的设备,特殊的房间或大量的免费给宝宝一个很好的按摩时间。面对现实吧。妈妈是忙碌的人这里只是一些好的时候按摩你的宝宝的想法:按摩到你的日常工作:在你的宝宝午睡之前或之后给予按摩。 ...

成为一名保姆是什么?假人

成为一名保姆是什么?假人

是一个保姆是否是您正确的职业选择?也许你照顾你的弟弟姐妹,或者你总是被你的邻居叫到照顾,或者你只是热衷于与孩子们的工作。做一个保姆可能是你一个伟大的职业选择。信贷:©IStockphoto。 com / Piotr Marcinski What ...

编辑的选择

更改MYOB中的文本和日期 - 虚拟人物

更改MYOB中的文本和日期 - 虚拟人物

MYOB为您提供了许多快捷方式以帮助简化任务。例如,您可以像在任何文字处理器中那样在MYOB中复制和粘贴文本。以下是快捷方式:按键组合快捷键结果Ctrl-A选择所有高亮显示的文本Ctrl-C复制文本Ctrl-V粘贴文本Ctrl-X删除或剪切文本Ctrl-Z取消最后一位...

在Salesforce中创建视图。当您单击Salesforce中的某个选项卡以访问特定对象(例如“帐户”,“联系人”或“个案”)时,您可以在对象主页上找到自己的服务云 - 虚拟

在Salesforce中创建视图。当您单击Salesforce中的某个选项卡以访问特定对象(例如“帐户”,“联系人”或“个案”)时,您可以在对象主页上找到自己的服务云 - 虚拟

主页,如果你选择案例,如图所示)。案例主页。当您点击Salesforce中的一个选项卡以访问特定的对象(例如,帐户,联系人或个案)时,您可以看到一些较大的,勾勒出的最近案例,报告和矩形的矩形。