视频: 魅族16s旗舰手机发布会全程2小时【完整高清版】 2024
机器学习在很大程度上取决于样本数据。这部分数据很重要,因为你想发现一个世界的观点,就像所有的观点一样,它可能是错误的,扭曲的,或者仅仅是部分的。你也知道你需要一个样例外的例子来检查学习过程是否正常。但是,这些方面只是形象的一部分。
当你使用一个机器学习算法来处理数据,以便猜测某个特定的响应时,你实际上正在赌博,而赌博不仅仅是因为你用来学习的样本。还有更多。目前,假设您可以自由地获得合适的,不带偏见的样本数据,所以数据不是问题。相反,你需要专注于学习和预测的方法。
<! - 1 - >首先,您必须考虑到您认为该算法可以合理地猜测响应。你不能总是做这个假设,因为无论你事先知道什么,都不可能找出某些答案。例如,你不能通过了解他们以前的历史和行为来完全确定人类的行为。也许在我们的行为(例如我们的非理性部分)的生成过程中涉及到随机效应,或者问题归结为自由意志(这个问题也是一个哲学/宗教问题,而且有很多不和谐的意见)。因此,只能猜测某些类型的反应,而对于其他许多类型的反应,例如当您试图预测人们的行为时,您必须接受一定程度的不确定性,运气好的话可以接受您的目的。
<!其次,你必须考虑到你所赌注的信息与你想要预测的回应之间的关系可以用某种数学公式来表示,而你的机器学习算法实际上是能够猜测公式的。算法的能力来猜测响应背后的数学公式,这本质上就是嵌入算法的核心。
一些算法几乎可以猜到任何东西;其他人实际上有一套有限的选择。算法可以猜测的可能数学公式的范围是其可能假设的集合。因此,一个假设是一个单一的算法,在所有的参数中都有规定,因此能够具有单一的具体公式。数学是太棒了。它可以用一些简单的符号来描述现实世界的大部分内容,它是机器学习的核心,因为任何学习算法都有一定的表示数学公式的能力。一些算法,例如线性回归,明确地使用特定的数学公式来表示响应(例如房屋的价格)如何与一组预测信息(例如市场信息,房屋位置,房地产表面,等等)。一些配方是如此复杂和复杂,即使在纸上表示它们是可能的,但实际上这样做太困难了。其他一些复杂的算法,如决策树,没有一个明确的数学公式,但是适应性很强,可以很容易地设定大量的公式。作为一个例子,考虑一个简单的,容易解释的公式。线性回归只是响应和所有预测因子给出的坐标空间中的一条线。在最简单的例子中,您可以使用
y =β1
x
1
+β 的公式的响应y和单个预测变量x 0 在单个特征预测的简单情况下,当您的数据排列成一条线时,此模型是完美的。但是,如果不是这样,会怎样呢?为了表示情况,只需观察以下二维表示。挣扎绘制曲线函数的线性模型的例子。 当点类似于线条或云,当您发现结果是直线时会发生一些错误;因此上述公式提供的映射在某种程度上是不精确的。然而,这个错误并不是系统地出现,而是随机的,因为有些点位于映射线之上,而另一些点位于映射线之下。曲线形状的点云的情况是不同的,因为这个时间线有时是准确的,但在其他时候系统地错误。有时点总是在线以上;有时他们低于它。考虑到其响应映射的简单性,您的算法往往会系统地高估或低估数据背后的真实规则,代表其偏好。偏见是更简单的算法的特点,不能表达复杂的数学公式。