个人理财 如何在预测分析中应用任何群体簇 - 假人

如何在预测分析中应用任何群体簇 - 假人

Anonim

自组织小组的一个自然的例子,你可以应用在预测分析行为是蚂蚁寻找食物的殖民地。蚂蚁集体优化他们的轨道,使它总是以最短的路线可能的食物目标。即使你试图打扰蚂蚁的行进中的殖民地,阻止他们进入食物目标,他们很快就会回到正轨并(再次)找到食物目标的最短路线,所有这些都避免了同样的障碍物一边寻找食物。这种行为的一致性是可能的,因为每一只蚂蚁都会在地上沉积一条信息素。

<! - 1 - >

考虑一群蚂蚁在窝里闲着。当他们开始寻找食物时,他们完全没有关于在哪里找到它的信息。他们随机游行,直到个人找到食物;现在幸运的蚂蚁(叫它蚂蚁X)必须把它的发现传达给其余的蚂蚁 - 要做到这一点,它必须找到回巢。幸运的是,蚂蚁X一直在寻找食物时自己制造费洛蒙。它可以追踪自己的信息素回溯到巢。在返回巢穴的路上,蚂蚁X将信息素放在同一条路径上。

<!因此,蚂蚁X的踪迹将是所有其他蚂蚁之间最强的气味。最强大的信息素会吸引所有其他仍在寻找食物的蚂蚁。他们会遵循最强烈的气味。随着更多的蚂蚁加入蚂蚁的踪迹,他们增加更多的信息素,气味变强。很快,所有其他的蚂蚁都有强烈的气味跟随。

如果几只蚂蚁发现了相同的食物来源,那么与较长路径的蚂蚁相比,采用最短路径的蚂蚁会做更多的行程 - 因此会在最短路径上产生更多的信息素。个人与集体行为之间的关系是一个很有启发性的例子。

每个点代表一个文件。假设黑点是有关预测分析的文档,白点是有关人类学的文档。表示不同类型文档的点是随机分布在5个单元格的网格中。在网格中随机部署“蚂蚁”来搜索相似的文档。每个有值的单元格代表一个“信息素”的实例。 “使用文档矩阵,每个单元格的”信息素“值是从相应的文档中计算出来的。好吧,一个蚁群的集体智慧如何产生一个有效聚类数据的模型呢?答案就在于一个简单的比喻:蚂蚁正在他们的环境中搜寻食物,就像我们在数据集中寻找聚类一样 - 在一大批文档中寻找类似的文档。考虑一个你想按主题组织的文档的数据集。类似的文件将被分组到相同的群集中。这里的蚁群可以提供关于如何分组类似文件的提示。设想一个二维(2D)网格,您可以将文档表示为点。 2D网格被分成单元格。每个细胞都有一个与之相关的“信息素”(价值)。简而言之,“信息素”值区分给定单元格中的每个文档。

这些点最初是随机分布的 - 网格中的每个点代表一个独特的文档。下一步是在2D网格上随机部署其他点,模拟蚁群在其环境中搜索食物。这些点最初分散在与文档相同的二维网格中。

添加到网格中的每个新点代表一只蚂蚁。那些经常在蚁群算法中被称为

代理

的“蚂蚁”正在2D网格中移动。每个“蚂蚁”将拿起或放弃其他点(文件),取决于文件最好的属性。在这个比喻中,“食物”采取的文件形式足够相似,可以聚集在一起。

一只“蚂蚁”在网格中随机走动;如果遇到文档,则可以执行两个操作之一:选择或删除。每个单元格都有一个“信息素强度”,表示文档与其他文档(点)的相似程度 - 一个“蚂蚁”即将拾取或放下。

请注意,单元格3中的“蚂蚁”将拾取黑点文档,因为白色的“信息素”值占主导地位;并移动到与单元格4(几个黑点)中的值接近(类似)的单元格。搜索不断迭代,直到聚类形成。

实际上,“蚂蚁”通过执行两个操作之一,即拾取文档或删除文档,将文档从一个单元移动到另一个单元以形成集群。

当“蚂蚁”开始在网格上随机移动时,遇到一个点(文档)会导致“蚂蚁”从当前单元中拾取一个文档,随之移动,并将其放入单元格中足够的相似性以适应。

“蚂蚁”将如何确定放置文档的最佳单元格?答案是单元格中的值就像“信息素”一样 - 二维网格中的每个单元格都包含一个数值,可以用代表单元格中文档的方式进行计算。请记住,每个文档都被表示为一组数字或一组数字值。信息素的强度(数值)随着更多的文件被投入单元而增加 - 如果代表文件的数字被移出单元,则该值减小。

如何在预测分析中应用任何群体簇 - 假人

编辑的选择

记录您的思科网络配置与CDP - 傻瓜

记录您的思科网络配置与CDP - 傻瓜

记录思科网络配置有时没有思科发现协议)可能需要花费数小时在布线室跟踪电缆和记录端口。在某些情况下,配线室是一个真正的老鼠的电缆巢,并且可能需要几个小时的导航才能找出哪些交换机连接到哪个交换机,哪些路由器,...

以太网通道诊断信息收集 - 虚拟

以太网通道诊断信息收集 - 虚拟

诊断思科网络中的以太网通道问题,您首先必须能够收集您的交换机及其配置。为了执行这个任务,你一如既往地依靠Show和debug命令。首先,简要介绍一下show命令的内容。 Switch1> enable Switch1#configure terminal Switch2#show EtherChannel ...

扩展访问控制列表(ACL) - 虚拟

扩展访问控制列表(ACL) - 虚拟

扩展访问控制列表(ACL)允许您允许拒绝来自特定IP地址的流量到特定的目标IP地址和端口。它还允许您指定不同类型的流量,如ICMP,TCP,UDP等。不用说,它非常细化,可以使您非常具体。如果...

编辑的选择

电子项目计划步骤1:设想您的电子项目 - 傻瓜

电子项目计划步骤1:设想您的电子项目 - 傻瓜

设计和建立你的电子项目的细节,你应该退后一步,看看大局。首先,你需要确保你有一个坚实的想法为您的项目。你为什么要建立它?它会做什么,谁来使用它,为什么? ...

电子项目计划步骤4:构建您的电路 - 傻瓜

电子项目计划步骤4:构建您的电路 - 傻瓜

而且你对它的操作感到满意,你可以建立一个永久版本的电路。虽然有几种方法可以做到这一点,但最常见的是在印刷电路板(也称为PCB)上构建电路。请注意,在PCB上组装电路...

电子项目计划步骤3:原型电路 - 假人

电子项目计划步骤3:原型电路 - 假人

永久的电路板,你会想确保它的工作。最简单的方法就是在无焊面包板上构建电路。无焊料面包板可以让您快速组装电路元件而不需要焊接任何东西。相反,您只需将其裸露在外...

编辑的选择

如何替换R中的文本 - 虚拟变量

如何替换R中的文本 - 虚拟变量

R中的sub()函数在文本模式,并用替换文本替换此模式。你使用sub()来替代文本文本,并使用其表兄gsub()来替换所有出现的模式。 (gsub()中的g表示全局。)假设你有句子He ...

中如何成功地遵循命名惯例在R - 傻瓜

中如何成功地遵循命名惯例在R - 傻瓜

R是非常自由的,对象和功能。这个自由是一个很大的祝福,同时也是一个很大的负担。没有人不得不遵循严格的规则,所以在R中编程的人基本上可以按照自己的意愿去做。如何选择一个正确的名字...

中使用函数在R中创建并转换脚本后,如何使用R - dummies中的函数

中使用函数在R中创建并转换脚本后,如何使用R - dummies中的函数

再次使用前面显示的Source()命令将其加载到控制台中。现在你看...什么也没有。 R并不让你知道它已经加载了这个函数,但它已经在工作空间中了,你可以检查一下...