破碎集

破碎集的概念在Vapnik-Chervonenkis理论(也称为VC理论)中起着重要作用。碎集和VC理论被用于经验过程的研究以及统计计算学习理论中。

破碎集的定义

假设A是一个集合,C是一个集合的类。如果对于A的每一个子集a,C中都有一些元c,使得C类粉碎了集合A。a=c∩A。{displaystylea=ccapA.}。等价地,当它们的交集等于A的幂集时,C就粉碎了A。P(A)={c∩A|c∈C}。我们用字母C来指代一个类或集合,如Vapnik-Chervonenkis类(VC类)。集合A通常被假定为有限的,因为在经验过程中,我们对数据点的有限集合的破碎感兴趣。

破碎集的例子

我们将表明,平面(二维空间)中的所有圆盘类并没有粉碎单位圆上的每一个四点集合,然而平面上的所有凸集类却粉碎了单位圆上的每一个有限的点集合。设A是单位圆上的一个四点集合,设C是所有圆盘的类。为了检验C在哪里击碎了A,我们试图在A的每个点的子集周围画一个圆盘。接下来,我们尝试在每个点对的子集周围画一个圆盘。事实证明,这对相邻的点来说是可以做到的,但对位于圆的两侧的点来说是不可能的。如下图所示。每个单独的点都可以用一个圆盘来隔离(显示所有四个)。每个相邻点的子集都可以用一个圆盘来隔离(显示四个中的一个)。位于单位圆对面的点的子集不能用圆盘隔离。因为有一些子集不能被C中的任何一个圆盘所隔离,所以我们得出结论,A没有被C打碎。而且,只要稍加思考,我们可以证明没有一个四点的集合被这个C打碎。然而,如果我们将C重新定义为所有椭圆盘的类,我们会发现我们仍然可以分离出上面的所有子集,以及以前有问题的点。

因此,这个由4个点组成的特定集合被椭圆盘类击碎了。可视化如下。A的对立点现在可以通过一些椭圆来分离(显示两个中的一个)。A中三个点的每个子集也可被某个椭圆分开(显示为四个中的一个)。只要稍加思考,我们就可以概括地说,单位圆上的任何有限点集都可以被所有凸集的类所粉碎(可视化地连接这些点)。

破碎集

碎裂系数

为了量化一个集合C的丰富性,我们使用碎裂系数的概念(也被称为增长函数)。对于一个集合的集合C{displaystylessubsetOmega},破碎系数{displaystyleOmega}是任何空间,通常是样本空间。是任何空间,通常是一个样本空间,我们定义C的第n个破碎系数为{displaystyleS_{C}(n)}是xxx的子集。是任何由n个点组成的集合A的xxx数量的子集,这些子集可以通过将A与集合C中的集合相交来形成。这里有一些关于{displaystyleS_{C}(n)=2{n}},说明有一个卡数为n的集合可以被C打碎。这意味着有一个cardinality为n的集合,它可以被C打碎。{displaystyleS_{C}(N)<2{N}},对某些人来说,S_{C}(N)<2{N}。第三个属性意味着,如果C不能粉碎任何卡度为N的集合,那么它就不能粉碎更大卡度的集合。

Vapnik-Chervonenkis类

一个类C的VC维度被定义为{displaystyleS_{C}(n)=2{n}}对于所有的n,这个类C的VC维度是无限的。对于所有的n,并且这个类C的VC维度是无限的。

相关文章

扫码分享到朋友圈