• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 16
    • 下载费用:30 金币  

    重庆时时彩杀球定胆: 一种基于浮动分类阈值的分类器集成方法.pdf

    关 键 词:
    一种 基于 浮动 分类 阈值 集成 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201110121230.X

    申请日:

    2011.05.11

    公开号:

    CN102163239A

    公开日:

    2011.08.24

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 专利权人的姓名或者名称、地址的变更IPC(主分类):G06F 17/30变更事项:专利权人变更前:中科院成都信息技术股份有限公司变更后:中科院成都信息技术股份有限公司变更事项:地址变更前:610000 四川省成都市高新区创业东路管委会高新大厦11楼5号变更后:610041 四川省成都市高新区天晖路360号晶科1号大厦18栋1803室|||授权|||著录事项变更IPC(主分类):G06F 17/30变更事项:申请人变更前:中科院成都信息技术有限公司变更后:中科院成都信息技术股份有限公司变更事项:地址变更前:610041 四川省成都高新区创业东路管委会高新大厦11楼5号变更后:610041 四川省成都高新区创业东路管委会高新大厦11楼5号|||实质审查的生效IPC(主分类):G06F 17/30申请日:20110511|||公开
    IPC分类号: G06F17/30; G06K9/62 主分类号: G06F17/30
    申请人: 中科院成都信息技术有限公司
    发明人: 付忠良; 赵向辉; 姚宇; 张丹普
    地址: 610041 四川省成都市人民南路四段9号
    优先权:
    专利代理机构: 成都赛恩斯知识产权代理事务所(普通合伙) 51212 代理人: 朱月仙
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201110121230.X

    授权公告号:

    |||102163239B|||||||||

    法律状态公告日:

    2015.05.06|||2014.04.23|||2013.07.24|||2011.10.05|||2011.08.24

    法律状态类型:

    专利权人的姓名或者名称、地址的变更|||授权|||著录事项变更|||实质审查的生效|||公开

    摘要

    本发明公开了一种基于浮动分类阈值的分类器集成方法,该方法通过迭代T次,训练得到T个最佳弱分类器,然后组合T个最佳弱分类器得到最佳组合分类器。当针对二分类问题时,训练T个最佳弱分类器包括:(3.1)基于有权值的训练样本集S训练弱分类器,t=1,...,T;(3.2)根据步骤(3.1)的结果调整样本权值(3.3)判断t是否小于T,若是,则令t=t+1,并返回(3.1),直至t=T;当针对多分类问题时,训练T个最佳弱分类器包括:(3.1)基于有权值的训练样本集S训练弱分类器,t=1,...,T;(3.2)根据步骤(3.1)的结果调整样本权值(3.3)判断t是否小于T,若是,则令t=t+1,并返回(3.1),直至t=T。本发明相对于现有技术,能克服固定分类阈值分类器对分类边界附近点分类不稳定的这一缺点。

    权利要求书

    1.一种基于浮动分类阈值的分类器集成方法,所述方法包括如下步骤:(1)获取训练样本集S;(2)初始化样本权值并赋初值,(3)迭代T次,训练得到T个最佳弱分类器;(4)组合T个最佳弱分类器得到最佳组合分类器,其特征在于,当针对二分类问题时,所述步骤(3)包括如下步骤:(3.1)基于有权值的训练样本集S训练弱分类器,t=1,...,T,通过如下步骤实现:①对应训练样本集S的划分,定义一个区间i=1,...,m;②定义弱分类器ht(x),令l=1,-1,其中xi代表第i个样本的具体值,yi代表第i个样本的类别,代表中l类样本权值之和,l代表二分类问题中类别为1和-1的类;③选取弱分类器ht(x),使最小,其中Zt代表样本权值调整后的归一化因子;(3.2)根据步骤(3.1)的结果调整样本权值(3.3)判断t是否小于T,若是,则令t=t+1,并返回步骤(3.1),若否,则进入步骤(4)。2.根据权利要求1所述的基于浮动分类阈值的分类器集成方法,其特征在于,所述组合T个最佳弱分类器得到最佳组合分类器的方法为:H(x)=sgn(f(x)),其中3.一种基于浮动分类阈值的分类器集成方法,所述方法包括如下步骤:(1)获取训练样本集S;(2)初始化样本权值并赋初值,(3)迭代T次,训练得到T个最佳弱分类器;(4)组合T个最佳弱分类器得到最佳组合分类器,其特征在于,当针对多分类问题时,所述步骤(3)包括如下步骤:(3.1)基于有权值的训练样本集S训练弱分类器,t=1,...,T,通过如下步骤实现:①对应训练样本集S的划分,定义一个区间i=1,...,m;②定义弱分类器ht(x),令l=1,...,K,其中xi代表第i个样本的具体值,yi代表第i个样本的类别,代表中l类样本权值之和,l代表多分类问题中的类别;③选取弱分类器ht(x),使最小,其中Zt代表样本权值调整后的归一化因子;(3.2)根据步骤(3.1)的结果调整样本权值(3.3)判断t是否小于T,若是,则令t=t+1,并返回步骤(3.1),若否,则进入步骤(4)。4.根据权利要求3所述的基于浮动分类阈值的分类器集成方法,其特征在于,所述组合T个最佳弱分类器得到最佳组合分类器的方法为:H(x)=argmaxl{f(x,l)},]]>其中f(x,l)=Σt=1Tht(x,l).]]>

    说明书

    一种基于浮动分类阈值的分类器集成方法

    技术领域

    本发明属于机器学习和模式识别方法,特别是涉及一种基于浮动分类阈值的分类器集成方法来提高分类器的性能。

    背景技术

    通过多个分类器的组合来提升分类精度一直是集成学习研究的主要内容,弱学习定理有力地支撑了这种研究思路的可行性。其中,基于Boosting思想的AdaBoost(adaptive?boosting,自适应增强算法)和连续AdaBoost算法是目前被研究和应用得最多的集成学习算法之一,其良好的性能和使用简单的特性吸引了大量研究者对其进行改进与完善。刘大有等人在专利CN101251851A中提出了基于增量朴素贝叶斯网多分类器集成方法;高常鑫等人在专利CN100587708C中阐述了一种分类器集成方法;Zhu和Fu等人于2009年分别在文章《Multi-class?AdaBoost》和《Effictive?property?and?best?combination?of?classifiers?linear?combination》中考虑了直接用于多分类问题的集成学习方法。在集成学习方法中,特别是连续AdaBoost算法,作为AdaBoost算法的扩展,其可以输出连续的置信度,因而能更好地刻画分类边界并受到了更多的重视。在连续AdaBoost算法中,待分类目标经过各个弱分类器分类后并不输出具体的类别标签,而是输出类别标签的置信度。组合分类器对各标签的置信度进行累加,最后输出累计置信度最大的标签。对待分类目标,弱分类器的输出值完全由该目标在该弱分类器对样本空间的划分的情况决定。如采用二段划分的二分类器,常采用正类样本均值和反类样本均值的平均值作为分段划分阈值,当目标位于正类样本均值所在的划分段内,对AdaBoost算法,弱分类器将输出正类标签,而连续AdaBoost算法,弱分类器将输出两个标签的置信度,并且正类标签的置信度一般大于反类标签的置信度。当目标位于反类样本均值所在的划分段内,对AdaBoost算法,弱分类器将输出反类标签,而连续AdaBoost算法,弱分类器将输出两个标签的置信度,并且正类标签的置信度一般小于反类标签的置信度。

    然而,不管是AdaBoost算法还是连续AdaBoost算法,其得到的各个弱分类器的分段阈值都是确定的,待分类目标只能与固定的分段阈值比较。于是,当目标位于分段阈值附近时,目标值较小的变化都会导致输出两个完全不一样的结果,这一现象显然不太合理?;痪浠八?,它们对弱分类器的分段阈值是敏感的,对位于分段阈值附近的目标的分类是不稳定的。

    发明内容

    针对现有技术存在的问题,本发明的主要目的在于提供一种能克服固定分类阈值分类器对分类边界附近点分类不稳定的问题的基于浮动分类阈值的分类器集成方法。

    为实现上述目的,当针对二分类问题时,本发明提供一种基于浮动分类阈值的分类器集成方法的实施例,该方法包括如下步骤:

    (1)获取训练样本集S;

    (2)初始化样本权值并赋初值,

    (3)迭代T次,训练得到T个最佳弱分类器;

    (4)组合T个最佳弱分类器得到最佳组合分类器,

    该步骤(3)包括如下步骤:

    (3.1)基于有权值的训练样本集S训练弱分类器,t=1,...,T,通过如下步骤实现:①对应训练样本集S的划分,定义一个区间i=1,...,m;②定义弱分类器ht(x),令l=1,-1,其中xi代表第i个样本的具体值,yi代表第i个样本的类别,代表中l类样本权值之和,l代表二分类问题中类别为1和-1的类;③选取弱分类器ht(x),使最小,其中Zt代表样本权值调整后的归一化因子;

    (3.2)根据步骤(3.1)的结果调整样本权值

    (3.3)判断t是否小于T,若是,则令t=t+1,并返回步骤(3.1),若否,则进入步骤(4)。

    更进一步地,组合T个最佳弱分类器得到最佳组合分类器的方法为:H(x)=sgn(f(x)),其中

    当针对多分类问题时,本发明提供一种基于浮动分类阈值的分类器集成方法的实施例,该方法包括如下步骤:

    (1)获取训练样本集S;

    (2)初始化样本权值并赋初值,i=1,...,m;

    (3)迭代T次,训练得到T个最佳弱分类器;

    (4)组合T个最佳弱分类器得到最佳组合分类器,

    该步骤(3)包括如下步骤:

    (3.1)基于有权值的训练样本集S训练弱分类器,t=1,...,T,通过如下步骤实现:①对应训练样本集S的划分,定义一个区间i=1,...,m;②定义弱分类器ht(x),令l=1,...,K,其中xi代表第i个样本的具体值,yi代表第i个样本的类别,代表中l类样本权值之和,l代表多分类问题中的类别;③选取弱分类器ht(x),使最小,其中Zt代表样本权值调整后的归一化因子;

    (3.2)根据步骤(3.1)的结果调整样本权值

    ωit+1=ωitZtexp(-ht(xi,yi)+1KΣl=1Kht(xi,l));]]>

    (3.3)判断t是否小于T,若是,则令t=t+1,并返回步骤(3.1),若否,则进入步骤(4)。

    更进一步地,组合T个最佳弱分类器得到最佳组合分类器的方法为:

    H(x)=argmaxl{f(x,l)},]]>其中f(x,l)=Σt=1Tht(x,l).]]>

    本发明相对于现有技术,对各个弱分类器采取浮动分类阈值,各个弱分类器的输出值不是根据分类阈值而是根据训练样本的分布而确定,能克服固定分类阈值分类器对分类边界附近点分类不稳定的这一缺点,把只针对分类器的组合扩展到了针对分布的组合,因而可以更好地刻画分类边界。

    附图说明

    图1为本发明的基于浮动分类阈值的分类器集成方法的流程图

    图2为本发明的实施例一针对二分类问题时步骤S3的流程图

    图3为本发明的实施例一针对二分类问题时步骤S31的流程图

    图4为本发明的实施例二针对多分类问题时步骤S3的流程图

    图5为本发明的实施例二针对多分类问题时步骤S41的流程图

    图6为在Ionosphere数据集上的测试错误率对比

    图7为在Sonar数据集上的测试错误率对比

    图8为在WDBC数据集上的测试错误率对比

    图9为在Pima数据集上的测试错误率对比

    图10为在SPECT数据集上的测试错误率对比

    具体实施方式

    下面结合附图,详细说明本发明的具体实施方式。

    实施例一

    下面结合图1、图2、图3具体说明本发明的针对二分类问题时该基于浮动分类阈值的分类器集成方法的具体流程步骤。

    使用现有的连续AdaBoost算法时,设训练样本集S={(x1,y1),(x2,y2),..,(xm,ym)},yi∈{-1,+1},i=1,...,m,此处xi代表第i个样本的具体值,yi代表第i个样本的类别。(yi,yi)∈S简单记为xi∈S。对样本空间S进行一个nt段划分:当i≠j时,弱分类器ht(x)实际上对应于样本空间的一个nt段划分,当目标位于划分段时,根据该段内1类和-1类样本发生的概率与弱分类器ht(x)将输出显然,位于同一划分段内的目标,弱分类器输出值是一样的。当目标位于分段阈值附近时,目标值较小的变化将导致弱分类器输出两个不同的值,即当目标位于弱分类器的分段阈值附近时,分类结果是不稳定的。

    为了克服这种不合理现象,一种可行办法就是弱分类器ht(x)的输出值,不是由目标位于弱分类器的划分段内的两类样本的发生概率与决定,而是以包含该目标值的一个区域段内的两类样本的发生概率来决定。ht(x)的输出值仍然为但与不是内的两类样本发生概率,而是以x为中心的一个区域段内的两类样本发生概率。根据统计学中的极大似然思想,已经发生的事件应该具有大的概率,如果用区域中间值来体现具有大的概率,上述做法便体现了极大似然思想。

    称包含目标x的区域为目标中心区域,则选取怎样的目标中心区域来计算两类样本发生的概率,从而确定弱分类器的分类输出值,便是一个重要的问题。为便于计算,对二分类问题,一些简单可行的措施可以有:

    1.目标中心区域为以该目标为中心,区域宽度为样本值变化幅度的一半。当目标靠近两端时,目标中心区域可选取包含该目标对应半宽区域。

    2.根据极大似然原则,目标中心区域的宽度可以动态,比如以该目标值为中心,逐步向两边扩展,直至两类样本发生概率之差值最大。

    对于第1种措施,其相当于固定目标中心区域宽度,计算简单,目标位于区域中间,其能很好地体现极大似然思想。而对于第2种措施,当两类样本分布是标准正态分布时,不难验证,其得到的目标中心区域将正好是最优阈值对样本的两段划分,这便与连续AdaBoost算法完全一样了,失去了浮动阈值分类器作用。如果对措施2进行一点限制,比如区域向两边扩展时,向两类样本发生概率之差值增长最大方向扩展,然后再向另一方向扩展,并同时限制区域宽度不超过样本值变化幅度的一半,则就具有浮动阈值的特点了。

    根据前面的分析,该针对二分类问题时的基于浮动分类阈值的分类器集成方法具体包括如下步骤:

    S1、获取训练样本集S;

    S2、初始化样本权值并赋初值,

    S3、迭代T次,训练得到T个最佳弱分类器,通过步骤S31~S33来实现:

    S31、基于有权值的训练样本集S训练弱分类器,t=1,...,T,通过步骤S311~S313来实现:S311、对应训练样本集S的划分,定义一个区间S312、定义弱分类器ht(x),令l=1,-1,其中xi代表第i个样本的具体值,yi代表第i个样本的类别,代表中l类样本权值之和,l代表二分类问题中类别为1和-1的类;S313、选取弱分类器ht(x),使最小,其中Zt代表样本权值调整后的归一化因子;

    S32、根据步骤S31的结果调整样本权值

    S33、判断t是否小于T,若是,则令t=t+1,并返回步骤S31,若否,则进入步骤S4;

    S4、组合T个最佳弱分类器得到最佳组合分类器,方法为:H(x)=sgn(f(x)),其中

    本发明与连续AdaBoost算法相比,其一,在弱分类器选取策略上,本发明直接采用了最小化权值调整后的归一化因子,最小化权值调整后的归一化因子是方法的实质;其二,在弱分类器的划分上,连续AdaBoost算法的ht(x)对应一个nt段划分,即i≠j时,ht(x)输出值定义为其中与为xi所位于的划分段内正类样本累积权值与反类样本累积权值。而在本发明中,ht(x)对应的不是一个划分了,ht(x)输出值有类似公式但与变成包含xi(一般以xi为中心)的样本空间的一个子集的正类样本累积权值与反类样本累积权值。即每一个xi得到样本空间S的一个子集但i≠j时,允许其三,本发明能够根据ht(x)输出值近似得到样本空间的分布,而不只是简单的正反类样本在划分段内的分布差异。因此,本发明实际上已经把连续AdaBoost算法只能针对弱分类器的组合,扩展到了针对样本分布的组合。

    实施例二

    下面结合图1、图4、图5具体说明本发明的针对多分类问题时该基于浮动分类阈值的分类器集成方法的具体流程步骤。

    在二分类问题中,利用了1和-1来表示两类标签。因此,弱分类器ht(x)的输出值直接为两类标签置信度的差值,即时,组合分类器则根据累积置信度差值的符号来输出类别。在多分类问题中,各个弱分类器只能输出对应类别标签的置信度,组合分类器就是累积同标签的置信度,最后输出累积置信度最大对应的标签。记ht(x,l)为ht(x)输出标签l(=1,...,K)的置信度,组合分类器其中

    对多分类(K分类)问题,定义训练样本集S={(x1,y1),(x2,y3),...,(xm,ym)}中的标签yi∈{1,...,K},i=1,...,m。与二分类问题一样,样本权值的调整与弱分类器的选取策略,均是为了使得选取的弱分类器尽量相互独立。弱分类器选取策略仍然是样本权值调整后的归一化因子,而样本权值的调整则根据被检测目标的置信度与平均置信度之差值来调整。因为当被检测目标的置信度最大,则将被正确分类,即的大小,可近似度量样本(xi,yi)被正确分类的可能性。负指数函数,正好可以体现集成学习算法中样本权值调整的重要原则:被正确分类的样本的权值减少,被错误分类的样本的权值增加。

    因此,该针对多分类问题时的基于浮动分类阈值的分类器集成方法具体包括如下步骤:

    S1、获取训练样本集S;

    S2、初始化样本权值并赋初值,

    S3、迭代T次,训练得到T个最佳弱分类器,通过步骤S41~S43来实现:

    S41、基于有权值的训练样本集S训练弱分类器,t=1,...,T,通过步骤S411~S413来实现:S411、对应训练样本集S的划分,定义一个区间S412、定义弱分类器ht(x),令l=1,...,K,其中xi代表第i个样本的具体值,yi代表第i个样本的类别,代表中l类样本权值之和,l代表多分类问题中的类别;S413、选取弱分类器ht(x),使最小,其中Zt代表样本权值调整后的归一化因子;

    S42、根据步骤S41的结果调整样本权值

    S43、判断t是否小于T,若是,则令t=t+1,并返回步骤S41,若否,则进入步骤S4;

    S4、组合T个最佳弱分类器得到最佳组合分类器,方法为:

    H(x)=argmaxl{f(x,l)},]]>其中f(x,l)=Σt=1Tht(x,l).]]>

    需要注意的是,在本方法中,但i≠j时,允许这是浮动阈值与固定阈值的重要区别。在多分类问题中,仍然存在目标中心区域如何选取问题。因为本方法的真实目的是体现极大似然原则。因此,目标中心区域的选取仍然要体现这一思想。仍然可以采取目标位于所选区域的中间,以此体现极大似然思想,而区域的宽度,则可以是样本值变化幅度的一半,或1/K。

    下面将本发明的基于浮动分类阈值的分类器集成方法用于实际运用中,并与现有的连续AdaBoost算法进行比较。

    如果严格按照本方法来计算将是复杂的:首先,对不同的样本,需要统计不同的目标中心区域的各类样本累积权值。每个样本的每个属性值都要统计对应的目标中心区域,其几乎都需要遍历一次样本,计算量比较大;其次,在训练弱分类器时,对任一样本都要统计以其为中心的目标中心区域的各类样本的累积权值,以便得到对应的弱分类器输出,在得到各个弱分类器后,用于待分类目标的分类检测时,则又要根据待检测目标值,统计以该值为中心的目标中心区域内的各类样本的累积权值,计算量也很大。因此,本发明在用于实际运用中时,需要解决这两个计算步骤的耗时问题。

    针对第一个问题,可参照AdaBoost算法用于人脸检测时的方法,因为在AdaBoost算法用于人脸检测时,其中引入的Harr-like特征也是一个很耗时的特征。在引入积分图概念后,可以通过积分图来完成任意矩形区域的累积灰度值的快速计算,于是AdaBoost算法用于人脸检测真正可行。按照类似的思想,为了统计任意区间内的各类样本的累积权值,可先统计大于给定样本值的各类样本的累积权值(相当于最大样本值到该样本值之间的各类样本累积权值),这只需遍历一次样本。然后,任意中间一段区域的各类样本累积权值,可以由该区间的两个边界点对应的上述统计值之差得到??梢杂筛梅椒ɡ唇饩龅谝桓黾扑悴街璧暮氖蔽侍?;针对第二个问题,事实上,并没有必要精细到样本取值变化范围内的任一值来统计目标中心区域的各类样本累积权值,也就是说,当两个目标值相差很小时,弱分类器输出值可以一样。这便可以解决第二个问题。

    于是,可以按照下面的方法来计算弱分类器的输出值。为叙述简单,仍然用xi直接代表样本的某个属性值。记xi的最大值和最小值分别为确定弱分类器对样本值的分辨率为(vmax-vmin)/n,即当两个目标的值相差小于(vmax-vmin)/n时,弱分类器输出同样的值,n≥2。把样本空间按样本值大小n等分,S=S1U...USn,并设S1包含vmax,Sn包含vmin。则定义弱分类器ht(x):任意xi∈Sj,令l=1,...,K。其中Ri为包含Sj的相邻的一些Sk组成,即比如按照前面介绍的第一种目标中心区域确定方法,则k取值范围为max(1,j-Δ):min(n,j+Δ)。当Δ=n/4,相当于目标中心区域为样本值变化范围的一半,Δ=1/(2K)时,目标中心区域为样本值变化范围的1/K。

    当然,对于非数字属性的分类问题,将哪些样本作为相邻样本考虑,这是一个重要问题,不同的考虑方法,将会得到不同的分类方法。

    前面从理论上分析了本发明比连续AdaBoost算法会有更好的效果。下面通过实验与现有的连续AdaBoost算法进行比较。

    实验工具软件是MATLAB?7.8。实验数据选取了UCI中的Ionosphere,Sonar,Wisconsin?Diagnostic?Breast?Cancer(WDBC),Pima,SPECT数据集,这几个数据集可从网址://archive.ics.uci.edu/ml/datasets.html下载。

    本实验中的训练集和测试集按不同标签类同比例随机划分,重复多次计算测试错误率的均值和方差,均值反映方法的效果,方差反映方法的稳定性。实验中对数据集中训练集与测试集按照对等的比例划分,表1为本实验所选UCI实验数据集的情况。表1中“正例、反例”一列给出了各样本数据正类和反类的选择方法,“训练集、测试集”一列给出了训练集和测试集的选择方法。实验中重复抽样属性集的大小n选为与原始属性集相同,即表1中的“属性个数”一列给出的数值。

    实验中采用的弱学习算法为决策树算法,对本发明和连续的AdaBoost算法在同样的数据集上用同样的参数进行对比实验。实验中对数据集分别进行30和40次随机迭代实验,得出应用各种方法对测试集数据的测试错误率的均值和方差。表2即为在实验数据集上的测试错误率均值和方差的对比,对应于表2的示意图如图6至图10所示(图中Ordinary?AdaBoost代表现有的连续AdaBoost算法,Floating?Threshold?AdaBoost代表本发明,横坐标代表迭代实验次数,纵坐标代表测试错误率)。

    特别指出,采取同比例随机划分训练集和测试集,可验证各方法的效果?;值乃婊阅芊从撤椒ǘ匝盗芳氖视π?,针对固定训练集和测试集来验证是不科学的。而同比例划分,正好反映了学习算法的适用条件,一般的学习算法都有一个潜在假设,即训练集与测试集(或目标空间)是同分布的,也只有这样,通过降低训练错误率才能降低测试错误率,如果二者分布不同,分析结论将不一样。

    表3

    表4

    实验结果表明,本发明确实比连续AdaBoost算法效果好。如表2所示,测试错误率的方差都很小,证明本发明具有稳定性;另外,本发明的测试错误率比AdaBoost算法低。而随着训练集比例增加,二者的测试错误率均呈现逐渐降低的趋势,而测试错误率方差,则呈现相反的趋势,这与常识吻合。

    以上介绍了基于浮动分类阈值的分类器集成方法。本发明并不限定于以上实施例,任何未脱离本发明技术方案,即仅仅对其进行本领域普通技术人员所知悉的改进或变更,均属于本发明的?;し段е?。

    关于本文
    本文标题:一种基于浮动分类阈值的分类器集成方法.pdf
    链接地址://www.4mum.com.cn/p-5868215.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 贵州11选5开奖500万 最新信誉棋牌 000001上证指数行情 湖北十一选五开奖号 江西多乐彩开奖情况 360广东十一选五走势图 世爵彩票平台网址 大乐透后区和值走势图彩吧助手 棋牌游戏下载送20 中国福利彩票七乐彩开奖结果 北京pk10有正规网站吗 股票涨跌比例计算 黑龙江11选5号码遗漏 陕西金叶股票 零点棋牌的覆灭 北京快乐8玩法介绍