• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 11
    • 下载费用:30 金币  

    焦作微信重庆时时彩: 一种球型分布数据专用线性二分类计算方法.pdf

    关 键 词:
    一种 分布 数据 专用 线性 分类 计算方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201210488810.7

    申请日:

    2012.11.26

    公开号:

    CN103838705A

    公开日:

    2014.06.04

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G06F 17/15申请日:20121126|||公开
    IPC分类号: G06F17/15 主分类号: G06F17/15
    申请人: 中国航天科工集团第三研究院第八三五七研究所
    发明人: 贾磊
    地址: 300308 天津市东丽区空港经济区保税路357号
    优先权:
    专利代理机构: 核工业专利中心 11007 代理人: 包海燕
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201210488810.7

    授权公告号:

    ||||||

    法律状态公告日:

    2016.12.07|||2014.07.02|||2014.06.04

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明属于于模式识别与人工智能技术领域,具体涉及一种球型分布数据专用线性二分类计算方法。本发明的方法包括以下步骤:输入球型分布数据及标号集,设定变量初值、预设容忍度及初始海森矩阵;生成核矩阵;求解最小化问题;若有当前目标函数梯度的下降值小于预设的收敛容忍度,则步骤终止,得到分类结果;否则返回步骤三进行下一次迭代。本发明的方法解决了现有线性二分类方法分类精度不高的技术问题;给出面向球型分布数据的核,有效实现球型分隔面到线性分隔面的映射,提升球型分布数据的线性二分类精度。

    权利要求书

    权利要求书
    1.  一种球型分布数据专用线性二分类计算方法,其特征在于:包括以下步骤: 
    步骤一:输入球型分布数据{x1,...,xl},及标号集{y1,...,yl},变量初值α0,预设容忍度ε,初始海森矩阵H;l为球型分布数据个数; 
    步骤二:遍历xi,i=1,...,l,生成核矩阵K,K为方阵,矩阵元素 
    Ki,j=K(xi,xj)=Φ(xi)TΦ(xj). 
    其中,Φ为特征映射,i,j=1,2,...,l; 
    生成矩阵Q,Qi,j=Ki,jyiyj; 
    步骤三:求解最小化问题 

    s.t. yTα=0,α≥0, 
    其中,α=[α1,...,αl]T,α≥0表示αi≥0,i=1,2,...,l;y=[y1,...,yl]T;e为单位向量; 
    步骤四:若有当前目标函数梯度的下降值小于预设的收敛容忍度,则步骤终止,得到分类结果;否则返回步骤三进行下一次迭代。 

    2.  根据权利要求1所述的球型分布数据专用线性二分类计算方法,其特征在于:步骤一中,球型分布数据xi∈Rn,i=1,...,l,yi∈{-1,+1},i=1,...,l,yi=+1表示数据xi属于正类,yi=-1表示数据xi属于负类;初始变量值α0=[1,...1]T,预设容忍度ε=10-3,初始海森矩阵Hk=E。 

    3.  根据权利要求2所述的球型分布数据专用线性二分类计算方法,其特征在于:步骤二中, 





    。

    4.  根据权利要求3所述的球型分布数据专用线性二分类计算方法,其特征在于:步骤三中,求解最小化问题采用梯度下降方式迭代计算。 

    5.  根据权利要求4所述的球型分布数据专用线性二分类计算方法,其特征在于:步骤三中,所述梯度下降方式迭代具体过程为: 
    在第k步迭代中,优化目标变量αk的更新方向为λk,λk通过线性规划过程得到;更新步长为Pk,计算Pk要用到Hk值和gk值,gk为当前目标函数梯度值;更新αk后,计算Hk+1的值,用于下次迭代过程,E为单位矩阵,计算公式如下: 
    。

    说明书

    说明书一种球型分布数据专用线性二分类计算方法
    技术领域
    本发明属于于模式识别与人工智能技术领域,具体涉及一种球型分布数据专用线性二分类计算方法。
    背景技术
    线性二分类是将目标数据用线性函数加以分割的计算方法,是模式识别领域中的一类重要计算方法。在处理非线性分布数据时,由于数据分割面的非线性化,线性二分类算法往往需要先将数据映射到特征空间,使得数据在特种空间中线性可分后,再进行分类处理。映射一般通过“核”来实现。核是影响线性二分类算法的重要指标,也是分类结果的主要误差源,直接决定着分类效率以及分类精度。依据非线性数据的分布特性先验知识,有针对性的设计专用核,对于提高线性二分类算法的效率及精度有着重要的实用意义和工程价值。
    球型分布数据是指可被球面分割的数据,是模式识别领域中需要处理的一类重要非线性分布数据,常见于故障判断、医疗诊断等问题。
    现有线性二分类算法一般应用多项式核、高斯核、Sigmoid核、向量核或频谱核等处理球型分布数据。多项式核、高斯核与Sigmoid核属通用性核,适用范围广泛,但对球型分布数据往往缺乏针对性,面临维数灾难问题;向量核适用于具有较强关联性数据的分类,如文本数据,对随机化的球型分布数据只能起到弱化的作用;频谱核是面向结构型数据而设计的,如字符串、链表、树等,适用于具有较强结构性的数据分类,在球型分布数据分类中只能作为一种补充方法。以上这几类核虽然在某些应用问题上都获得了较好的 分类效果,但在处理球型分布数据时,要么过于通用化,要么过于平凡化,难以实现球型分隔面到线性分隔面的有效映射,导致分类精度不高,给工程应用带来较大困难。因而亟需一种球型分布数据专用的线性二分类计算方法。
    发明内容
    本发明要解决的技术问题为:提出一种球型分布数据专用线性二分类计算方法,给出面向球型分布数据的核,有效实现球型分隔面到线性分隔面的映射,提升球型分布数据的线性二分类精度。
    本发明的技术方案如下所述:
    一种球型分布数据专用线性二分类计算方法,包括以下步骤:
    步骤一:输入球型分布数据{x1,...,xl),及标号集{y1,...,yl},变量初值α0,预设容忍度ε,初始海森矩阵H;l为球型分布数据个数;
    步骤二:遍历xi,i=1,...,l,生成核矩阵K,K为方阵,矩阵元素
    Ki,j=K(xi,xj)=Φ(xi)TΦ(xj).
    其中,Φ为特征映射,i,j=1,2,...,l;
    生成矩阵Q,Qi,j=Ki,jyiyj;
    步骤三:求解最小化问题
    minααT-2eTα]]>
    s.t.  yTα=0,α≥0,
    其中,α=[α1,...,αl]T,α≥0表示αi≥0,i=1,2,...,l;y=[y1,...,yl]T;e为单位向量;
    步骤四:若有当前目标函数梯度的下降值小于预设的收敛容忍度,则步骤终止,得到分类结果;否则返回步骤三进行下一次迭代。
    作为优选方案,步骤一中,球型分布数据xi∈Rn,i=1,...,l,yi∈{-1,+1},i=1,...,l,yi=+1表示数据xi属于正类,yi=-1表示数据xi属于负类;初始变量值α0=[1,...]T,预设容忍度ε=10-3,初始海森矩阵Hk=E。
    步骤二中,Ki,j的具体计算方法可以为:
    Ki,j=Φ([xi1,xi2,...,xik,...,xin])Φ([xj1,xj2,...,xjk,...,xjn])T]]>
    =[zi1,zi2,...,zik,...,zin][zj1,zj2,...,zjk,...,zjn]T]]>
    =[||xi||2,arccosxi1||xi||2,...,arccosxikxi(k-1)tanzi(k-1),...,arctanxinxi(n-1)]]]>
    [||xj||2,arccosxj1||xj||2,...,arccosxjkxj(k-1)tanzj(k-1),...,arctanxjnxj(n-1)]T.]]>
    =||xi||2||xj||2+arccosxi1||xi||2arccosxj1||xj||2+...+arccosxikxi(k-1)tanzi(k-1)arccosxjkxj(k-1)tanzj(k-1)]]>
    +...+arctanxinxi(n-1)arctanxjnxj(n-1).]]>
    步骤三中,求解最小化问题可以采用梯度下降方式迭代计算。
    所述梯度下降方式迭代具体过程可以为:
    在第k步迭代中,优化目标变量αk的更新方向为λk,λk通过线性规划过程得到;更新步长为Pk,计算Pk要用到Hk值和gk值,gk为当前目标函数梯度值;更新αk后,计算Hk+1的值,用于下次迭代过程,E为单位矩阵,计算公式如下:
    Pk=-Hkgkgk=▿(αkTQαk-2eTαk)Hk+1=(E-ρkskψkT)Hk(E-ρkskψkT)-ρkskψkTρk=1/ψkTsksk=αk+1-αkαk+1=αk+λkPkψk=gk+1-gkλk=argmin(αk+1TQαk+1-2eTαk+1).]]>
    本发明的有益效果为:
    (1)本发明提出了一种球型分布数据专用线性二分类计算方法,有效实现球型分隔面到线性分隔面的映射,提升球型分布数据的线性二分类精度;
    (2)本发明的球型分布数据专用线性二分类计算方法中,球型分布数据 核K由特征映射Φ的内积生成,Φ为同维映射,可有效避免维数灾难问题;
    (3)本发明的球型分布数据专用线性二分类计算方法适用范围广泛,适合于一切球型可分数据,可直接应用于故障判断、医疗诊断、专家系统、智能计算等模式识别与人工智能各领域。
    附图说明
    图1为本发明的一种球型分布数据专用线性二分类计算方法流程图;
    图2为输入的二维球型分布数据图;
    图3为二维球型分布数据线性二分类后的数据图;
    图4为输入的三维球型分布数据图;
    图5为三维球型分布数据线性二分类后的数据图。
    具体实施方式
    下面结合附图和实施例对本发明的一种球型分布数据专用线性二分类计算方法进行详细说明。
    本发明的一种球型分布数据专用线性二分类计算方法包括以下步骤:
    步骤一
    输入球型分布数据{x1,...,xl}以及标号集{y1,...,yl},其中,l为球型分布数据个数,xi∈Rn,i=1,...,l,yi∈{-1,+1},i=1,...,l,yi=+1表示数据xi属于正类,yi=-1表示数据xi属于负类;初始变量值α0=[1,...1]T,预设容忍度ε=10-3,初始海森矩阵Hk=E。
    步骤二
    计算核矩阵K,K为方阵,K的第i行第j列元素Ki,j按下式计算:
    Ki,j=K(xi,xj),
    其中,K(xi,xj)=Φ(xi)TΦ(xj),Φ为同维特征映射,Φ:Rn→Rn,其中,Rn为n维实向量空间,n为球型分布数据维数,Φ的计算式具体为:
    Φ(xi)=Φ([xi1,xi2,...,xik,...,xin])]]>
    =[zi1,zi2,...,zik,...,zin]T]]>
    =[||xi||2,arccosxi1||xi||2,...,arccosxikxi(k-1)tanzi(k-1),...,arctanxinxi(n-1)]T.]]>
    其中,xik,k=1,...,n,表示xi的n个分量。
    Ki,j具体按下式计算:
    Ki,j=Φ([xi1,xi2,...,xik,...,xin])Φ([xj1,xj2,...,xjk,...,xjn])T]]>
    =[zi1,zi2,...,zik,...,zin][zj1,zj2,...,zjk,...,zjn]T]]>
    =[||xi||2,arccosxi1||xi||2,...,arccosxikxi(k-1)tanzi(k-1),...,arctanxinxi(n-1)]]]>
    [||xj||2,arccosxj1||xj||2,...,arccosxjkxj(k-1)tanzj(k-1),...,arctanxjnxj(n-1)]T---(1)]]>
    =||xi||2||xj||2+arccosxi1||xi||2arccosxj1||xj||2+...+arccosxikxi(k-1)tanzi(k-1)arccosxjkxj(k-1)tanzj(k-1)]]>
    +...+arctanxinxi(n-1)arctanxjnxj(n-1).]]>
    遍历xi,i=1,...,l,按(1)式计算Ki,j,生成核矩阵K;同时生成矩阵Q,Qi,j=Ki,jyiyj。
    步骤三
    将矩阵Q,初始变量值α0,代入如下最小化问题,并求解:
    minααT-2eTα]]>
    s.t.   yTα=0,α≥0,
    其中,α=(α1,...,αl)T,α≥0表示αi≥0,i=1,2,...,l;y=(y1,...,yl)T;e为单位向量;求解采用梯度下降方式迭代计算,本实施例中具体过程为:在第k步迭代中,优化目标变量αk的更新方向为λk,λk通过线性规划过程得到;更新步长为Pk,计算Pk要用到Hk值和gk值,gk为当前目标函数梯度值。更新完αk后,需计算Hk+1的值,用于下次迭代过程,E为单位矩阵,所需计算公式如下:
    Pk=-Hkgkgk=▿(αkTQαk-2eTαk)Hk+1=(E-ρkskψkT)Hk(E-ρkskψkT)-ρkskψkTρk=1/ψkTsksk=αk+1-αkαk+1=αk+λkPkψk=gk+1-gkλk=argmin(αk+1TQαk+1-2eTαk+1).]]>
    步骤四
    若有当前目标函数梯度的下降值ψk小于预设的收敛容忍度,则步骤终止,得到分类结果;否则返回步骤三进行下一次迭代。
    分别以xi=[xi1,xi2]T∈R2和xi=[xi1,xi2,xi3]T∈R3为例,在二维平面与三维空间中测试本发明提出的球型分布数据线性二分类计算方法。测试环境为WindowsXP SP3操作系统,硬件环境为Dual-Core E5500 2.8GHz处理器,2GBDDR3内存,软件环境为Matlab6.5.1。
    测试一:如图2所示,在二维平面上随机生成1780个球型分布数据,其中正类数据1240个,以黑色表示,负类数据540个,以红色表示。将数据代入本发明提出的球型分布数据线性二分类计算方法后,分类结果如图3所示。
    测试二:如图4所示,在三维空间内随机生成1922个球型分布数据,其中正类数据961个,以黑色表示,负类数据961个,以红色表示。将数据代入本发明提出的球型分布数据线性二分类计算方法后,分类结果如图5所示。
    表1 测试结果
     正类负类线性二分类精度测试一1240540100%测试二961961100%
    在上述两项仿真测试中,见表1,本发明提出的球型分布数据线性二分类计算方法均能有效实现球型分隔面到线性分隔面的映射,分类精度为100%。
    综上所述,本发明依据数据呈球型分布的先验知识,构造球型分布数据核,采用梯度下降方式迭代计算目标函数的更新方向和更新步长,给出线性二分类结果。任何本专业技术人员,在本发明技术方案内作出的其他种种改良或修饰为等同变化的实例,但凡未脱离本发明专利技术方案内容,依据本发明专利的技术实质对以上所作的任何简单修改、等同变化与修饰,均属于本发明的?;し段?。

    关于本文
    本文标题:一种球型分布数据专用线性二分类计算方法.pdf
    链接地址://www.4mum.com.cn/p-6147441.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • pc蛋蛋北京28计划软件 分分pk10前三技巧稳赚 极速赛车购买技巧 极速3d全天计划 北京pk赛车10开奖纪录 pk10一期计划公式 时时彩龙虎和倍投方法 北京pk10刷返水技巧 玩大小单双怎么才能赢 长期跟踪 稳赚 飞艇计划一期六码 福利彩票双色球复式计算器 北京pk10亚军走势图 必中计划软件幸运飞 dnf稳赚钱 七星彩历史开奖全查询