• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 12
    • 下载费用:30 金币  

    重庆时时彩91期: 一种基于主动学习的分类器构建方法.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201410042498.8

    申请日:

    2014.01.29

    公开号:

    CN103793510A

    公开日:

    2014.05.14

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20140129|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 苏州融希信息科技有限公司
    发明人: 吴健; 张宇; 徐在俊
    地址: 215123 江苏省苏州市苏州工业园区星湖街328号创意产业园16栋-B302单元
    优先权:
    专利代理机构: 苏州创元专利商标事务所有限公司 32103 代理人: 陶海锋
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201410042498.8

    授权公告号:

    ||||||

    法律状态公告日:

    2017.10.03|||2014.06.11|||2014.05.14

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明公开了一种基于主动学习的分类器构建方法,充分考虑未标注样本的当前价值和预期价值,挑选高价值的样本。首先利用样本的最优和次优类别信息计算样本的当前价值,根据样本的当前价值的高低选出一部分价值高的样本组成候选样本集,然后计算候选样本集中样本的预期价值,结合样本的当前价值,得到样本的总价值,最后根据样本的总价值,挑选高价值的未标注样本进行标注,添加到训练样本集中,更新分类器。根据不同数据集上的实验结果表明,本发明的方法能够在选择相同数量样本的条件下,得到较高分类正确率的分类器。

    权利要求书

    权利要求书
    1.  一种基于主动学习的分类器构建方法,根据未标注样本和数据特征生成训练样本集并训练分类器,包括下列步骤:
    (1) 从未标注样本集中随机选择20~50个样本进行人工标注,构建初始训练样本集,然后根据初始训练样本集的数据特征构建初始分类器H(0);
    (2)采用上一步获得的分类器H(t)计算每一个未标注样本的BvSB值,BvSB值的计算方法是:
    ,
    其中,x是未标注样本集U中的样本, 是样本属于最优类别的后验概率,是样本属于次优类别的后验概率,t是步骤(2)至(6)的循环次数;
    (3)根据步骤(2)选择h个BvSB值最小的未标注样本组成候选样本集,其中,h为步骤(5)中选择的样本个数的2~5倍;
    (4)计算候选样本集中每个未标注样本的总价值,方法是:
    [4-1] 取候选样本集中的一个未标注样本,用该样本分别结合其最优类别和次优类别标签更新分类器H(t),得到临时分类器和,其中是最优类别标签,是次优类别标签;
    [4-2] 利用得到的两个临时分类器计算该未标注样本的两个BvSB值,在这两个BvSB值中较大的BvSB值作为该未标注样本的期望价值,表达为;
    [4-3] 基于分类器H(t)得到该未标注样本的BvSB值,表达为,利用以下公式计算该未标注样本的总价值;
    ;
    重复步骤[4-1]至[4-3],获得候选样本集中所有未标注样本的总价值;
    (5)在候选样本集中选择2~10个Opt值最小的未标注样本进行人工标注,添加到训练样本集中,获得当前训练样本集;
    (6) 利用当前训练样本集对分类器H(t)进行训练更新;
    (7) 重复步骤(2)至(6),直至满足分类器训练的停止条件。

    2.  根据权利要求1所述的基于主动学习的分类器构建方法,其特征在于:步骤(3)中,h为步骤(5)中选择的样本个数的2~3倍。

    3.  根据权利要求1所述的基于主动学习的分类器构建方法,其特征在于:步骤(5)中,在候选样本集中选择2~5个Opt值最小的未标注样本进行人工标注。

    4.  根据权利要求1所述的基于主动学习的分类器构建方法,其特征在于:步骤(7)中,分类器训练的停止条件是,分类正确率≥95%,或者训练样本集中的样本数≥总样本数×70%。

    关 键 词:
    一种 基于 主动 学习 分类 构建 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:一种基于主动学习的分类器构建方法.pdf
    链接地址://www.4mum.com.cn/p-6156737.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03