• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 13
    • 下载费用:20 金币  

    重庆时时彩混选怎么玩: 一种动态数据环境下的数据流混合分类方法.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201310608553.0

    申请日:

    2013.12.26

    公开号:

    CN103678512A

    公开日:

    2014.03.26

    当前法律状态:

    驳回

    有效性:

    无权

    法律详情: 发明专利申请公布后的驳回IPC(主分类):G06F 17/30申请公布日:20140326|||实质审查的生效IPC(主分类):G06F 17/30申请日:20131226|||公开
    IPC分类号: G06F17/30; G06K9/66 主分类号: G06F17/30
    申请人: 大连民族学院
    发明人: 姚远
    地址: 116000 辽宁省大连市大连经济技术开发区辽河西路18号
    优先权:
    专利代理机构: 大连博晟专利代理事务所(特殊普通合伙) 21236 代理人: 于忠晶
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201310608553.0

    授权公告号:

    ||||||

    法律状态公告日:

    2017.11.07|||2014.04.23|||2014.03.26

    法律状态类型:

    发明专利申请公布后的驳回|||实质审查的生效|||公开

    摘要

    本发明涉及智能信息处理技术领域,公开了一种动态数据环境下的数据流混合分类方法,本发明采用集成学习和混合模型框架构建数据流分类模型,可以适应数据流的海量性、实时性和动态变化性三种特点的要求,并提高数据流分类的准确率。其中,集成学习模型利用了集成学习理论相关内容,通过使用多个分类器进行分类,提高分类效果和适应数据流动态性的能力。此外,聚类方法对分类结果进行汇总,有效利用分类结果之间的内部关系,有利于提高分类准确率,减少因分类所消耗时间。

    权利要求书

    权利要求书
    1.  一种动态数据环境下的数据流混合分类方法,具体包括以下步骤:
    步骤1:动态数据流收集??椋?02)从海量实时数据流(101)中按照时间顺序收集数据;
    步骤2:数据流划分??椋?03)读取步骤1中的数据流数据,并且根据数据流数据的时间先后关系对数据流进行划分;所述数据流初始化??椋?03)划分得到的数据块中,包含3类数据分别是训练集、验证集和测试集,每个数据集中所包含的数据样本数量为N;N是固定变量,由使用者提前设定;
    步骤3:将经过数据流划分??椋?03)所得到的三种静态数据集即训练集、测试集和验证集输入到数据初始化??椋?04),对静态数据集进行归一化处理;
    步骤4:将经过数据初始化??椋?04)处理后的训练集数据输入到集成分类器??椋?05)中,所述集成分类器??椋?05)使用训练集数据进行训练,构建集成分类器模型;
    步骤5:利用参数优化??椋?06)对步骤4中集成分类器模型进行参数优化;
    步骤6:将经过数据初始化??椋?04)处理后的验证集输入到步骤5优化后的集成分类器中,得到的数据类别标签为数据集L;
    步骤7:将数据集L输入到聚类??椋?07)中,对所使用的聚类模型进行训练;
    步骤8:将数据初始化??椋?04)所得到的测试集数据输入到所构建的混合分类模型中,完成数据流分类过程。

    2.  根据权利要求1所述的一种动态数据环境下的数据流混合分类方法,其特征在于,所述步骤2中数据流划分??椋?03)对数据流的划分,包括以下步骤:
    步骤2.1:首先使用滑动窗口法对海量实时数据流进行静态化处理;其中,滑动窗口每次滑动的距离为N,且每个静态子集所包含的样本数量也为N个;
    步骤2.2:使用随机抽取方法对步骤2.1所得到的子集进行混合,分别得到三个数据集,即训练集、测试集和验证集,其中训练集和测试集的大小均为4N。

    3.  根据权利要求1所述的一种动态数据环境下的数据流混合分类方法,其特征在于,所述步骤3中数据初始化??椋?04)采用MapMinMax归一化方法对数据进行归一化处理,包括以下步骤:
    步骤3.1:首先将得到的训练集、测试集和验证集,分别对其各个属性值进行统计,找到各属性的最大和最小属性值;
    步骤3.2:对数据集的各个属性进行归一化处理,所述归一化方法公式为:
                                                                              
    其中,xi表示当前样本的第i个属性值,min(xi)和max(xi)分别表示当前第i个属性的最小和最大值,ymax和ymin分别表示归一化的上限和下限,如果想归一化到[0,1]区间时,则ymax为1,ymin为0。

    4.  根据权利要求1所述的一种动态数据环境下的数据流混合分类方法,其特征在于,所述步骤4中数据集成分类器??椋?05)采用支持向量机模型作为基本分类模型对数据流进行分类,并构建集成分类器,包括以下步骤:
    步骤4.1:首先使用两种支持向量机模型作为基本分类模型,即C-SVM和ν(nu)-SVM模型;
    步骤4.2:使用三种个函数对上述两种支持向量机模型进行划分,得到六个不同的支持向量机分类模型,其中,所使用核函数为线性核函数、高斯径向基核函数和Sigmoid核函数;
    步骤4.3:对得到的集成学习模型进行训练。

    5.  根据权利要求1所述的一种动态数据环境下的数据流混合分类方法,其特征在于,所述步骤5中参数优化??椋?06)对所构建的集成分类器进行参数优化,所使用优化方法为粒子群算法,优化过程包含以下步骤:
    步骤5.1:首先将使用C-SVM和高斯径向基核函数所构建的分类模型中的参数cg进行提??;
    步骤5.2:将数据流初始化??椋?04)归一化后的验证数据集输入到该模型中,然后使用PSO算法对参数进行优化,其中优化过程中的适应性函数使用m交叉验证的方法,其公式表示为:
                                    
    其中,参数m从验证集抽取出的样本子集的数量,li表示每个样本子集中的样本数量,liT表示子集中被分类正确的样本数量;
    步骤5.3:将优化后的参数cg加入到模型中作为模型内部参数使用。

    6.  根据权利要求1所述的一种动态数据环境下的数据流混合分类方法,其特征在于,所述步骤7中聚类??椋?07)针对集成分类器给出的分类结果即数据集L进行聚类,得到最终的分类结果,所使用聚类方法为自组织映射,包含以下步骤:
    步骤7.1:首先对SOM模型进行训练,得到训练后的SOM模型;
    步骤7.2:将测试集输入到构建好后的集成分类模型中,得到测试集对应的类别标签数据集;
    步骤7.3:将类别标签数据集输入到训练好的SOM模型中,模型计算所输入样本与最终类别的距离,找到被激活节点,计算方法如下:
                           
    其中,x表示输入样本,wi表示SOM模型每个节点之间的权重;
    步骤7.4:重复步骤7.2至步骤7.3,直到所有数据均被分类完毕。

    7.  据权利要求2所述的一种动态数据环境下的数据流混合分类方法,其特征在于,所述步骤2.2中所使用的测试集是验证集和训练集之外的集合,其大小等同于滑动窗口大小N,参数N必须提前人为设定。

    8.  根据权利要求4所述的一种动态数据环境下的数据流混合分类方法,其特征在于,所述步骤4.3中所使用集成学习模型训练方法,包含以下子步骤:
    步骤4.3.1:首先将训练集划分为六个数据子集,划分方法为等分法;
    步骤4.3.2:将划分好后的分别输入到集成学习模型中的六个分类器中进行训练。

    9.  据权利要求5所述的一种动态数据环境下的数据流混合分类方法,其特征在于,所述步骤5.2中所使用PSO优化方法,包含以下子步骤:
    步骤5.2.1:首先使用随机值对所要优化的变量进行赋值;
    步骤5.2.2:然后在优化过程中不断更新两个变量v[]和present的值,更新方法如下,
                   
    其中,v[]表示PSO算法的寻优速度,present[]表示当前最优值在解空间的位置和方向,表示一个随机函数,给出的随机值范围为(0,1),变量c1 和 c2 表示学习因子;
    步骤5.2.3:重复上述步骤,直至满足步骤5.2中的适应性函数。

    10.  根据权利要求6所述的一种动态数据环境下的数据流混合分类方法,其特征在于,所述步骤7.1中所使用SOM聚类模型的训练过程包含以下步骤:
    步骤7.1.1:首先将验证数据集输入到集成学习分类模型中,得到验证数据集所对应的类别数据集L;
    步骤7.1.2:将所得到的类别数据集对SOM模型进行训练。

    关 键 词:
    一种 动态 数据 环境 数据流 混合 分类 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种动态数据环境下的数据流混合分类方法.pdf
    链接地址://www.4mum.com.cn/p-6181303.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03