• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 17
    • 下载费用:20 金币  

    重庆时时彩精准走势图: 一种应用于游戏道具推荐的频繁项集挖掘方法.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201611144649.6

    申请日:

    2016.12.13

    公开号:

    CN106815302A

    公开日:

    2017.06.09

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G06F 17/30申请日:20161213|||公开
    IPC分类号: G06F17/30; G06F9/50 主分类号: G06F17/30
    申请人: 华中科技大学
    发明人: 金海; 张舫; 张宇; 廖小飞
    地址: 430074 湖北省武汉市洪山区珞喻路1037号
    优先权:
    专利代理机构: 华中科技大学专利中心 42201 代理人: 李智
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201611144649.6

    授权公告号:

    |||

    法律状态公告日:

    2017.07.04|||2017.06.09

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本发明实现了一种频繁项集挖掘方法,属于数据挖掘技术领域。本发明方法首先在MapReduce上得到每项出现次数,经过排序以及阈值筛选,剔除不符合的项,得到F??List,然后划分F??List得到G??List,根据G??List的划分,数据传给Mapper,并经过Mapper处理,将数据传给Reducer,在Reducer上进行MapReduce的挖掘。挖掘首先需要得到每个Reducer上的PPCTree,得到PPCTree后进而得到N??List,以及各个Reducer上对应项的G??Subsume,最后根据N??List和G??Subsume递归得到最终的频繁项集。本发明依据负载预测合理划分数据,保证负载均衡;通过优化递归挖掘流程,大大减少密集型数据挖掘时间。

    权利要求书

    1.一种频繁项集挖掘方法,其特征在于,包括以下步骤:
    (1)通过Mapreduce统计原始数据中各项的出现次数;
    (2)依据各项出现次数筛选出频繁一项,将频繁一项按照出现次数由高到低排序构成
    F-List;
    (3)按照负载均衡原则对F-List中的各项分组,得到包含项和其所属组号信息的G-
    List;
    (4)Mapper对原始数据进行分配:
    (4-1)对每条原始数据的各项按照F-List中项顺序进行重新排序;
    (4-2)从每条原始数据的最后一项开始读取项item,在G-List中查找item的组号gid,
    然后以gid作为键key,将数据中排在item前面的所有项作为值value构成键值对<key=
    gid,value=items>,作为Mapper输出的键值对,若组号gid已出现过,则忽略,继续取前一
    项进行相同操作,直到一条数据处理完毕;
    (5)Reducer对Mapper输出的键值对进行频繁项集挖掘:
    (5-1)根据Mapper输出的key=gid,将value=items分配给相应的reducer,reducer构
    建PPCtree;PPCtree为树状结构,每个节点包含五个属性值:名字、支持度frequency、子节
    点、前序遍历序号pre和后序遍历序号post;
    (5-2)对于PPC-tree中每个节点Ni,将<Ni.pre,Ni.post,Ni.frequency>命名为PP-code,
    将各PP-code按照pre的升序排序,构建得到F-List中每个频繁一项的N-List;
    (5-3)构建Reducer的G-Subsume:
    其中,A和B表示两个不同的频繁一项,A.gid表示项A
    的组号,Reducer.gid表示Reducer对应的组号,g(X)表示包含频繁一项X的数据ID的集合,X
    =A或B,I1表示频繁一项的集合;
    (5-4)递归挖掘,其子步骤如下:
    a)以F-List作为第一轮的递归初始数据,在F-List中取最后一项L,将最后一项L与其
    G-Subsume(L)结合,生成频繁二项集,写入结果数组Result;
    b)在递归初始数据中从前往后逐一取项X,将其N-List即NX的PP-code与L的N-List即
    NLast的PP-code进行比较,若X存在于G-Susbume(L)中,则继续取后一项,否则:
    当NX的PP-code的pre小于NLast的PP-code,且NX的PP-code的post大于NLast的PP-code的
    post,则生成频繁二项集XL,将<NX.PP-code.pre,NX.PP-code.post,NLast.PP-
    code.frequency>加入频繁二项集XL的N-List即NXL,且NLast的PP-code后移;
    当NX的PP-code的pre小于NLast的PP-code,且NX的PP-code的post小于NLast的PP-code的
    post,则NX的PP-code后移;
    当NX的PP-code的pre大于NLast的PP-code,则NLast的PP-code后移,直到NLast和NX的PP-
    code都遍历完毕;
    NX的PP-code遍历完毕后,若最后结果XL的N-List的PP-code的支持度之和不满足阈值,
    则删除XL,若满足则XL为频繁二项集;
    c)继续从递归初始数据中取下一项,重复步骤b),直至递归初始数据中最后一项L之前
    的所有项比较完毕,即得到了以最后一项L为后缀的频繁二项集及其N-List,写入结果数组
    Result并将其N-List作为频繁三项集挖掘的初始数据,该频繁二项集直接与G-Subsume(L)
    合并得到以L为后缀的部分频繁三项集,加入数组Result;
    d)在递归初始数据中取倒数第二项,重复上述步骤a)、b)、c),直至递归初始数据中所
    有项操作完毕,即得到了所有的频繁二项集和部分频繁三项集;
    e)提取仅前缀不一样的频繁二项集作为第二轮的递归初始数据,从最后一项开始,按
    照与步骤b)-d)的相同方式处理,得到所有的频繁三项集,并将频繁三项集中后缀有G-
    Subsume的项与其G-Subsume结合得到频繁四项集;
    f)以此类推,直到最后通过N-List比较得到唯一的频繁K项集,递归结束;
    (5-5)Reducer输出<key=item∈gid,value=Result>,至此完成所有的频繁项集挖掘
    过程。
    2.根据权利要求1所述的频繁项集挖掘方法,其特征在于,所述步骤(1)的具体实现步
    骤为:
    (1-1)对原始数据库进行水平分片处理,分片得到的每一个子文件叫做Block块,Block
    块被分配到集群中的节点上;
    (1-2)Block块作为每个Map函数的输入数据,对于Block块中的一条数据Ti中的每一个
    项aj,Mapper的输出键值对<key=aj,value=1>;
    (1-3)所有key=aj的键值对将被分配到同一个Reducer,则Reducer的输入是<key=aj,
    value={1,1,...,1}>,Reducer进行一次求和输出<key=aj,value=sum{1,1,...,1}>。
    3.根据权利要求1或2所述的频繁项集挖掘方法,其特征在于,所述步骤(3)中负载均衡
    原则为:将F-list中各项的排序号作为负载值,依据负载值对F-List中的各项分组。
    4.根据权利要求1或2所述的频繁项集挖掘方法,其特征在于,所述G-List采用哈希表
    存储。

    关 键 词:
    一种 应用于 游戏 道具 推荐 频繁 挖掘 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种应用于游戏道具推荐的频繁项集挖掘方法.pdf
    链接地址://www.4mum.com.cn/p-6027790.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03