• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 16
    • 下载费用:20 金币  

    重庆时时彩开奖网站: 基于分布式的B2B平台的个性化推荐方法与系统.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201410122599.6

    申请日:

    2014.03.28

    公开号:

    CN103886487A

    公开日:

    2014.06.25

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G06Q 30/02申请日:20140328|||公开
    IPC分类号: G06Q30/02(2012.01)I; G06F17/30 主分类号: G06Q30/02
    申请人: 焦点科技股份有限公司
    发明人: 肖洁芩; 徐晓冬; 房鹏展
    地址: 210061 江苏省南京市高新区星火路软件大厦A座12楼
    优先权:
    专利代理机构: 南京知识律师事务所 32207 代理人: 张苏沛
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201410122599.6

    授权公告号:

    ||||||

    法律状态公告日:

    2016.01.27|||2014.07.16|||2014.06.25

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本专利公开了一种基于分布式技术的Hadoop平台上的B2B平台的个性化推荐方法及系统。首先,发明基于Hadoop的分布式存储技术,对各种数据如网站日志文件、产品信息、用户信息等进行集中放置、存储和查询,快速高效的处理数据。其次,使用Hadoop平台下的Hive服务对数据进行预处理,使用Map/Reduce实现高效、快速的实现推荐算法。之后,使用Map/Reduce实现对文本信息进行信息检索、文本挖掘工作,匹配用户对询盘、采购所需要的产品信息,获得个性化推荐信息。最后,使用Hadoop平台下的HBase服务提供大数据存储、查询,提升网站推荐用户响应。

    权利要求书

    权利要求书
    1.  一种B2B电子商务环境下基于分布式处理的个性化推荐方法,其特征在于,具体包括步骤:
    步骤一、形成买家身份知识库以及买家偏好知识库,存储在分布式数据仓库Hive中;
    步骤二、利用获得的买家身份知识库与买家偏好知识库中的数据,通过Map/Reduce实现推荐算法的处理,进行个性化推荐方法的实施,实现在多个场景下的个性化推荐;最终实现网站各页面不同的并行化的推荐,满足用户在各浏览询价阶段对产品的不同需求,推荐方法计算所得结果存入到分布式数据仓库Hive中;
    步骤三、将Hive数据仓库中的用户身份知识库、用户偏好知识库,以及推荐结果,通过ETL进行数据模型的重构,转变为HBase面向列的分布式存储,然后加载到Hadoop平台中的NoSQL数据库HBase中,HBase在海量数据的情况下,提供给B2B电子商务访问者在线高效的数据检索性能;
    步骤四、用户推荐结果的显示步骤。

    2.  根据权利要求1所述的个性化推荐方法,其特征在于:步骤一中,针对B2B平台的特点,采集买家在电子商务平台各类型行为数据,数据来源大致三种:(1)网络日志;(2)买家客服运营数据;(3)线下交易会买家身份数据及偏好;
    对不同数据源的数据,包括文本数据网络日志,买家客服维护操作的运营数据,以及人工录入或移动端采集的线下酒会、展会获得的买家信息及其采购需求数据,根据其特点进行不同方式的处理;
    a)对业务系统数据中的买家客服运营信息,包含邮件、电话回访记录、邮件营销反馈结果、用户调研问卷,清洗关联这些相关信息,并将处理结果存入Oracle关系型数据仓库中;
    b)对网站日志使用分布式技术Map/Reduce进行解析和计算,获得用户行为数据,包括用户点击了哪些产品,用户询盘了哪些产品信息,汇总统计,为推荐算法的计算提供数据准备,存入分布式数据仓库Hive中;
    c)对于线下活动产生的移动端数据、名片数据,采用ETL工具将数据清洗、整合后,存储到Oracle关系型数据库中;
    d)采用Hadoop平台的Sqoop工具,将Oracle的数据加载到Hive数据库中,
    通过ETL把用户的身份信息进行关联,形成网站买家身份知识库;
    e)在Hive中整合买家的多种信息,最后形成网站买家偏好知识库;其数据来源包括:
    ●在网站上的浏览、搜索、询盘记录;
    ●客服与买家沟通形成的买家偏好信息记录;
    ●买家在展会现场移动端留下的包含偏好信息的记录;
    网站买家身份知识库和网站买家偏好知识库都存在分布式数据仓库Hive中;这两个知识库为推荐算法提供所需要的计算数据。

    3.  根据权利要求1所述的个性化推荐方法,其特征在于:步骤二中,所述进行个性化推荐方法的实施,具体步骤:
    步骤2.1:从数据源获取的网站产品信息数据加载到Hive中与买家偏好知识库中偏好信息进行关联,形成用户产品宽表;
    步骤2.2:在用户产品宽表的基础上,获得用户产品评分矩阵;
    步骤2.3:计算产品相似度,已知两个用户内容数据u(Content(keyword1,keyword2, keyword3,…keywordk,..)),v(Content(keyword1, keyword2, keyword3,…keywordk,..)), 考虑到标签的热度, 相似性公式为:
    content_sim(u,v)=Σt∈Content(u)Content(v)(e1interest(i)-1)|Content(u)Content(v)|]]>
    其中Content(u)为用户u标签集合,Content(v)为用户v的标签集合,interest(i)表示打过标签i用户个数,keywordk指标签,使用每个产品的多个关键词作为产品的多个标签;
    步骤2.4:最终用户的相似性为用户行为相似性和产品内容相似性的加权平均,
    sim(u,v)=βAction_sim(u,v)+(1-β)Content_sim(u,v)
    其中β 为参数因子,称推荐系数,取值范围为[0,1];
    步骤2.5:计算产品的预测评分:
    Pu,i=R‾u+Σsim(u,v)×(Rn,i-R‾n)Σ|sim(u,v)|]]>
    sim(u,v)为用户u和用户v的相似度,Rn,i为最近邻集中的用户n对产品i的评分,分别为用户u和用户n对产品的平均评分。

    4.  根据权利要求3所述的个性化推荐方法,其特征在于:用户对产品的评分是用户对产品喜好的量化处理;用户喜好分显性兴趣度与隐性兴趣度两种兴趣度加权累加获得用户对产品的评分,显性兴趣度使用用户询盘量获得,隐性兴趣度使用用户对产品的浏览量获得;
    使用Jaccard度量两个用户行为相似度action_sim(u,v)的基础上加入每个产品i赋予的惩罚处理因子因为考虑到用户关注产品的曲线符合长尾分布,其中interest(i)表示喜欢产品i的用户个数;用户行为数据相似度度量方法为:
    Action_sim(u,v)=Σi∈Action(u)Action(v)(e1interest(i)-1)|Action(u)Actinon(v)|]]>
    其中u,v为用户,i为产品,Action(u)表示用户u所喜欢的产品集合,Action(v)表示用户v所喜欢产品集合,interest(i)表示喜欢产品i的用户个数。

    5.  根据权利要求1所述的个性化推荐方法,其特征在于:步骤二中,所述场景包括首页、目录页、询盘完成页、产品页;
    a)当用户访问首页阶段,在确定用户身份信息后,根据买家偏好知识库中的用户历史行为数据,使用协同过滤与基于内容算法相结合的推荐方法,推荐相关产品;
    b)在用户访问目录页阶段,在目录页依据统计分析方法获得行业的热门产品推荐,其中,热门产品根据统计每个行业内被买家最多点击与询盘的产品获得;
    c)在用户完成询盘阶段,使用协同过滤与基于内容算法相结合的推荐方法,推荐相关产品;
    d)在用户访问产品页阶段,使用协同过滤与基于内容的推荐方法,推荐用户相关产品。

    6.  根据权利要求1所述的个性化推荐方法,其特征在于:步骤四中,用户推荐结果的显示策略步骤为:
    a)用户在网站进行活动时,系统获取用户的Cookie、IP、Email信息,利用HBase分布式高写入的特性,将数据写入到HBase中,通过不同场景的特点,关联到用户身份;
    b)根据识别后的用户身份,如果此用户是具有历史行为的老用户,推荐系统中已经计算好此用户的推荐产品,将计算好的用户推荐产品列表反馈到网页的推荐位置即可;
    c)如果用户为新用户时,由于缺少其历史行为数据,这时系统反馈无用户信息,将返回某些行业的热门产品。

    7.  根据权利要求6所述的个性化推荐方法,其特征在于:在线推荐情景下,分别根据用户在网站的不同行为所能获取的用户身份,把用户分为以下几个身份等级:
    ●0级,用户没有登录、询盘,身份信息为:Cookie、IP;
    ●1级,用户发送询盘或者用户注册,身份信息为:Email或者公司标识号com_id;
    ●2级,用户登录状态下发送询盘,身份信息为:公司标识号com_id和Email;
    ●3级,网站运营覆盖用户,身份信息为:公司名称、地址、业务范围、意向卖家;
    等级越高,身份信息越丰富,偏好越明确,相对的推荐就越简单,推荐的结果就更加准确;获取用户身份信息,根据用户身份知识库关联获取用户的所有身份,确定用户的身份等级,根据不用的等级,将用户偏好的数据进行权重的调整,并加载到HBase中进行数据的检索、排序。

    8.  一种基于分布式的B2B平台个性化推荐系统,包含数据源???、分布式计算???、分布式数据仓库???、数据转换加载???、分布式列式存储???、推荐显示???,其特征在于:数据源??橹罅臃植际郊扑隳??,将分布式计算??榛竦玫氖荽嫒敕植际绞莶挚饽??,之后进入数据转换加载???,将变换后的数据存入分布式列式存储???,最后形成的推荐列表在推荐显示??橹薪姓瓜?;
    所述数据源???,用于记录用户访问网站时留下的行为身份数据,作为整个推荐系统的数据来源,来自于业务系统、文本文件或其它获取途径;
    所述分布式计算???,对数据源中基础数据进行清洗、关联处理,最终存放到Hive中;其中包括2个子??椋荷矸菔侗鸺扑阕幽??、数据挖掘计算子???;对各数据源获得的用户数据,包括网络日志、运营数据、线下推广数据,作为输入数据,输入到身份识别计算子??楹褪萃诰蚣扑阕幽??,获得买家身份知识库、买家偏好知识库、用户产品推荐列表;所述身份识别计算子???,用于将用户在网站、运营、线下产生的身份相关信息进行识别,将不同来源的身份信息进行合并,关联,定位用户身份,从而更精确的了解用户的历史行为;所述数据挖掘计算子???,使用各数据源获得的数据,形成买家偏好库,通过分布式挖掘计算技术,实现设计的数据挖掘算法,提供推荐产品;
    所述分布式数据仓库???,用于把业务系统、文本文件或其它获取途径获取的数据预处理后,获得的包含有存储身份识别信息、买家偏好信息和推荐结果信息,利用分布式技术将这些处理后的数据进行存储;
    所述数据转换加载???,将不同数据结构的数据库里的数据进行数据的交换,实现数据结构的重构,数据的整理;
    所述分布式列式存储???,利用分布式技术,实现列式存储的数据库功能,对于在线情况发生的高速读和高速写进行支持,提高系统对用户操作的推荐响应性能;
    所述推荐显示???,根据不同的场景提供给用户不用的推荐产品,并把每次用户对于推荐产品的反应反馈到数据仓库中。

    关 键 词:
    基于 分布式 B2B 平台 个性化 推荐 方法 系统
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:基于分布式的B2B平台的个性化推荐方法与系统.pdf
    链接地址://www.4mum.com.cn/p-6126448.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03