• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 6
    • 下载费用:30 金币  

    重庆时时彩出现2.05: 一种针对电商用户海量行为数据的获取和存储方法.pdf

    关 键 词:
    一种 针对 商用 海量 行为 数据 获取 存储 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201510108086.4

    申请日:

    2015.03.12

    公开号:

    CN104680398A

    公开日:

    2015.06.03

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情: 发明专利申请公布后的视为撤回IPC(主分类):G06Q 30/02申请公布日:20150603|||实质审查的生效IPC(主分类):G06Q 30/02申请日:20150312|||公开
    IPC分类号: G06Q30/02(2012.01)I 主分类号: G06Q30/02
    申请人: 浪潮集团有限公司
    发明人: 刘强
    地址: 250101山东省济南市高新区舜雅路1036号
    优先权:
    专利代理机构: 济南信达专利事务所有限公司37100 代理人: 姜明
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201510108086.4

    授权公告号:

    ||||||

    法律状态公告日:

    2018.05.25|||2015.07.01|||2015.06.03

    法律状态类型:

    发明专利申请公布后的视为撤回|||实质审查的生效|||公开

    摘要

    本发明公开了一种针对电商用户海量行为数据的获取和存储方法,属于数据采集领域。该方法通过监听器监听用户会话的生命的周期,分析会话生命周期内用户的每次点击行为,缓存到消息队列中,在消息队列缓冲区大小超过指定值的时候,将用户行为信息批量持久化,为电商企业用户行为分析提供支持。与现有技术相比,本发明的方法能够在不影响用户体验的前提下,采集电商企业需要的用户行为数据,且具有良好的实用性及推广应用价值。

    权利要求书

    权利要求书
    1.  一种针对电商用户海量行为数据的获取和存储方法,其特征在于包括如下步骤:
    步骤一:使用监听器跟踪用户请求;
    步骤二:分析用户每次请求,筛选有效信息放到消息队列中;
    步骤三:判断消息队列缓冲区大小,批量持久化数据。

    2.  根据权利要求1所述的针对电商用户海量行为数据的获取和存储方法,其特征在于,步骤二所述有效信息包括访客基本信息、访客会话信息、访客请求信息。

    3.  根据权利要求1所述的针对电商用户海量行为数据的获取和存储方法,其特征在于,步骤三的具体方法为:设置消息队列缓冲区指定大小,判断消息队列缓冲区大小是否超过阀值,超过则批量化则将用户行为数据持久化。

    说明书

    说明书一种针对电商用户海量行为数据的获取和存储方法

    技术领域
    本发明涉及数据采集领域,具体地说是一种针对电商用户海量行为数据的获取和存储方法。
    背景技术
    对于电商行业来说,数据的重要性毋庸置疑,围绕着大数据收集、存储、挖掘和分析已经成为未来电商企业的制胜关键和利润焦点。然而,用户行为采集是一个比较消耗资源的操作,尤其是访问用户增多时,实时分析记录对系统造成极大的压力,极大的影响用户体验。
    如何使业务的运行建立在细分市场、客户群,将最合适的业务和产品在最合适的时机以最恰当的推销方式销售给最需要的客户,实现业务和客户的最佳匹配,成为电商企业的重要目标。
    发明内容
    本发明的技术任务是针对上述现有技术的不足,提供一种针对电商用户海量行为数据的获取和存储方法。该方法将传统的单服务器处理方式改成服务器集群的处理方式,能够最大限度的使用计算机资源,有效的进行水平扩展。数据转换的基本组成是步骤,而通过服务器集群技术的应用,把转换中的每一个步骤都能放在单独的服务器里面并行的执行,将极大提高数据处理的效率。
    本发明的技术任务是按以下方式实现的:一种针对电商用户海量行为数据的获取和存储方法,包括如下步骤:
    步骤一:使用监听器跟踪用户请求;
    步骤二:分析用户每次请求,筛选有效信息放到消息队列中;
    步骤三:判断消息队列缓冲区大小,批量持久化数据。
    作为优选,步骤二所述有效信息包括访客基本信息、访客会话信息、访客请求信息。
    所述访客基本信息包括访客的IP,操作系统,浏览器,屏幕分辨率,及来源地(此来源地就是广告商或搜索引擎链接过来的地址),访客创建时间。
    进一步的,根据基础数据可得到以下信息:
    1.访客的IP:可以统计出IP对应的实际区域,也就是说可以找出地理区域访客量;
    2. 访客基本信息的来源地:可以得到,访客是从哪个网站点击到我们网站上的,还可以得到访客是搜索引擎点击到我们网站上,并可以得到,搜索的关键词;
    3. 会话的来源地:此次会话是从哪些网站链接过来的,如果为空,表示此次用户进入网站没有经过任何广告或搜索引擎;
    4.会话来源地+访客来源地:此组合比较可以得出访客最早是从哪一个广告商或搜索引擎链接过来的,并可以得到各来源地的回头客数量;
    5.访客会话信息的帐户ID + 来源地:可以查看各来源地的访客注册率,及订单生成率;
    6.访客请求URL:可以统计出各页面、栏目、商品、信息的访问率;网站搜索的关键词,网站收藏夹的使用率;
    7.访客鼠标点击:可以统计出访客在某些页面的访问习惯;
    8. 访客请求URL+请求时间+会话开始时间:可以统计出入口页面,出口页面。
    所述访客会话信息包括会话开始的时间,此次会话的来源地,此次会话访客登录的帐户ID。
    所述访客的请求信息包括请求的URL地址,请求的时间,此次请求客户端打开页面的时间。
    作为优选,步骤三的具体方法为:设置消息队列缓冲区指定大小,判断消息队列缓冲区大小是否超过阀值,超过则批量化则将用户行为数据持久化。
    本发明提供了一种针对电商用户海量行为数据的获取和存储方法,与现有技术相比,该方法具有以下突出的有益效果:
    一、能够较为完整的得到了详尽的用户行为数据;
    二、由于使用异步持久化,能够在不影响用户体验的前提下,采集电商企业需要的用户行为数据。
    附图说明
    附图1是本发明针对电商用户海量行为数据的获取和存储方法的流程图。
    具体实施方式
    参照说明书附图以具体实施例对本发明的针对电商用户海量行为数据的获取和存储方法作以下详细地说明。
    实施例:
    如附图1所示,本发明的针对电商用户海量行为数据的获取和存储方法包括如下步骤:
    步骤一:用户访问网站发起请求
    步骤二:监听器接收到用户请求
    步骤三:分析用户每次请求,筛选有效信息放到消息队列中
    所述有效信息包括访客基本信息、访客会话信息、访客请求信息。
    其中,访客基本信息包括访客的IP,操作系统,浏览器,屏幕分辨率,及来源地(此来源地就是广告商或搜索引擎链接过来的地址),访客创建时间。
    根据上述基础数据可得到以下信息:
    1.访客的IP:可以统计出IP对应的实际区域,也就是说可以找出地理区域访客量;
    2. 访客基本信息的来源地:可以得到,访客是从哪个网站点击到我们网站上的,还可以得到访客是搜索引擎点击到我们网站上,并可以得到,搜索的关键词;
    3. 会话的来源地:此次会话是从哪些网站链接过来的,如果为空,表示此次用户进入网站没有经过任何广告或搜索引擎;
    4.会话来源地+访客来源地:此组合比较可以得出访客最早是从哪一个广告商或搜索引擎链接过来的,并可以得到各来源地的回头客数量;
    5.访客会话信息的帐户ID + 来源地:可以查看各来源地的访客注册率,及订单生成率;
    6.访客请求URL:可以统计出各页面、栏目、商品、信息的访问率;网站搜索的关键词,网站收藏夹的使用率;
    7.访客鼠标点击:可以统计出访客在某些页面的访问习惯;
    8. 访客请求URL+请求时间+会话开始时间:可以统计出入口页面,出口页面。
    所述访客会话信息包括会话开始的时间,此次会话的来源地,此次会话访客登录的帐户ID。
    所述访客的请求信息包括请求的URL地址,请求的时间,此次请求客户端打开页面的时间。
    步骤四:判断消息队列缓冲区大小,批量持久化数据
    设置消息队列缓冲区指定大小,判断消息队列缓冲区大小是否超过阀值,超过则批量化则将用户行为数据持久化。

    关于本文
    本文标题:一种针对电商用户海量行为数据的获取和存储方法.pdf
    链接地址://www.4mum.com.cn/p-5886975.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 甘肃十一选五前三基本走势 上海时时乐走势图2oo期 晓游棋牌下载官网 幸运赛车遗漏 双色球带坐标连线带画笔 内蒙古十一选五彩经网 新浪模拟炒股 辉煌棋牌输了 20181102四川金7乐开奖 qq分分彩和腾讯分分彩有什么区别 甘肃11选5任五遗漏 排列五历史记录查询 325棋牌游戏手机版下载 河北十一选五任五遗漏 足彩14场合买微信群 浙江11选5乐选玩法