• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 14
    • 下载费用:30 金币  

    关于外围重庆时时彩: 特征匹配方法和装置.pdf

    关 键 词:
    特征 匹配 方法 装置
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201010127163.8

    申请日:

    2010.03.16

    公开号:

    CN102193948A

    公开日:

    2011.09.21

    当前法律状态:

    驳回

    有效性:

    无权

    法律详情: 发明专利申请公布后的驳回IPC(主分类):G06F 17/30申请公布日:20110921|||实质审查的生效IPC(主分类):G06F 17/30申请日:20100316|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 华为技术有限公司
    发明人: 阳生丙; 曾佳; 周咸春; 王晓波
    地址: 518129 广东省深圳市龙岗区坂田华为总部办公楼
    优先权:
    专利代理机构: 北京同立钧成知识产权代理有限公司 11205 代理人: 刘芳
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201010127163.8

    授权公告号:

    ||||||

    法律状态公告日:

    2014.07.16|||2011.11.23|||2011.09.21

    法律状态类型:

    发明专利申请公布后的驳回|||实质审查的生效|||公开

    摘要

    本发明实施例涉及一种特征匹配方法和装置,其中,该特征匹配方法包括:根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配;若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配。本发明实施例将输入数据与已学习的历史特征数据集合进行比较,如果历史特征数据集合中存在全部匹配的历史特征数据,可以直接得到匹配结果,降低了访问特征库的频率,提高了匹配速度和效率。

    权利要求书

    1.一种特征匹配方法,其特征在于,包括:根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配;若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配。2.根据权利要求1所述的特征匹配方法,其特征在于,所述输入数据为统一资源定位符,所述统一资源定位符包括主机名和路径,所述若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配,包括:若所述历史特征数据集合中的历史特征数据与所述主机名和路径全部不匹配,则将所述主机名和路径发送至匹配引擎进行特征匹配;或者,若所述历史特征数据集合中存在与所述主机名全部匹配的历史特征数据,将所述路径发送至匹配引擎进行特征匹配;或者在存在与所述路径为部分匹配的历史特征数据时,将所述路径的未匹配的部分发送至匹配引擎进行特征匹配;或者将主机名和所述路径发送至匹配引擎进行特征匹配。3.根据权利要求1所述的特征匹配方法,其特征在于,所述输入数据为字符串,所述若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配,包括:若所述历史特征数据集合中的历史特征数据与所述字符串全部不匹配,则将所述字符串发送至匹配引擎进行特征匹配;或者,若所述历史特征数据集合中不存在与所述字符串全部匹配的历史特征数据,但存在与所述字符串部分匹配的历史特征数据,则将所述字符串发送至匹配引擎进行特征匹配;或者将所述字符串未匹配的部分发送至匹配引擎进行特征匹配。4.根据权利要求1-3任一所述的特征匹配方法,其特征在于,还包括:接收并学习所述匹配引擎发送的历史特征数据及其对应的匹配结果。5.一种特征匹配装置,其特征在于,包括:记忆分拣单元和匹配引擎;所述记忆分拣单元包括:数据集匹配??楹团芯瞿??;所述数据集匹配???,用于根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配;所述判决???,用于若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至所述匹配引擎进行特征匹配;所述匹配引擎,用于根据特征库中对接收到的输入数据进行特征匹配。6.根据权利要求5所述的特征匹配装置,其特征在于,所述记忆分拣单元还包括:历史特征数据集合,用于存储所述匹配引擎发送的历史特征数据及其对应的匹配结果。7.根据权利要求5或6所述的特征匹配装置,其特征在于,所述判决??榘ǎ?/claim-text>统一资源定位符子???,用于当所述输入数据为统一资源定位符,所述统一资源定位符包括主机名和路径时:若所述历史特征数据集合中的历史特征数据与所述主机名和路径全部不匹配,则将所述主机名和路径发送至匹配引擎进行特征匹配;或者,若所述历史特征数据集合中存在与所述主机名全部匹配的历史特征数据,将所述路径发送至匹配引擎进行特征匹配,或者在存在与所述路径为部分匹配的历史特征数据时,将所述路径的未匹配的部分发送至匹配引擎进行特征匹配,或者将主机名和所述路径发送至匹配引擎进行特征匹配;或者,字符串子???,用于当所述输入数据为字符串时,若所述历史特征数据集合中的历史特征数据与所述字符串全部不匹配,则将所述字符串发送至匹配引擎进行特征匹配;或者若所述历史特征数据集合中不存在与所述字符串全部匹配的历史特征数据,但存在与所述字符串部分匹配的历史特征数据,则将所述字符串发送至匹配引擎进行特征匹配,或者将所述字符串未匹配的部分发送至匹配引擎进行特征匹配。8.根据权利要求5或6所述的特征匹配装置,其特征在于,还包括:结果管理???,用于接收所述记忆分拣单元和所述匹配引擎输入的匹配结果,按照设定规则根据所述匹配结果确定输出结果。

    说明书

    特征匹配方法和装置

    技术领域

    本发明实施例涉及通信技术领域,特别涉及一种特征匹配方法和装置。

    背景技术

    随着互联网的飞速发展,网络的业务种类越来越多,新业务层出不穷且越来越复杂,新问题也越来越多。例如:在网络控制和带宽管理方面,P2P业务占据了70%的网络带宽资源,有的甚至是对网络带宽的恶意占用,严重影响了用户的体验;在网络安全方面,网络入侵和攻击越来越多的集中在应用层,普通的防火墙对于藏身于IP包净荷之中的病毒传播、攻击作用较弱;另外,运营商为了避免沦为“管道商”的尴尬,还有按内容计费的需求。

    为了解决这些问题,需要对网络上的数据包应用层内容进行识别,从而产生了深度包检测(Deep?Packet?Inspection;简称:DPI)技术。DPI技术为:对不同业务的应用层内容进行分析,提取出能唯一区别某个业务的特征规则;将网络上的数据包与该特征规则进行匹配,如果匹配成功,则可以识别出该业务,进而执行与该业务对应的操作。现有的DPI技术中,当匹配引擎接收到网络数据包时,将网络数据包的一部分(或全部)数据与特征库中的数据结构进行匹配。特征库的数据量大,一般存储在片外。

    发明人在实现本发明的过程中发现现有技术至少存在如下问题:

    匹配引擎接收到重复的网络数据包时,匹配操作重复,访问特征库的动作频繁,造成匹配速度慢、效率低。

    发明内容

    本发明实施例提供一种特征匹配方法和装置,用以解决现有特征匹配速度慢、效率低的问题,提高匹配速度和效率。

    本发明实施例提供一种特征匹配方法,包括:

    根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配;

    若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;

    若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配。

    本发明实施例又提供一种特征匹配装置,包括:记忆分拣单元和匹配引擎;所述记忆分拣单元包括:数据集匹配??楹团芯瞿??;

    所述数据集匹配???,用于根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配;

    所述判决???,用于若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至所述匹配引擎进行特征匹配;

    所述匹配引擎,用于根据特征库中对接收到的输入数据进行特征匹配。

    本发明实施例提供的特征匹配方法和装置,将输入数据与已学习的历史特征数据集合进行比较,如果历史特征数据集合中存在全部匹配的历史特征数据,可以直接得到匹配结果,降低了访问特征库的频率,提高了匹配速度和效率。

    附图说明

    图1为本发明特征匹配方法第一实施例的流程示意图;

    图2a为本发明特征匹配方法第二实施例的流程示意图;

    图2b为本发明特征匹配方法第二实施例的应用场景的示意图;

    图3a为本发明特征匹配方法第三实施例的流程示意图;

    图3b为本发明特征匹配方法第三实施例的应用场景的示意图;

    图4为本发明特征匹配装置第一实施例的结构示意图;

    图5为本发明特征匹配装置第一实施例的示意图。

    具体实施方式

    下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

    图1为本发明特征匹配方法第一实施例的流程示意图,如图1所示,该特征匹配方法包括:

    步骤101、根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配;

    在执行步骤101之前,可以接收并学习所述匹配引擎发送的历史特征数据及其对应的匹配结果,具体地:匹配引擎根据特征库中规则对输入数据进行特征匹配后,如果匹配成功,可以将该输入数据对应的与特征库中规则相匹配的特征数据和匹配结果发送给记忆分拣单元。记忆分拣单元接收到已经匹配成功的特征数据和匹配结果后,可以将该特征数据保存为历史特征数据,并保存该历史特征数据对应的匹配结果。其中,记忆分拣单元将历史特征数据保存到历史特征数据集合中时,可以采用一定的算法,例如:哈希(hash)算法或直接映射等方法进行保存,然后可以根据一定的规则定期更新历史特征数据集合,例如:如果用hash算法建立历史特征数据集合,在出现hash冲突时,可以用新的hash表项代替旧的hash表项,完成历史特征数据集合的更新;或者也可以采用其他的规则,例如:最近最不经常使用规则等,更新历史特征数据集合。

    后续的处理过程中,记忆分拣单元接收到输入数据后,与先前学习到的与特征库中规则相匹配的历史特征数据进行比较。其中,特征库是用一定数据结构表示的特征集,包括大量的数据结构。匹配引擎可以包含一个或多个串行或并行的子匹配引擎。当匹配引擎接收到输入数据时,逐次取出输入数据的一部分或全部与特征库中的数据结构进行匹配,当输入数据与表示某个特征的数据结构匹配上时,可以输出匹配到的特征。如果输入数据在特征库没有匹配上任何特征,则可以输出未匹配信息。

    步骤102、若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;

    如果输入数据与历史特征数据集合中的某条历史特征数据完全相同(即两者全部匹配),则记忆分拣单元可以直接将该历史特征数据对应的匹配结果作为当前输入数据的匹配结果,当前输入数据不需要再送给匹配引擎进行匹配,可以直接将该匹配结果发送给结果管理??榻写?,确定最终的输出结果。例如:如果输入数据为统一资源定位符(URL),该URL与历史特征数据集合中的某条已有的URL全部匹配,则可以将该已有的URL对应的匹配结果作为当前输入的URL的匹配结果;如果输入数据为字符串,该字符串与历史特征数据集合中的某条已有的字符串全部匹配,则可以将该已有的字符串对应的匹配结果作为当前输入的字符串的匹配结果。

    步骤103、若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配。

    其中,历史特征数据集合中不存在与输入数据全部匹配的历史特征数据具体可以包括:历史特征数据集合中的任意一条历史特征数据与输入数据全部不匹配,此时,可以直接将该输入数据发送至匹配引擎进行特征匹配;或者虽然历史特征数据集合中没有与输入数据全部匹配的历史特征数据,但有与输入数据部分匹配的历史特征数据,此时记忆分拣单元可以将所述输入数据中未匹配的部分发送至匹配引擎进行特征匹配并通知匹配引擎从特征库中开始匹配的位置;匹配引擎可以按照该从特征库开始匹配的位置对输入数据未匹配成功的部分进行匹配,无需对全部的输入数据进行匹配,从而可以提高匹配速度。其中,匹配引擎可以由一个或多个串行或并行的匹配子引擎组成,每个匹配子引擎访问特征库,根据特定的算法确定输入数据中需要匹配的部分是否能够匹配上特征库中的规则。如果匹配上了,则一方面将输入数据的部分或全部及匹配结果返回给记忆分拣单元,记录到历史特征数据集合中,一方面将匹配结果发送给结果管理???。结果管理??樵蚩梢愿萁邮盏降募且浞旨鸬ピ推ヅ湟娴钠ヅ浣峁?,采用特定的规则进行处理,确定最终的输出结果。

    进一步地,步骤103可以包括以下示例:

    示例一、所述输入数据为统一资源定位符(URL),所述统一资源定位符包括主机名(host)和路径(path)。

    若所述历史特征数据集合中的历史特征数据与所述主机名和路径全部不匹配,则将所述主机名和路径发送至匹配引擎进行特征匹配;或者,

    若所述历史特征数据集合中存在与所述主机名全部匹配的历史特征数据,将所述路径发送至匹配引擎进行特征匹配;或者在存在与所述路径为部分匹配的历史特征数据时,将所述路径的未匹配的部分发送至匹配引擎进行特征匹配;或者将主机名和所述路径发送至匹配引擎进行特征匹配。

    其中,由于同一个数据流的统一资源定位符的主机名可能相同,但路径相同的几率较低,因此历史特征数据集合中可以仅保存匹配成功的主机名,比较时仅比较主机名,然后将主机名匹配的统一资源定位符的路径发送给匹配引擎进行特征匹配。此外,也可以既保存匹配成功的主机名,又保存匹配成功的路径,此时,则可以既比较主机名,又比较路径,然后将未匹配的部分发送至匹配引擎进行特征匹配。

    示例二、输入数据为字符串。

    若所述历史特征数据集合中的历史特征数据与所述字符串全部不匹配,则将所述字符串发送至匹配引擎进行特征匹配;或者

    若所述历史特征数据集合中不存在与所述字符串全部匹配的历史特征数据,但存在与所述字符串部分匹配的历史特征数据,则将所述字符串发送至匹配引擎进行特征匹配;或者将所述字符串未匹配的部分发送至匹配引擎进行特征匹配。

    本实施例将输入数据与已学习的历史特征数据集合进行比较,如果历史特征数据集合中存在全部匹配的历史特征数据,可以直接得到匹配结果,不需要每次都将输入数据发送给匹配引擎进行匹配,因此无需频繁的访问特征库,降低了访问特征库的频率,提高了匹配速度和效率。

    图2a为本发明特征匹配方法第二实施例的流程示意图,如图2a所示,在本发明特征匹配方法第一实施例的基础上,以输入数据为统一资源定位符(Uniform/Universal?Resource?Locator;简称:URL)为例,URL一般由主机名(host)和路径(path)两部分组成,该特征匹配方法具体可以包括:

    步骤201、匹配引擎将输入的URL与特征库中的规则进行匹配,将匹配成功的URL的主机名和该主机名对应的路径在特征库中开始匹配的位置发送至记忆分拣单元的历史特征数据集合中保存,获取该URL的匹配结果。

    其中,历史特征数据集合可以按照不同的流分别建立不同的子集,也可以将不同流的host建立一个混合的数据集。当历史特征数据集合中记录的host的项数达到最大值时,还可以按照一定的算法将旧的记录删除,如按时间老化、最近最不常使用原则等进行删除。表1为历史特征数据集合保存的URL的host的一种形式。

    表1

    ??host
    ??path在特征库匹配的开始位置
    ??其他信息

    步骤202、记忆分拣单元将接收到的URL的主机名与历史特征数据集合进行比较,判断主机名是否匹配成功,如果是,则执行步骤203,否则,执行步骤204。

    步骤203、将该URL的路径及该路径在特征库中开始匹配的位置发送给匹配引擎进行特征匹配,获取匹配结果。

    步骤204、将该URL全部发送给匹配引擎,返回执行步骤201:匹配引擎根据特征库对该URL进行特征匹配,匹配成功后,获取匹配结果,保存匹配成功的URL的host。

    图2b为本发明特征匹配方法第二实施例的应用场景的示意图,如图2b所示,由于URL由host和path两部分组成,且同一个流的URL的host部分往往是相同的。记忆分拣单元接收到需要匹配URL后,首先提取主机名(host)21,用host作为输入参数采用一定的算法(如hash运算)查找历史特征数据集合22。对查找结果进行判决23,如果当前输入URL的host在历史特征数据集合中已经存在,即host匹配成功,如果历史特征数据集合中没有该URL的host的记录,则host匹配未成功。host匹配成功后,记忆分拣单元不需要将当前输入的URL的host送给匹配引擎进行特征匹配,只需要将该URL的path发送给匹配引擎,同时把path在特征库中开始匹配的位置发送给匹配引擎24进行特征匹配。如果host匹配未成功,则可以将URL全部发送给匹配引擎进行特征匹配。匹配引擎中的各个匹配子引擎如果接收到的待匹配数据是完整的URL且该URL在特征库26中的匹配到了规则,则将该URL的host和该host匹配成功时,一方面将host和对应的path在特征库中开始匹配的位置写入记忆分拣单元的历史特征数据集合(如hash表)中,一方面将匹配结果发送给结果管理???5进行处理,确定最终的输出结果;如果匹配不成功,则可以输出匹配未成功信息。

    本实施例将URL的host与历史特征数据集合进行比较,如果历史特征数据集合中存在与host匹配的历史特征数据,可以将该URL的path发送到匹配引擎进行匹配,不需要每次都将host发送给匹配引擎进行匹配,因此降低了访问特征库的频率,提高了匹配速度和效率。

    图3a为本发明特征匹配方法第三实施例的流程示意图,如图3a所示,在本发明特征匹配方法第一实施例的基础上,如果输入数据为字符串,该特征匹配方法包括:

    步骤301、匹配引擎将输入的特定字符串与特征库中的规则进行匹配,如果匹配成功,获取字符串对应的匹配结果,一方面可以将该匹配结果发送至结果管理??榻写?,确定输出结果;另一方面可以将该字符串和匹配结果写入记忆分拣单元的历史特征数据集合(如hash表)中保存。表2为历史特征数据集合保存的字符串的一种形式。

    表2

    ??字符串
    ??匹配结果
    ??其他信息

    步骤302、记忆分拣单元接收到后续输入的字符串后,根据一定的查找算法查找历史特征数据集合,确定该字符串是否在历史特征数据集合中。如果当前输入的字符串已在历史特征数据集合中,则执行步骤303;否则,如果当前输入的字符串不在历史特征数据集合中,则执行304。

    步骤303、获取该字符串对应的匹配结果,发送给结果管理???。

    如果当前输入的字符串已在历史特征数据集合中存在全部匹配的历史特征数据时,匹配引擎不需要将该字符串送给匹配引擎进行匹配,可以将历史特征数据集合中与该字符串全部匹配的历史特征数据的匹配结果发送给结果管理???,通过结果管理??槿范ㄊ涑鼋峁?。

    步骤304、可以将该字符串的全部或部分发送给匹配引擎,返回执行步骤301,匹配引擎重新根据特征库中的规则对该字符串进行特征匹配。其中,当前输入的字符串与历史特征数据集合中的历史特征数据可能全部不匹配,也可能部分匹配;在全部不匹配时,可以将该字符串的全部发送给匹配引擎,匹配引擎可以对该字符串重新进行匹配;在部分匹配时,即可以将该字符串的全部发送给匹配引擎重新进行匹配,也可以将该字符串的未匹配的部分发送给匹配引擎,并且通知匹配引擎该字符串未匹配的起始位置及其在特征库中开始匹配的位置,然后匹配引擎从该字符串未匹配的起始位置开始对该字符串进行匹配。

    图3b为本发明特征匹配方法第三实施例的应用场景的示意图,如图3b所示,记忆分拣单元接收到字符串后,选择查找算法31查找历史特征数据集合32,对查找结果进行判决33,如果当前输入的字符串在历史特征数据集合中已经存在,即匹配成功,将匹配结果发送到结果管理???5进行处理;如果匹配未成功,则将字符串的全部或部分发送到匹配引擎34进行特征匹配。匹配引擎的各个匹配子引擎可以利用特征库36中的数据结构,对字符串进行匹配,如果匹配成功,向结果管理???5发送匹配结果,并向记忆分拣单元发送该字符串和字符串的匹配结果,匹配不成功,可以输出匹配未成功信息。

    本实施例将字符串与已学习的历史特征数据集合进行比较,如果历史特征数据集合中存在与字符串全部匹配的历史特征数据,可以直接得到匹配结果,不需要每次都将字符串发送给匹配引擎进行匹配,降低了访问特征库的频率,提高了匹配速度和效率。

    图4为本发明特征匹配装置第一实施例的结构示意图,如图4所示,该特征匹配装置包括记忆分拣单元41和匹配引擎43;其中,记忆分拣单元41包括:数据集匹配???11和判决???13。

    其中,数据集匹配???11,用于根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配;

    判决???13,用于若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎43进行特征匹配;

    匹配引擎43,用于根据特征库中对接收到的输入数据进行特征匹配。

    其中,特征库可以存储在特征匹配装置内,也可以存储在片外存储器中。匹配引擎43可以包括一个或多个串行或并行匹配子引擎,接收到输入数据后,各个匹配子引擎访问特征库,通过一定的算法例如hash算法可以确定输入数据与特征库中的规则是否匹配,如果是,则各个匹配子引擎将匹配的特征数据和匹配结果发送给记忆分拣单元41,记忆分拣单元41将该特征数据保存到历史特征数据集合中作为历史特征数据,以供后续的比较。

    后续的处理过程中,记忆分拣单元41接收到输入数据后,数据集匹配???11将输入数据与先前学习到的与特征库中规则相匹配的历史特征数据进行比较。如果历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则判决???13根据与输入数据匹配的历史特征数据可以输出对应的匹配结果;如果历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则判决???13可以将输入数据的全部或部分发送至匹配引擎43,由匹配引擎43根据特征库中存储的规则进行特征匹配。

    本实施例记忆分拣单元可以将输入数据与已学习的历史特征数据集合进行比较,如果历史特征数据集合中存在与输入数据全部匹配的历史特征数据,可以直接得到匹配结果,不需要每次都将输入数据发送给匹配引擎进行匹配,降低了访问特征库的频率,提高了匹配速度和效率。

    图5为本发明特征匹配装置第一实施例的示意图,如图5所示,在本发明特征匹配装置第一实施例的基础上,记忆分拣单元41还包括:

    历史特征数据集合415,用于存储所述匹配引擎发送的历史特征数据及其对应的匹配结果。该历史特征数据集合可以用任何方便查找和记录的数据结构来表示,包括但不限于hash表。

    进一步地,判决???13可以包括:

    统一资源定位符子???1,用于当所述输入数据为统一资源定位符,所述统一资源定位符包括主机名和路径时,若所述历史特征数据集合中的历史特征数据与所述主机名和路径全部不匹配,则将所述主机名和路径发送至匹配引擎进行特征匹配;或者,若所述历史特征数据集合中存在与所述主机名全部匹配的历史特征数据,将所述路径发送至匹配引擎进行特征匹配,或者在存在与所述路径为部分匹配的历史特征数据时,将所述路径的未匹配的部分发送至匹配引擎进行特征匹配,或者将主机名和所述路径发送至匹配引擎进行特征匹配;或者,

    字符串子???3,用于当所述输入数据为字符串时,若所述历史特征数据集合中的历史特征数据与所述字符串全部不匹配,则将所述字符串发送至匹配引擎进行特征匹配;或者若所述历史特征数据集合中不存在与所述字符串全部匹配的历史特征数据,但存在与所述字符串部分匹配的历史特征数据,则将所述字符串发送至匹配引擎进行特征匹配,或者将所述字符串未匹配的部分发送至匹配引擎进行特征匹配。

    此外,由于进行特征匹配时,在对于某一输入数据可能存在多条匹配的特征数据,需要对匹配的各个特征数据进行处理例如:选取优先级最高的或时间最新的作为输出数据等,因此,该特征匹配装置还可以包括:结果管理???5,用于接收记忆分拣单元41和匹配引擎43输入的匹配结果,按照设定规则根据所述匹配结果确定输出结果。

    具体地,匹配引擎43可以包括一个或多个串行或并行匹配子引擎例如:匹配子引擎1、匹配子引擎2等,各个匹配子引擎可以相互独立或任意多个匹配子引擎之间具有某种耦合关系,如一个匹配子引擎处理完后给另一个匹配子引擎继续处理。匹配引擎43接收到输入数据后,各个匹配子引擎访问特征库,通过一定的算法例如:hash算法,可以确定输入数据与特征库中的规则是否匹配,如果是,则一方面各个匹配子引擎将匹配的特征数据和匹配结果发送给记忆分拣单元41,记忆分拣单元41该特征数据保存到历史特征数据集合中作为历史特征数据,以供后续的比较;另一方面将各个匹配子引擎的匹配结果发送给结果管理???5,结果管理???5根据各匹配子引擎的匹配结果的优先级等确定最终的输出结果,或者将相互耦合的各匹配子引擎的匹配结果经过一定算法运算后的结果作为输出结果。记忆分拣单元41接收到输入数据后,数据集匹配???11查找历史特征数据集合415存储的各条历史特征数据,判决???13比较得到历史特征数据集合415中是否存在与输入数据相同的历史特征数据,如果是,则将与该输入数据相同的历史特征数据对应的匹配结果发送到结果管理???5,经结果管理???5处理后,输出最终的结果。如果历史特征数据集合415中不存在与输入数据相同的历史特征数据,则可以将该输入数据发送给匹配引擎43进行特征匹配;或者也可以将该输入数据中未匹配的部分发送至匹配引擎43进行特征匹配。

    当输入数据为统一资源定位符(URL)时,统一资源定位符子???1可以比较历史特征数据集合是否存在与URL的主机名(host)相匹配的历史特征数据,如果有,再将URL的路径(path)发送至匹配引擎进行特征匹配;也可以当URL的主机名在历史特征数据集合是否匹配的历史特征数据时,还比较路径,路径也相同时,直接向结果管理???5发送匹配结果,路径不同时,将全部的路径或未匹配的部分路径发送至匹配引擎进行特征匹配,记忆分拣单元还可以将需要匹配的数据在特征库中开始匹配的位置告知匹配引擎43。

    当所述输入数据为字符串时,字符串子???3可以比较历史特征数据集合是否存在与字符串全部匹配的历史特征数据,如果有,向结果管理???5发送匹配到的历史特征数据的匹配结果;如果没有,还可以比较是否存在于字符串部分匹配的历史特征数据,如果存在部分匹配的历史特征数据,则既可以将字符串直接全部发送给匹配引擎43进行特征匹配,也可以将字符串未匹配的部分发送给匹配引擎43进行特征匹配,记忆分拣单元还可以将需要匹配的数据在特征库中开始匹配的位置告知匹配引擎43。

    本实施例记忆分拣单元可以将输入数据与已学习的历史特征数据集合进行比较,如果历史特征数据集合中存在与输入数据全部匹配的历史特征数据,可以直接得到匹配结果,不需要每次都将输入数据发送给匹配引擎进行匹配,降低了访问特征库的频率,提高了匹配速度和效率。

    本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或光盘等各种可以存储程序代码的介质。

    最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

    关于本文
    本文标题:特征匹配方法和装置.pdf
    链接地址://www.4mum.com.cn/p-5866096.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 七星彩手机选号技巧 重庆时时猜龙虎走秘籍 快速时时计划 足彩怎么才能稳赚不赔 彩仙阁手机计划 买双色球稳赚不赔方法 pk10赛车计划软件下载 什么方法买平特肖最准 二串一稳赚不赔方法 幸运pk10计划怎么算 七星彩经常开的规律 山东时时抓获 腾讯体育女篮直播 后三组选包胆什么意思 北京福彩pk10走势图 老虎机水果机技巧