• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 22
    • 下载费用:30 金币  

    重庆时时彩小窍门: 将进口数据和/或出口数据与公司标识符关联的系统及过程.pdf

    关 键 词:
    进口 数据 出口 公司 标识符 关联 系统 过程
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201380054965.2

    申请日:

    2013.08.29

    公开号:

    CN104737187A

    公开日:

    2015.06.24

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情: 发明专利申请公布后的视为撤回IPC(主分类):G06Q 10/10申请公布日:20150624|||实质审查的生效IPC(主分类):G06Q 10/10申请日:20130829|||公开
    IPC分类号: G06Q10/10(2012.01)I; G06Q50/28(2012.01)I 主分类号: G06Q10/10
    申请人: 邓白氏公司
    发明人: 阿德南·艾哈迈德; 段燕; 杰里·罗纳根; 安德烈斯·本韦努托; 安东尼·J·斯克里菲尼亚诺; 迈克尔·克莱内; 桑吉瓦·希纳潘
    地址: 美国新泽西州
    优先权: 61/695,843 2012.08.31 US
    专利代理机构: 北京集佳知识产权代理有限公司11227 代理人: 唐京桥; 陈炜
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201380054965.2

    授权公告号:

    ||||||

    法律状态公告日:

    2018.05.08|||2015.07.22|||2015.06.24

    法律状态类型:

    发明专利申请公布后的视为撤回|||实质审查的生效|||公开

    摘要

    提供了一种方法,所述方法包括将来自多个国际进口/出口数据库的记录与唯一公司标识符进行匹配,以及将来自记录的数据并入国际数据库?;固峁┝艘恢质褂盟龇椒ǖ南低?,以及一种包含使处理器执行所述方法的指令的存储设备。

    权利要求书

    权利要求书
    1.  一种方法,包括:
    从第一数据源读取描述第一国际航运交易的第一记录;
    解析所述第一记录以定位所述第一国际航运交易中涉及的实体的第 一描述符;
    将所述第一描述符与唯一企业标识符进行匹配,从而得到针对所述唯 一企业标识符的第一匹配;
    基于所述唯一企业标识符将来自所述第一记录的第一数据附加至数 据库中的记录;
    从第二数据源读取描述第二国际航运交易的第二记录;
    解析所述第二记录以定位所述第二国际航运交易中涉及的实体的第 二描述符;
    将所述第二描述符与所述唯一企业标识符进行匹配,从而得到针对所 述唯一企业标识符的第二匹配;以及
    基于所述唯一企业标识符将来自所述第二记录的第二数据附加至所 述数据库中的记录,
    其中,所述第一数据和所述第二数据此后经由所述数据库中的记录可 访问。

    2.  根据权利要求1所述的方法,其中,所述第一国际航运交易发生 在第一国家,并且所述第二国际航运交易发生在第二国家。

    3.  根据权利要求1所述的方法,其中,所述唯一企业标识符包括 DUNS号。

    4.  根据权利要求1所述的方法,在匹配所述第一描述符之后并且在 附加来自所述第一记录的数据之前,进一步包括:
    使所述第一匹配合格作为针对所述实体的所述第一描述符与所述唯 一企业标识符的正确匹配。

    5.  根据权利要求1所述的方法,进一步包括:
    解析所述第一记录以定位商品的描述;
    将所述商品的描述与统一商品描述和编码系统(HS)号进行匹配; 以及
    将具有所述第一数据的HS号附加至所述数据库中的记录。

    6.  根据权利要求1所述的方法,进一步包括:
    经由所述数据库中的记录访问所述第一数据和所述第二数据,从而得 到访问数据;以及
    执行利用所述访问数据的过程。

    7.  根据权利要求6所述的方法,其中,所述过程包括选自由以下组 成的组的活动:
    (a)基于供应商的出口活动来识别产品的供应商;
    (b)基于购买者的进口活动来识别产品的购买者;
    (c)识别购买者的“看起来类似的”目标;
    (d)增强供应商的企业简介;
    (e)增强购买者的信用简介;
    (f)绘制商品的贸易趋势;
    (g)检测所述实体没有遵守规定;
    (h)检测所述实体涉及犯罪活动;以及
    (i)通过考虑所述实体的国际商业活动来增强信用报告。

    8.  一种系统,包括:
    处理器;以及
    存储器,其包含指令,所述指令当由所述处理器读取时,使所述处理 器执行以下动作:
    从第一数据源读取描述第一国际航运交易的第一记录;
    解析所述第一记录以定位所述第一国际航运交易中涉及的实体的第 一描述符;
    将所述第一描述符与唯一企业标识符进行匹配,从而得到针对所述唯 一企业标识符的第一匹配;
    基于所述唯一企业标识符将来自所述第一记录的第一数据附加至数 据库中的记录;
    从第二数据源读取描述第二国际航运交易的第二记录;
    解析所述第二记录以定位所述第二国际航运交易中涉及的实体的第 二描述符;
    将所述第二描述符与所述唯一企业标识符进行匹配,从而得到针对所 述唯一企业标识符的第二匹配;以及
    基于所述唯一企业标识符将来自所述第二记录的第二数据附加至所 述数据库中的记录,
    其中,所述第一数据和所述第二数据此后经由所述数据库中的记录可 访问。

    9.  根据权利要求8所述的系统,其中,所述第一国际航运交易发生 在第一国家,并且所述第二国际航运交易发生在第二国家。

    10.  根据权利要求8所述的系统,其中,所述唯一企业标识符包括 DUNS号。

    11.  根据权利要求8所述的系统,其中,所述指令还使所述处理器在 匹配所述第一描述符之后并且在附加来自所述第一记录的数据之前执行 以下动作:
    使所述第一匹配合格作为针对所述实体的所述第一描述符与所述唯 一企业标识符的正确匹配。

    12.  根据权利要求11所述的系统,其中,所述指令还使所述处理器 执行以下动作:
    解析所述第一记录以定位商品的描述;
    将所述商品的描述与统一商品描述和编码系统(HS)号进行匹配; 以及
    将具有所述第一数据的HS号附加至所述数据库中的记录。

    13.  根据权利要求8所述的系统,其中,所述指令还使所述处理器进 执行以下动作:
    经由所述数据库中的记录访问所述第一数据和所述第二数据,从而得 到访问数据;以及
    执行利用所述访问数据的过程。

    14.  根据权利要求13所述的系统,其中,所述过程包括选自由以下 组成的组的活动:
    (a)基于供应商的出口活动来识别产品的供应商;
    (b)基于购买者的进口活动来识别产品的购买者;
    (c)生成购买者的“看起来类似的”目标;
    (d)生成供应商的企业简介;
    (e)生成购买者的信用简介;
    (f)绘制商品的贸易趋势;
    (g)检测所述实体没有遵守规定;
    (h)检测所述实体涉及犯罪;以及
    (i)通过考虑所述实体的国际商业活动来增强信用报告。

    15.  一种有形存储设备,其包括指令,所述指令可由处理器读取以使 所述处理器执行以下动作:
    从第一数据源读取描述第一国际航运交易的第一记录;
    解析所述第一记录以定位所述第一国际航运交易中涉及的实体的第 一描述符;
    将所述第一描述符与唯一企业标识符进行匹配,从而得到针对所述唯 一企业标识符的第一匹配;
    基于所述唯一企业标识符将来自所述第一记录的第一数据附加至数 据库中的记录;
    从第二数据源读取描述第二国际航运交易的第二记录;
    解析所述第二记录以定位所述第二国际航运交易中涉及的实体的第 二描述符;
    将所述第二描述符与所述唯一企业标识符进行匹配,从而得到针对所 述唯一企业标识符的第二匹配;以及
    基于所述唯一企业标识符将来自所述第二记录的第二数据附加至所 述数据库中的记录,
    其中,所述第一数据和所述第二数据此后经由所述数据库中的记录可 访问。

    16.  根据权利要求15所述的有形存储设备,其中,所述第一国际航 运交易发生在第一国家,并且所述第二国际航运交易发生在第二国家。

    17.  根据权利要求15所述的有形存储设备,其中,所述唯一企业标 识符包括DUNS号。

    18.  根据权利要求15所述的有形存储设备,其中,所述指令还使所 述处理器在匹配所述第一描述符之后并且在附加来自所述第一记录的数 据之前进行以下动作:
    使所述第一匹配合格作为针对所述实体的所述第一描述符与所述唯 一企业标识符的正确匹配。

    19.  根据权利要求18所述的有形存储设备,其中,所述指令还使所 述处理器进行以下动作:
    解析所述第一记录以定位商品的描述;
    将所述商品的描述与统一商品描述和编码系统(HS)号进行匹配; 以及
    将具有所述第一数据的HS号附加至所述数据库中的记录。

    20.  根据权利要求15所述的有形存储设备,其中,所述指令还使所 述处理器进行以下动作:
    经由所述数据库中的记录访问所述第一数据和所述第二数据,从而得 到访问数据;以及
    执行利用所述访问数据的过程。

    21.  根据权利要求20所述的有形存储设备,其中,所述过程包括选 自由以下组成的组的活动:
    (a)基于供应商的出口活动来识别产品的供应商;
    (b)基于购买者的进口活动来识别产品的购买者;
    (c)生成购买者的“看起来类似的”目标;
    (d)生成供应商的企业简介;
    (e)生成购买者的信用简介;
    (f)绘制商品的贸易趋势;
    (g)检测所述实体没有遵守规定;
    (h)检测所述实体涉及犯罪;以及
    (i)通过考虑所述实体的国际商业活动来增强信用报告。

    说明书

    说明书将进口数据和/或出口数据与公司标识符关联的系统及过程
    本公开的背景
    1.技术领域
    本公开总体上涉及收集进口数据和/或出口数据以便借助来自各个国 家的船运单据和海关报表来开发企业信息,例如企业标识、企业之间关系、 装船的货物、出发港口和到达港口、企业位置、联系信息(电话号、传真 号、电子邮件等)以及其它交易明细。具体地,本公开包括一系列系统和 过程,该一系列系统和过程通过以下来采用集成数据处理技术以清理和规 范化提单数据库:(1)将公司标识符例如数据通用编号系统(DUNS)号 附加至数据库中出现的企业实体,包括收货人、发货人以及通知方,以及 (2)用统一商品描述及编码系统(HS)号将货物描述进行分类。
    DUNS是由Dun&Bradstreet公司(D&B)开发和管理的系统,Dun &Bradstreet公司(D&B)将被称为DUNS号的唯一数字标识符分配给 单独的企业实体。DUNS是世界范围的公共标准。DUNS用户包括欧洲委 员会、联合国和美国政府。
    HS系统是用于将交易产品进行分类的名称和编号的国际标准系统, 其由世界海关组织进行开发和维护。
    2.对现有技术的描述
    在这部分描述的方法是能够实行的方法,但未必是先前已经构思或实 行的方法。因此,在这部分描述的方法可以不是在本申请中的权利要求的 现有技术,并且通过被包括在本部分而不被认为是现有技术。
    进口数据和出口数据当前可以从少数供应商中得到,在该少数供应商 那,数据被集成到产品方案中或者作为单独的数据包出售。针对每个供应 商用于该方案的数据源通常是相同的,该数据源即来自政府组织例如美国 的海关和边境?;ぞ?CBP)的提单信息。取决于不同国家的特定规定, 针对提单信息明细的可用性和水准会变化。此外,因为针对由单个国家提 供的数据,数据结构不同以及缺少标准货物分类,所以未处理的提单信息 除了作为统计数据或原始数据之外可能不是很有用。
    发明内容
    本发明人已经发现了以下独特方法:将另外的原始数据转换成商业上 有用的数据以允许产品的购买者和销售者彼此全球性地定位,以及针对一 方确定另一方有还是没有足够的信用可靠性和/或相关内容,基于标准例 如进口/出口的产品类型、装运量、地理位置等来进行商业活动。在本文 中描述的系统将进口/出口数据与公司识别数据进行结合以实现以下目 的:(1)使得全球购买者能够基于供应商的出口活动来找到全球供应商; (2)使得全球供应商能够基于购买者的进口活动来找到全球购买者;(3) 提供全球购买者的“看起来类似的”目标;(4)丰富针对全球供应商的企 业简介;(5)丰富针对全球购买者的信用简介;(6)例如通过热图的方式 绘制全球商品贸易趋势;(7)国际合规性和犯罪检测;(8)通过考虑国际 商业活动来增强信用报告和评分;(9)通过增加产品等级搜索特征来增强 供应商识别;(10)通过提供查看公司的进口活动和供应商向其它国家的 出口活动的能力来增强供应商风险管理;以及(11)建立附加有公司标识 符和关联公司信息的进口/出口数据的全球文件库。
    因此,提供了一种方法,该方法包括:将来自多个国际进口/出口数 据库的记录与唯一公司标识符进行匹配,以及将来自记录的数据并入全球 数据库?;固峁┝艘恢植捎盟龇椒ǖ南低?,以及一种包含使处理器执行 所述方法的指令的存储设备。
    附图说明
    图1是用于将进口数据和出口数据与公司标识符关联的系统的框图。
    图2是用于将进口数据和出口数据与公司标识符关联的方法的流程 图。
    图3示出了针对第一数据源为中国海关出口数据以及第二数据源为 美国海关进口数据的情况来执行图2的方法的示例。
    图4是对来自数据源的数据进行由图2的方法执行的处理的示例,该 数据源包含出口数据或者进口数据。
    图5是对来自数据源的数据进行由图2的方法执行的处理的示例,该 数据源包含美国海关与边境?;ぞ纸谑?。
    图6是“用邮政信箱的优化器标准输入布局”—公司数据的数据格式 的示例。
    图7是商品/货物数据的数据格式的示例。
    在每个附图中用相同的附图标记来表示多于一个图共有的部件或特 征。
    具体实施方式
    本公开提供了以下独特的工作流程:将商品进口/出口数据标准化、 规范化并且与HS码进行匹配;将提单信息与公司标识符信息进行匹配; 将公司识别名称(例如,DUNS号)附加至交易中包含的每个公司,其包 括发货人、收货人以及其它企业例如银行、物流公司等;以及将HS分类 货物数据与公司识别信息并入全球数据库。如在本文中使用的那样,匹配 是指在数据存储设备中搜索数据,例如,在数据库中搜索与给定的查询最 优匹配的记录。
    利用下面的步骤来生成唯一的并入全球数据库的HS分类货物数据和 公司识别信息数据,如下所述,该全球数据库提供了这样的结合的数据的 独特技术效果和优点。
    首先,通过清理在提单上出现的收货人和发货人的名称和地址来标准 化或重新格式化原始提单信息。标准化和清理是以下过程:将非结构化的 数据或信息解析成正确的域例如公司名称、地址和城市,以使得能够更精 确地进行匹配和数据处理。
    第二,规范化商品的内容,例如列在提单上的产品、数据。
    第三,将商品数据与在HS码系统中的分类进行匹配。
    第四,匹配来自提单信息的公司识别信息(即名称、地址、电话号等), 针对与该提单关联的每个公司(例如,出口商、进口商、发货人、收货人 或与交易关联的其它企业例如银行、物流公司等)附加或生成唯一公司标 识符(例如DUNS号)。使用公司标识符确保公司是公司标识符所描述的 公司,当与公司做生意时公司标识符提供给对方更多的信任。另外,通过 为来自提单信息的公司附加公司标识符,先前不关联的公司信息可以与进 口交易和/或出口交易关联。
    第五,将以上步骤1至4中创建的文件并入HS码和DUNS号进口/ 出口数据的唯一的且先前不可用的数据库。
    图1是用于将进口数据和出口数据与公司标识符关联的系统100的框 图。系统100包括用户设备105、数据源145以及计算机115,用户设备 105、数据源145以及计算机115中的每个在通信上耦接至网络110例如 因特网。
    用户设备105包括输入设备例如键盘或语音识别子系统,用于使得用 户101经由网络110向计算机115传送信息和命令选择,以及从计算机115 接收通信和处理结果。例如,用户101可以向计算机115发送查询107。 用户设备105还包括输出设备例如显示器或打印机,或语音合成器。光标 控制例如鼠标、跟踪球或触摸敏感屏允许用户101在显示器上操作光标, 用于向计算机115传送附加的信息和命令选择。
    计算机115包括处理器125,以及耦接至处理器125的存储器130。 尽管计算机115在本文中表示为独立的设备,但是不限于此,替代地计算 机115可以被耦接至分布式处理系统中的其它计算机(没有示出)。
    处理器125是由响应和执行指令的逻辑电路配置成的电子设备。
    存储器130是编码有计算机程序的有形计算机可读存储设备。在这方 面,存储器130存储由处理器125可读和可执行的用于控制处理器125的 操作的数据和指令,即程序代码。存储器130可以用随机存取存储器 (RAM)、硬盘驱动器、只读存储器(ROM)或其组合来实现。存储器 130的部件中的一个部件是程序???35。
    程序???35包含用于控制处理器125以执行在本文中描述的方法的 指令。
    在本文中使用的术语“??椤北硎究梢允凳┪懒⒌牟考蛘呶喔?从属部件的集成配置的功能操作。因此,程序???35可以实现为单个模 块或者彼此合作操作的多个???。此外,尽管在本文中描述的程序???135安装在存储器130中,并且因此用软件来实现程序???35,但是程 序???35可以用任何硬件(例如电子电路)、固件、软件或其组合来实 现。
    虽然程序???35表示为已经被加载到存储器130,但是程序???35 可以配置在存储设备155上,用于随后将程序???35加载到存储器130。 存储设备155是在其上存储程序???35的有形计算机可读存储设备。存 储设备155的示例包括光盘、磁带、只读存储器、光存储介质、硬盘驱动 器或由多并行硬盘驱动器组成的存储器单元以及通用串行总线(USB)闪 存驱动器。替代地,存储设备155可以是位于远程存储系统并且经由网络 110耦接至计算机115的随机存取存储器或其它类型的电子存储设备。
    数据源145包括多个数据源150-1、150-2至150-N,数据源145中的 每个数据源包含进口数据和/或出口数据。数据源150-1包含针对国家1 的进口/出口数据。数据源150-2包含针对国家2的进口/出口数据。数据 源150-N包含针对国家N的进口/出口数据。数据源150-1、150-2至150-N 的示例包括中国海关数据、美国海关数据或其它提单来源。数据源150-1、 150-2至150-N可以被配置为多个物理上彼此远离的多个单个的存储设 备,或被配置在单独的存储设备中。数据源150-1、150-2至150-N的物 理布置和位置不是特别重要。
    全球数据库140在通信上耦接至计算机115。全球数据库140包含全 球性地描述商务企业的各个方面的记录,例如,信息如身份数据、公司图 表、历史和经营、公开报告、公司链接例如公司家族树、风险评估等。在 实践中,全球数据库140将可能包含数百万记录。
    图2是用于将进口数据和出口数据与公司标识符关联的方法200的流 程图。在本文件中,尽管我们将操作描述为通过方法200或其从属过程来 执行,但是所述操作实际上由计算机115来执行,并且更具体地由处理器 125来执行。
    方法200包括多个并行的处理路径,方法200经由步骤210-1、210-2 至210-N开始,其中每个路径是用于分别地处理来自数据源150-1、150-2 至150-N的数据。为了举例说明,我们将经由步骤210-1来讨论处理。
    在步骤210-1中,处理器125从数据源150-1接收数据,并且通过执 行由步骤215、220和225表示的几个子过程来处理数据。针对数据源150-1 中的每个记录进行处理,其中给定记录描述了进口交易和/或出口交易, 并且给定记录包括信息例如交易中涉及的实体的名称和地址,以及其它有 关交易的详细说明例如由提单提供的详细说明。
    在步骤215中,处理器125通过清理出现在记录中的企业实体的名称 和地址对来自数据源150-1的记录的数据进行解析、标准化和重新格式化。 处理器125还将装运进口/出口数据进行标准化和规范化,并且将货运进 口/出口数据与一个或更多个HS码进行匹配。方法100从步骤215进行至 步骤220。
    在步骤220中,处理器125针对交易中包含的每个企业实体将来自记 录的数据与存在于全球数据库140中的公司标识符信息(例如DUNS号) 进行匹配。方法200从步骤220进行至步骤225。
    在步骤225中,处理器125识别来自步骤220的公司匹配,该公司匹 配被认为是高质量匹配,即具有匹配是正确的高置信水平特征。如上所述, 匹配是指针对给定的查询来搜索最优匹配。因此,步骤220中的匹配操作 的结果可以是准确匹配或不准确匹配。如果是不准确匹配,那么该匹配可 能是正确匹配,或者可能是不正确匹配。因此,来自步骤220的匹配结果 伴有表示结果是正确的置信水平的置信码。最起码,置信码将包括两个值: 表示高置信水平的一个值;以及表示除了高置信水平之外的一个值。然而, 置信码可以跨越值例如1-10的范围,并且置信码表示更精确的置信度。 可能影响置信水平的一些参数包括公司名称、地址、城市、国家、省、地 区、电话号等。不是可接受的质量水平的记录可能被丢弃或在以后的日期 中被检阅。被认为是高质量匹配的记录被保留,用于进一步处理。
    当完成子步骤215、220和225以及因此完成步骤210-1时,处理器 125已经获取了针对来自数据源150-1的记录的与特定交易有关的数据, 并且针对交易中涉及的每个企业实体的DUNS号。方法200从步骤210-1 进行至步骤230。
    在步骤230中,针对步骤210-1中的每个高质量匹配,处理器125接 收高质量匹配,并且基于DUNS号将来自步骤210-1的数据(即与特定交 易有关的数据)附加至全球数据库140中的匹配记录。该附加可以是以下 两者中的一个:(a)实际地将数据增加至全球数据库140中的记录;(b) 通过提供全球数据库140可以利用以定位数据源150-1中的对应记录的指 针或其它参考来逻辑地增加数据。因此,如在本文中使用的那样,将数据 附加至全球数据库140中的记录是指通过数据的增加或者通过指针或其 它参考的增加来更新全球数据库140中的记录。全球数据库140中的记录 的物理布置不是特别重要。
    步骤210-2至210-N中的每个步骤与步骤210-1类似,在每个步骤中, 处理来自各自的数据源150-2至150-N的数据,并且获取与特定交易有关 的数据以及针对交易中涉及的每个企业实体的DUNS号,并且此后,进 行至步骤230。然而,步骤210-1、210-2至210-N不需要彼此相同,而是 可以唯一地被配置为容纳来自他们各自的数据源150-1、150-2至150-N 的特定数据。在实践中,步骤210-1、210-2至210-N中的每个步骤将会 循环地运行,以便分别地处理来自数据源150-1、150-2至150-N的每个 记录,并且将他们的高质量匹配传递至步骤230。
    随着时间的推移,步骤230将来自步骤210-1、210-2至210-N的数 据并入全球数据库140。正因如此,如果在数据源150-1中表示的第一交 易中和在数据源150-2中表示的第二交易中包含特定公司,则全球数据库 140将包含针对该公司的记录,并且该记录将包括关于第一交易和第二交 易中的每个交易的详细说明。
    因此,一般来说,方法200包括:
    (a)进行第一过程例如步骤210-1,该第一过程包括:
    从第一数据源例如数据源150-1读取描述第一国际航运交易的第一 记录;
    解析第一记录以定位第一国际航运交易中涉及的实体的第一描述 符;以及
    将第一描述符与唯一企业标识符进行匹配,从而得到针对唯一企业 标识符的第一匹配;
    (b)基于唯一企业标识符将来自第一记录的第一数据附加至在数据库例 如全球数据库140中的记录;
    (c)进行第二过程例如过程210-2,该第二过程包括:
    从第二数据源读取描述第二国际航运交易的第二记录;
    解析第二记录以定位第二国际航运交易中涉及的实体的第二描述 符;以及
    将第二描述符与唯一企业标识符进行匹配,从而得到针对唯一企业 标识符的第二匹配;以及
    (d)基于唯一企业标识符将来自第二记录的第二数据附加至数据库中的 记录,
    其中,第一数据和第二数据此后经由数据库中的记录的方式可访问。
    根据方法200由处理器125产生或更新的在全球数据库140中的记录 有效地是与虚拟社交网络的数据结构类似的数据结构,在数据源145中表 示的交易通过该记录彼此链接。给定这样的链接,处理器125可以搜索交 易之间的关系,以及交易中涉及的公司之间的关系。方法200的技术优点 是有助于全球数据库140的开发,进而使得能够搜索关系,并且与现有技 术中的技术方案相比增加了这种搜索的速度和精确性。
    方法200还包括由步骤235表示的下游过程,该下游过程包含处理器 125访问全球数据库140以及利用由步骤230提供的数据。
    在步骤235中,处理器125从用户设备105接收查询107。
    响应于查询107,处理器125可以:
    (a)基于供应商的出口活动来识别产品的全球供应商。
    (b)基于购买者的进口活动来识别全球购买者。
    (c)识别全球购买者的“看起来类似的”目标。识别“看起来类似的” 目标是指通过利用数据点来识别本质上类似的企业,所述数据点例如但不 限于产业分类、雇员数量、年销售额、区域位置等。
    (d)生成或增强针对全球供应商的企业简介。
    (e)生成或增强针对全球购买者的信用简介。
    (f)例如通过热图的方式来绘制全球商品贸易趋势。
    通过对示出了供应/需求经济中潜在的增加或减少的一个或更多个 特定的时间序列进行观察来识别商品趋势。热图是呈现例如受到正在变 化的趋势影响的国家或地区的显示的图形表示。
    (g)检测企业实体是否遵守国际上的法律或规定;
    (h)检测企业实体是否涉及犯罪活动。通过利用其它数据源例如美国财 政部海外资产控制办公室(OFAC),企业可能被标记为涉及犯罪活动或 恐怖活动,其中OFAC基于针对以下对象的美国对外政策和国家安全目 标对经济和贸易制裁进行管理和强制执行:作为目标的外国和政权、恐 怖分子、国际毒贩、参与大规模杀伤性武器扩散有关的活动分子,以及 其他威胁美国的国家安全、外交政策或经济的人。
    (i)通过考虑企业实体的国际商业活动来生成或增强信用和/或管理报告 和评分。作为示例,通过识别企业的国际进口活动和/或国际出口活动, 描述这样的活动的数据可以用来作出信用决定和/或使用洞察力来发展或 增强信用评分或模型。
    因此,系统100允许各种全球企业和政府机构以:(1)核实外国供应 商的存在及合法性,(2)随着时间追踪供应商的身份,以及(3)评估国 际犯罪和合规违规的风险。这也允许全球购买者以:(1)发现满足他们的 需求的供应商,以及(2)确定供应商是否有欺骗商业行为或腐败商业行 为的嫌疑。
    图3示出了针对下述情况通过步骤230执行方法200的示例,所述情 况为:数据源150-1是中国海关出口数据,并且数据源150-2是美国海关 进口数据,以及数据源150-1和数据源150-2中的每个数据源包括关于涉 及中国公司A的交易的记录。作为执行步骤210-1产生的结果,方法200 得到数据305,以及作为执行步骤210-2产生的结果,方法200得到数据 310。此后,在步骤230中,处理器125通过附加数据305和数据310来 更新全球数据库140中的记录315。随后,当处理器325访问记录325时, 处理器125也将具有到数据305和数据310的访问。
    因此,中国海关数据与美国海关数据进行组合,并且两组数据均与公 司标识符和公司信息进行组合。商业信息或公司信息与进口/出口数据的 多源的组合在国家、公司和产品的三个级别上提供了国际贸易对应方活动 的整体视角和接近100%的覆盖率。亦即,将中国出口活动与美国进口对 应方活动的匹配与公司标识符进行链接,以达到生成企业身份验证、企业 活动跟踪以及风险评估的目的。更具体地,在两个源数据库(例如中国海 关和美国海关)中找到的中国公司A将提供关于其向美国的出口活动和 向世界的其它国家或地区的出口活动的情报。美国海关数据是特定于来自 世界的水运进口,而中国海关数据提供用向全世界的目的地的所有运输方 式的出口活动。在本示例中,源数据库的并入提供了对中国公司A与美 国的出口活动以及中国公司A与其它国家的出口活动的独特视角。除了 利用两个海关来源之外,从全球数据库140获得附加的信息,其包括但不 限于预测风险评分、公司图像信息以及从各种来源收集的其它数据点。
    如上所述,步骤210-1、210-2至210-N中的每个步骤可以被唯一地 配置成容纳来自它们各自的数据源150-1、150-2至150-N的特定数据。 图4和图5包括两个示例性配置。
    图4是对来自数据源145中的数据源的数据执行由步骤210-1和230 进行的处理400的示例,数据源145包含出口数据或者进口数据。每日进 口/出口数据401被发送至工作流程管理器403,并且被发送至HS码匹配 过程405或者被发送至对名称和地址的自动解析407。HS码匹配过程405 还接收已经由使用模糊技术411的匹配引擎处理的海关HS码409。匹配 引擎411与D3归档工作流程和文件管理服务器413以及数据库服务器415 进行通信。此后,系统决定是否将HS码与每日进口数据进行自动匹配 417。如果自动匹配发生,则航运文件匹配到HS码419。如果没有自动匹 配,则手动匹配421在用HS码完成航运文件419之前发生。
    在对名称和地址进行自动解析407之后,经由文件传送协议(FTP) 在名称匹配应用程序431中对名称进行匹配。如果存在自动匹配433,则 公司标识符自动地附加至公司名称435。如果没有自动匹配433,则寻求 具有公司标识符的公司名称的手动匹配437和439。如果在第一通道没有 发现匹配441,则在例如因特网上调查公司名称443并且寻求手动匹配 439。439处的手动匹配在具有与D&B手动匹配数据相邻的提单(BOL) 的分区屏上产生报告440。如果在第二通道上没有发现匹配,则没有完成 匹配445。如果发现匹配441,则匹配的企业名称用公司标识符来附加435。 此后,具有附加的公司标识符的企业名称435与具有HS码451且储存在 知识库数据库453中的航运文件进行合并。
    图5是对来自数据源145中的数据源的数据执行由步骤210-1和步骤 230进行的处理500的示例,数据源145包含美国海关与边境?;ぞ置拦?自由信息法案(FOIA)进口数据。
    在501处,FOIA进口文件包括具有每天约100MB大小的针对每天 的单独的文件。该文件具有固定大小记录格式,其中每个记录具有278 个字符的长度。有8个记录类型(1-7),其中记录类型1用于第一次发生 的单据通用信息,并且作为随后发生的容器数据。FOIA文件的进口逐行 读取文件并且将信息存储在FIOA进口数据库,用于保存完整的信息和结 构。该步骤填充了数据库中的FOIA表。
    为了发货人、收货人以及通知方的企业地址的高效存储,相同的条目 只存储一次。因此导致重复相同的条目在FOIA发货人、FOIA收货人或 FOIA通知方表以及在合适的映射表中的引用中只有一个条目。
    在502处,在FOIA文件的成功进口之后,可以开始自动处理。发货 人记录与收货人记录的处理几乎是相同的,但是事实上收货人地址主要是 美国地址,或使用的CA(加拿大)或MX(墨西哥)地址。地址识别和 地址匹配是使用模糊搜索和实体标签的模式匹配和命名实体识别的混合。 地址匹配的第一步是国家识别:在地址域中搜索国家名、国家简写或国家 码;搜索电话号并且试图从国际国家呼叫码来识别国家;如果不能够识别 出国家,则搜索收货人加拿大邮政编码(@#@@[email protected]);如果还没有识别 出国家,则收货人默认是美国。在以下步骤中进行美国地址的匹配:地址 域的联结;针对采用几个序列的州、城市、邮政编码的组合,用几个州和 邮政编码的书写样式来进行模式匹配;将州、城市、邮政编码与模糊服务 器进行匹配。如果匹配是无效的或低于给定的置信度,则使用缺少州、城 市或邮政编码的部分组合来持续进行模式匹配。识别并且规范化街道;将 州、城市、街道、邮政编码与模糊服务器进行匹配。
    针对外国地址的匹配,没有具有国家、州、城市、街道、邮政编码的 易于利用的国际数据库。对于一般的国家例如墨西哥为收货人且中国为发 货人,我们正在建立或者已经建立了至少有国家、州、城市、邮政编码的 数据库。针对城市1000、管理员1、管理员2以及国家信息来使用模糊匹 配表给具有可能的地址标签(国家、州、省、区/县、城市、邮政编码) 的词或短语贴标签。找到组成有效地址的标签的最可能的匹配。与公司表 进行匹配。
    如果国家、州、城市、街道或邮政信箱、邮政编码以及名称已经填满 并且与匹配表进行了验证,则记录不需要手动处理。在地址识别之后,地 址条目与公司表进行匹配,尽管该步骤在实际上没有必要,因为该步骤将 会在DUNS匹配的地址的重新进口期间执行。
    在503处,货物处理的任务是识别货物描述,以及根据统一编码表将 货物进行分类并且分配正确的统一编号。
    统一编码表是具有2位至8位编码(2位、4位、6位或8位)的层 级分类表?;谎灾?,针对给定的货物描述必须找到最确切的统一编号。自 动过程使用货物描述并且可选地使用关于发货人的信息来指导分类。自动 过程由以下五个步骤组成:
    (i)识别单个货物描述(亦即找到货物描述的开始和结束);
    (ii)生成关键货物记录;
    (iii)试图找到相同的关键描述记录并且如果可能的话将其映射到现有的 相同记录上;
    (iv)规范化关键描述(例如移除订单号等);以及
    (v)如果需要的话生成新的关键描述记录。
    针对该货物描述检查FOIA记录在预期域中是否已经有统一编号:
    (i)使用模式匹配以在描述域中找到统一编号;
    (ii)使用自然语言处理(NLP)和模糊匹配以检测统一编码;
    (iii)使用训练的机器学习分类器以将规范化的描述分类为统一编号。分 类器被设置为导致高拒绝的极低的错误率;以及
    (iv)通过使用针对分类的不同方法来使用第二训练的机器学习分类器。
    机器学习分类器用以下进行训练和测试:已经使用其它方法进行分类 的一年的描述的约一半的描述,或者用之前提升训练的描述。使用10倍 交叉验证,拒绝标准被设置成导致极低的错误率。如果没有检测到统一编 号,或者如果分类置信水平下降至低于可接受阈值,则必须使用在统一编 号领域的专家的人类处理/键控来确定统一编号。
    在504处,即使使用最先进的技术,计算机和软件(还)不能以期望 的高精确性自动地处理到100%。原因是经常缺失的信息(没有国家、城 市、邮政编码)、不正常的书写样式以及算法缺陷。无论何时算法执行任 务失败,重要的是检测到这个事实并将该任务发送给人类专家。在进口处 理的情况下有以下三种任务:
    (i)手动地处理收货人地址(大多是美国,主要因为缺少的域);
    (ii)手动地处理发货人地址(外国地址,即使人类专家也经常很难将外 国地址进行分类);以及
    (iii)手动地处理货物描述以确定统一编号。
    键控客户端设计用于快速的数据录入以及尽可能容易地保存,而同时 允许高效地搜索信息(例如开始搜索、图像搜索、地图搜索或直接从键控 客户端翻译)。针对收货人的键控的键控客户端由以下组成:包含来自没 有任何属性的FOIA文件的原始信息的FOIA记录的视图;以及自动过程 结果,其可能已经识别国家、城市、州和街道,但是由于不完整的邮政编 码而无法自动地处理记录。
    在505处,用于货物描述的手动处理的客户端稍微更复杂些,因为有 用的在于:不仅查看来自属于一个货物的一个或更多个FOIA货物描述记 录的原始描述,并且查看在针对原始描述的自动过程和输入正确的统一编 号之后的预处理描述。也允许得到发货人信息和收货人信息以及完整的单 据通用信息。除了集成在客户端的搜索性能“搜索”、“幸运搜索”、“图像 搜索”以及“翻译”之外,还允许使用来自描述的词和短语来进行针对统 一编码的模糊搜索。
    出口被分成三个独立的文件以保留关系,这三个独立的文件使用来自 数据库表的唯一的标识符。针对每个记录类型有独立的出口脚本。当针对 收货人、发货人或货物的出口开始时,将那种类型的所有记录出口至逗号 分隔变量(CSV)文件。通常在一个完整月的自动处理结束之后开始出口, 用于生成所有三种类型的每周出口。
    在506处,针对发货人和收货人的出口公司文件被发送至D&B的 DUNS FTP服务器(未示出)以进行DUNS匹配。D&B的DUNS FTP 服务器是在匹配过程执行之前存储信息的着陆区。在DUNS匹配之后, 结果文件从D&B的DUNS FTP服务器下载,并且用来自DUNS匹配的 信息来丰富全球数据库140中的记录。
    在507处,收货人数据和发货人数据被传送至D&B DUNS FTP服务 器,并且从相同服务器上的目录接收结果。结果文件不仅包含原始的记录 和DUNS号,而且包含一些关于匹配过程的信息(例如匹配码和置信度)。
    在508处,存储在DUNS匹配之后的结果文件和装运/货物数据。
    图6是“用邮政信箱的优化器标准输入布局”—公司数据的数据格式 的示例。
    图7是商品/货物数据的数据格式的示例。
    系统100提供下面的优点:
    (1)使得购买者和销售者能够基于被进口或被出口的商品或产品来发现 彼此(即基于被出口和被进口的产品利用提单信息以检测发货人与收货人 之间的关系的网上企业对企业(B2B)信息平台);
    (2)凭借附加的公司标识符,用户可以分析发货人和收货人的企业特征, 例如位置、行业、雇员数、年销售额等,并且因此经由“看起来类似的” 模型来识别有希望的公司;
    (3)使得购买者和销售者能够通过将提单信息与公司识别符和公司信息 数据库进行联系,来理解他们的对应方的财政稳定性、支付行为和其它深 度的企业洞察力;
    (4)通过在可用性上对来自多国的进口/出口信息进行结合来提供对全球 商品贸易趋势的洞察力;
    (5)有助于监测竞争者的进口/出口活动;
    (6)有助于识别在全球运送的特定货物的路线以便通过在可用性上对来 自多国的进口/出口信息进行结合来识别供应链中断风险;以及
    (7)有助于识别欺骗性的企业、国际合规问题和犯罪。此外,这样结合 的信息将有助于购买者定位在全球各地的产品和服务,同时了解供应者的 信用可靠性。
    本文中所描述的技术是示例性的,并且不应当被理解为暗示对本公开 的任何特定的限制。应当理解的是,可以由本领域的普通技术人员设计各 种替换、组合和修改。例如,除非另外指定或由步骤本身指出,否则与本 文中所描述的过程相关联的步骤可以以任何顺序来执行。本公开意在包括 所有落入所附权利要求的范围内的替换、修改和变型。
    术语“包括”被解释为指定所述特征、整型、步骤或部件的存在,但 不排除一个或更多个其它特征、整型、步骤或部件或其群组的存在。术语 “一”是不定冠词,并且正因如此,不排除实施方式具有多个物件。

    关于本文
    本文标题:将进口数据和/或出口数据与公司标识符关联的系统及过程.pdf
    链接地址://www.4mum.com.cn/p-5890691.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 双色球历史号码查询 阿根廷分析 股票代码 平码慢慢去推敲生肖 海龙王捕鱼手游 广东快乐十分app 23号黑龙江十一选五开奖结果 北京快3北京福彩网 海南飞鱼网上购买火车票 刮刮乐福彩中奖高还是体彩高 012彩票网首页 北京pk10牛牛官方开奖 重庆时时彩官网 秒速时时彩走势图软件 上海快三查询结果 69棋牌游戏大厅