• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 11
    • 下载费用:30 金币  

    重庆时时彩五星走势图: 用以分析细菌菌种的测序数据的系统及其方法.pdf

    关 键 词:
    用以 分析 细菌 菌种 序数 系统 及其 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201610083766.X

    申请日:

    2016.02.06

    公开号:

    CN106778071A

    公开日:

    2017.05.31

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G06F 19/20申请日:20160206|||公开
    IPC分类号: G06F19/20(2011.01)I 主分类号: G06F19/20
    申请人: 财团法人资讯工业策进会
    发明人: 郑佳扬; 徐仁徽; 刘韦驿; 蔡孟勳; 卢子彬; 赖亮全; 庄曜宇
    地址: 中国台湾台北市和平东路二段106号11F
    优先权: 2015.11.20 TW 104138505
    专利代理机构: 北京律诚同业知识产权代理有限公司 11006 代理人: 徐金国
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201610083766.X

    授权公告号:

    |||

    法律状态公告日:

    2017.06.23|||2017.05.31

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本发明涉及一种用以分析细菌菌种的测序数据的系统及其方法。用以分析细菌菌种的测序数据的方法包含:搜索第一基因样本序列中的特定变异区域以及搜索第二基因样本序列中的另一特定变异区域;判断特定变异区域与另一特定变异区域是否存在相同的一跨检体子序列;当特定变异区域与另一特定变异区域存在相同的跨检体子序列时,储存跨检体子序列至记录表中;当存在跨检体子序列时,将跨检体子序列与一数据库??橹械亩喔鲆阎只蛐蛄薪斜榷?,以分析该第一基因样本序列与第二基因样本序列中对应跨检体子序列的菌种。由此减少测序数据的系统的运算量,以达到提升分析检体数据速度的功效。

    权利要求书

    1.一种用以分析细菌菌种的测序数据的系统,其特征在于包
    含:
    单一检体去重复序列???,用以搜索第一基因样本序列中的第一
    保守区域及一特定变异区域,并将该第一保守区域移除;
    跨检体重复序列判断???,用以判断该特定变异区域是否存在与
    第二基因序列中的另一特定变异区域相同的一跨检体子序列;
    重复序列记录???,当该特定变异区域存在与该第二菌体样本中
    的该另一特定变异区域相同的该跨检体子序列时,该重复序列记录模
    块用以储存该跨检体子序列至一记录表中;
    运算贴序???,当存在该跨检体子序列时,该运算贴序??橛靡?br />将该跨检体子序列与数据库??橹械亩喔鲆阎只蛐蛄薪斜?br />对,以分析该第一基因样本序列与该第二基因样本序列中对应该跨检
    体子序列的菌种。
    2.根据权利要求1所述的用以分析细菌菌种的测序数据的系
    统,还包含:
    检体采样???,用以采样多个菌体样本,该些菌体样本包含第一
    菌体样本及第二菌体样本;以及
    基因测序???,用以将该些菌体样本分别进行基因测序,以取得
    对应该第一菌体样本的第一基因样本序列,及对应该第二菌体样本的
    第二基因样本序列。
    3.根据权利要求2所述的用以分析细菌菌种的测序数据的系
    统,其中,该重复序列记录??楦靡约锹几每缂焯遄有蛄兴杂Φ?br />该另一特定变异区域、该跨检体子序列所对应的该另一特定变异区域
    的所属的该第二菌体样本。
    4.根据权利要求1所述的用以分析细菌菌种的测序数据的系
    统,其中,该第一基因样本序列包含第一基因片段及第二基因片段,
    其中,当该第一基因片段与该第二基因片段完全相同时,该单一
    检体去重复序列??榻玫诙蚱问游辽俚谝槐J厍虻钠渲?br />之一,该特定变异区域排除该第二基因片段;以及
    该运算贴序??榻玫谝换蚱斡敫檬菘饽?橹械母眯┮阎?br />菌种基因序列进行比对,以分析对应该第一基因片段的菌种。
    5.根据权利要求1所述的用以分析细菌菌种的测序数据的系
    统,其中,该第一基因样本序列包含第一基因片段及第二基因片段,
    当该第一基因片段长于该第二基因片段,且该第二基因片段完全相同
    于该第一基因片段的一部分时,该运算贴序??榻玫谝换蚱斡?br />该数据库??橹械母眯┮阎只蛐蛄薪斜榷?,以分析对应该第
    一基因片段的菌种。
    6.根据权利要求5所述的用以分析细菌菌种的测序数据的系
    统,其中该第一基因样本序列包含第一基因片段及第二基因片段,当
    该第一基因片段长于该第二基因片段,且该第二基因片段完全相同于
    该第一基因片段的一部分时,该运算贴序??榻玫诙蚱未⒋?br />至该记录表中。
    7.一种用以分析细菌菌种的测序方法,其特征在于包含:
    搜索第一基因样本序列中的特定变异区域以及搜索第二基因样本
    序列中的另一特定变异区域;
    判断该特定变异区域与该另一特定变异区域是否存在相同的一跨
    检体子序列;
    当该特定变异区域与该另一特定变异区域存在相同的该跨检体子
    序列时,储存该跨检体子序列至记录表中;以及
    当存在该跨检体子序列时,将该跨检体子序列与数据库??橹械?br />多个已知菌种基因序列进行比对,以分析该第一基因样本序列与该第
    二基因样本序列中对应该跨检体子序列的菌种。
    8.根据权利要求7所述的用以分析细菌菌种的测序方法,其中
    该第一基因样本序列包含第一基因片段及第二基因片段,其中搜索该
    第一基因样本序列中的该特定变异区域的步骤包含:
    判断该第一基因片段与该第二基因片段是否完全相同;以及
    当该第一基因片段与该第二基因片段完全相同时,该特定变异区
    域排除该第二基因片段。
    9.根据权利要求7所述的用以分析细菌菌种的测序方法,其
    中,该第一基因样本序列包含第一基因片段及第二基因片段,当该第
    一基因片段长于该第二基因片段时,其中搜索该第一基因样本序列中
    的该特定变异区域的步骤包含:
    判断该第二基因片段是否完全相同于该第一基因片段的一部分;
    以及
    当该第二基因片段完全相同于该第一基因片段的一部分,该特定
    变异区域排除该第二基因片段。
    10.根据权利要求9所述的用以分析细菌菌种的测序方法,包
    含:
    当该第一基因片段长于该第二基因片段,且该第二基因片段完全相同于
    该第一基因片段的一部分时,将该第二基因片段储存至该记录表中。

    说明书

    用以分析细菌菌种的测序数据的系统及其方法

    技术领域

    本发明涉及一种用以分析细菌菌种的测序数据的系统及其方法,且特别
    是涉及一种针对单一检体及跨检体重复序列进行检测的用以分析细菌菌种的
    测序数据的系统及其方法。

    背景技术

    随着生物科技的日益发展,基因测序的工作越来越完整,对于人体共生
    菌的研究变得非常重要。目前已知人体身上约100兆的共生菌所组成,这些
    共生菌的数量比人体全部的细胞整整多了十倍。此外,人体的肠胃道、皮
    肤、口腔、呼吸道、生殖道等等地方也有共生菌的存在,统称为菌相,这些
    菌相与免疫、代谢、发育,神经系统等等皆息息相关。

    其中,科学家们已知利用16S核糖体RNA(16S rRNA)序列的测序,
    解构出人类肠道菌的种类分布,因此可利用将16S rRNA基因标定并扩增复
    制序列后,经过测序及根据测序的质量做前处理,再将序列与16S rRNA数
    据库做组序、贴序的步骤,以区分出物种。而相似性高的物种将会归类到同
    一个可操作性的分类单位体(operational taxonomic unit,OTU),最后统计分
    析不同检体的菌向差异。

    然而,在传统上,若要分析多组检体数据,则需要耗费的时程及运算量
    是相当可观的,因此如何减少系统的运算量,以提升分析检体数据的速度,
    已成为本领域需要解决的问题之一。

    发明内容

    为解决上述的问题,本发明的一个方面提供一种用以分析细菌菌种的测
    序数据的系统。用以分析细菌菌种的测序数据的系统包含:单一检体去重复
    序列???、跨检体重复序列判断???、重复序列记录??橐约霸怂闾蚰?br />块。单一检体去重复序列??橛靡运阉鞯谝换蜓拘蛄兄械牡谝槐J厍?br />及特定变异区域,并将第一保守区域移除??缂焯逯馗葱蛄信卸夏?橛靡耘?br />断特定变异区域是否存在与第二基因序列中的另一特定变异区域相同的跨检
    体子序列。重复序列记录??橛靡缘碧囟ū湟烨虼嬖谟氲诙逖局械?br />另一特定变异区域相同的跨检体子序列时,储存跨检体子序列至记录表中。
    运算贴序??橛靡缘贝嬖诳缂焯遄有蛄惺?,将跨检体子序列与数据库??橹?br />的多个已知菌种基因序列进行比对,以分析第一基因样本序列与第二基因样
    本序列中对应跨检体子序列的菌种。

    本发明的另一方面提供一种用以分析细菌菌种的测序方法。分析细菌菌
    种的测序方法包含:搜索第一基因样本序列中的特定变异区域以及搜索第二
    基因样本序列中的另一特定变异区域;判断特定变异区域与另一特定变异区
    域是否存在相同的跨检体子序列;当特定变异区域与另一特定变异区域存在
    相同的跨检体子序列时,储存跨检体子序列至记录表中;当存在跨检体子序
    列时,将跨检体子序列与数据库??橹械亩喔鲆阎只蛐蛄薪斜榷?,
    以分析该第一基因样本序列与第二基因样本序列中对应跨检体子序列的菌
    种。

    综上所述,本发明的技术方案与现有技术相比具有明显的优点和有益效
    果。通过上述技术方案,可达到相当的技术进步,并具有产业上的广泛利用
    价值,本公开内容可减少用以分析细菌菌种的测序数据的系统的运算量,以
    达到提升分析检体数据速度的功效。

    附图说明

    为了使本发明的上述和其他目的、特征、优点与实施例能更明显易懂,
    提供附图如下:

    图1是根据本发明一实施例绘示的一种用以分析细菌菌种的测序数据的
    系统的方块图;

    图2是根据本发明一实施例绘示的一种用以分析细菌菌种的测序数据的
    方法的流程图;

    图3是根据本发明一实施例绘示的一种基因样本序列的示意图;

    图4A-4C是根据本发明一实施例绘示的一种基因片段的示意图。

    具体实施方式

    参照第1图,图1是根据本发明一实施例绘示的一种用以分析细菌菌种的
    测序数据的系统100的方块图。

    用以分析细菌菌种的测序数据的系统100包含:单一检体去重复序列模
    块110、跨检体重复序列判断???20、重复序列记录???30以及运算贴序
    ???40。单一检体去重复序列???10用以搜索第一基因样本序列中的第一
    保守区域及特定变异区域,并将第一保守区域移除??缂焯逯馗葱蛄信卸夏?br />块120用以判断特定变异区域是否存在与第二基因序列中的另一特定变异区
    域相同的一跨检体子序列。重复序列记录???30用以当特定变异区域存在
    与第二菌体样本中的另一特定变异区域相同的跨检体子序列时,储存跨检体
    子序列至一记录表135中。运算贴序???40用以当存在跨检体子序列时,将
    跨检体子序列与一数据库???50中的多个已知菌种基因序列进行比对,以
    分析第一基因样本序列与第二基因样本序列中对应跨检体子序列的菌种。

    其中,如图1所示,数据库???50可被实作为只读存储器、闪存、软
    盘、硬盘、光盘、随身碟、磁带、可由网络存取的数据库或本领域技术人员
    可轻易思及具有相同功能的储存介质,记录表135可以为一档案,被储存于
    具有储存功能的任何电子装置中。此外,单一检体去重复序列???10、跨
    检体重复序列判断???20、重复序列记录???30以及运算贴序???40可
    分别或合并被实施为例如微控制单元(microcontroller)、微处理器
    (microprocessor)、数字信号处理器(digital signal processor)、特殊应用集成电
    路(application specific integrated circuit,ASIC)或逻辑电路。

    由上述可知,用以分析细菌菌种的测序数据的系统100可排除单一检体
    中相同或重复的基因区段,并通过跨检体地找出相同或重复的跨检体子序
    列,将跨检体子序列及其与菌体样本之间的关系储存至记录表135中,利用
    记录表135可将大量具有重复性质的跨检体子序列建立精简化的数据结构。
    通过此些方法可避免运算贴序???40重复地将单一检体或跨检体中相同或
    重复的大量基因区段与数据库???50中的已知数据进行比对,更可减少用
    以分析细菌菌种的测序数据的系统100的运算量,以提升分析检体数据的速
    度。

    以下进一步说明分析细菌菌种的测序数据的方法200。一并参照图1-3,
    图2是根据本发明一实施例绘示的一种用以分析细菌菌种的测序数据的方法
    200的流程图。图3是根据本发明的一实施例绘示的一种基因样本序列300的
    示意图。为了方便说明,图1所示的用以分析细菌菌种的测序数据的系统100
    的操作会与用以分析细菌菌种的测序数据的方法200及基因样本序列300一并
    举例说明。

    在步骤S210中,单一检体去重复序列???10用以搜索第一基因样本序
    列中的特定变异区域以及搜索第二基因样本序列中的另一特定变异区域。于
    一实施例中,第一基因样本序列中的特定变异区域以及第二基因样本序列中
    的另一特定变异区域可以分别指第一基因样本序列和第二基因样本序列中的
    任一段变异区域。

    于一实施例中,用以分析细菌菌种的测序数据的系统还包含检体采样模
    块(未绘示)及基因测序???未绘示)。检体采样??橛靡圆裳喔鼍逖?br />本,此些菌体样本包含第一菌体样本及第二菌体样本?;虿庑蚰?橛靡越?br />此些菌体样本分别进行基因测序,以取得对应第一菌体样本的第一基因样本
    序列,及对应第二菌体样本的第二基因样本序列。

    举例而言,于某一使用者进行大肠镜检查时,可能会发现其大肠长有息
    肉,则检体采样??榭山⑷獠糠萁胁裳?,并在息肉的附近看起来正常的
    地方也进行采样,以取得多个菌体样本。其中,每一份菌体样本可能具有30
    万笔基因数据,此些数据中通?;煸恿硕嘀侄匀颂逵泻蛴幸娴亩嘀窒妇?,
    因此可通过将此些基因样本序列分别与数据库???50中的已知数据进行比
    对,当比对出两者相同时(例如第一基因样本序列与数据库???50中的某一
    已知菌种基因序列相同时),则可确认出对应此基因样本序列的菌种。例
    如,一共采样30份菌体样本后,利用基因测序??榻谢虿庑?,此基因测
    序??槔缥庑蛞?,可将每一份菌体样本的脱氧核醣核酸(DNA)提取出
    来,并对应每一份菌体样本各自取得至少一笔基因样本序列。

    此外,于另一实施例中,当基因测序需要测序出基因序列长度为500bp
    的变异区域,但测序仪只能测序至100bp的基因序列长度时,测序仪可被设
    置成大量复制基因序列后,随机打碎此被大量复制的基因序列,再取得打碎
    后的各小片段的100bp的基因序列长度以进行测序,最后再将测序后各小片
    段组合起来,通过此方法可以测序出长度较长的基因序列。

    于一实施例中,单一检体去重复序列???10可接收多个基因样本序
    列。于一实施例中,单一检体去重复序列???10可接收已完成基因测序的
    第一基因样本序列及第二基因样本序列,且此第一基因样本序列及第二基因
    样本序列来对应至同一份或不同份的检体样本。

    于一实施例中,第一基因样本序列可以例如为图3所示的基因样本序列
    300。于图3中,基因样本序列300为一条16s rRNA,长度为1600bp(碱基
    对)。本领域技术人员可理解图3中的基因样本序列300是一基因样本示意
    图。单一检体去重复序列???10可应用既有的基因序列搜索方法,以搜索
    出此基因样本序列300所包含的保守区域C1-C10与变异区域V1-V10。其中,
    保守区域C1-C10是指每个细菌的16s rRNA中相同或类似的基因区段,变异
    区域V1-V10是指每个细菌的16s rRNA中相异的基因区段。于一实施例中,
    第一基因样本序列中可具有第一变异区域V1、第二变异区域V2、第三变异
    区域V3、第四变异区域V4…等。于一实施例中,变异区域V1-V10可各自具
    有不同的长度。

    此外,第二基因样本序列亦可以例如为图3所示的基因样本序列300。于
    一实施例中,第二基因样本序列与第一基因样本序列中的基因排序方式不
    同。于一实施例中,第二基因样本序列与第一基因样本序列中的基因排序方
    式及基因样本长度均不同。本领域技术人员可理解第二基因样本序列中的另
    一特定变异区域的搜索方式与前述第一基因样本序列中的特定变异区域的搜
    索方式相同,故此处不再赘述。

    通过搜索第一基因样本序列中的特定变异区域以及搜索第二基因样本序
    列中的另一特定变异区域,可对样本检体序列做前置处理以减低需要查询贴
    序的数量。

    另一方面,于一实施例中,由于每一只细菌的16s rRNA都大同小异,
    可能仅有部分变异区域不同。因此,数据库???50于建立已知菌种基因序
    列的过程中,可基于既有的次世代测序16s rRNA识别法,摘取出某一已知
    细菌的部分变异区域,并将此摘取出的部分变异区域储存于数据库???50
    中,以供后续运算贴序???40将此摘取出的部分变异区域与检体样本的基
    因序列进行比对。

    由此,数据库???50可对16S rRNA的已知菌种基因序列建构检索,意
    即仅摘取出各个已知细菌的部分变异区域,作为对应各个已知细菌的基因序
    列代表,以精简被搜索或被用来比对的基因序列。

    举例而言,若数据库???50于建立已知菌种基因序列时,摘取出图3所
    示的第三变异区域V3-第四变异区域V4的基因区段,并将此摘取出的部分变
    异区域储存于数据库???50中,以供后续运算贴序???40将此摘取出的部
    分第三变异区域V3-第四变异区域V4与检体样本的基因序列进行比对。此
    外,关于比对方法的细节技术特征将于步骤S240中详述。

    于一实施例中,部分第三变异区域V3-第四变异区域V4的长度例如为
    500bp,基因样本序列300全序列长度为1600bp,故于此实施例中,此部分第
    三变异区域V3-第四变异区域V4仅占基因样本序列300全序列长度的30%。

    由此可知,通过此方法可将目前已知的20.3万种细菌的16s rRNA摘要
    出差异区域,并将其储存于数据库???50中,运算贴序???40后续只需将
    第一基因样本序列中的特定变异区域(例如为第一基因样本序列中的第三变
    异区域V3-第四变异区域V4)及/或第二基因样本序列中的另一特定变异区域
    (例如为第二基因样本序列中的第三变异区域V3-第四变异区域V4)与数据库
    ???50中所储存的已知细菌的部分变异区域进行比对,当比对出两者相同
    时,则可确认出对应此基因样本序列的菌种。

    换言之,通过上述技术特征,于进行基因序列分析或贴序时,只需比对
    基因样本序列与数据库???50中具代表性的基因序列区段或基因序列的变
    异区域,无需将整个基因样本序列或整个第二基因样本序列与数据库???br />150中完整的所有数据进行比对,由此可降低运算贴序???40于贴序过程中
    所需耗用的运算量,以提升分析检体数据的速度。

    于步骤S220中,跨检体重复序列判断???20用以判断特定变异区域与
    另一特定变异区域是否存在相同的一跨检体子序列。

    于一实施例中,当经由单一检体去重复序列???10搜索第一基因样本
    序列中的特定变异区域以及搜索第二基因样本序列中的另一特定变异区域
    后,若第一基因样本序列与第二基因样本序列位于不同的菌体样本中,则可
    通过跨检体重复序列判断???20判断特定变异区域与另一特定变异区域是
    否存在相同的一跨检体子序列。

    例如,于特定变异区域包含于第一基因样本序列中,第一基因样本序列
    包含于第一菌体样本,且另一特定变异区域包含于第二基因样本序列中,第
    二基因样本序列包含于第二菌体样本的情况下,若特定变异区域与另一特定
    变异区域具有某一相同的基因子序列(substring),则将此部分基因子序列视
    为跨检体子序列。

    于一实施例中,若检体重复序列判断???20判断特定变异区域与另一
    特定变异区域存在相同的一跨检体子序列,则进入步骤S230。

    反之,若检体重复序列判断???20判断特定变异区域与另一特定变异
    区域未存在相同的一跨检体子序列,则运算贴序???40直接将第一基因样
    本序列中的特定变异区域与数据库???50中的多个已知菌种基因序列进行
    比对,以分析第一基因样本序列中对应特定变异区域的菌种?;痪浠八?,当
    某个变异区域只有在某一菌体样本中出现,没有出现在其他菌体样本时,例
    如前述的特定变异区域与另一特定变异区域未存在相同的一跨检体子序列
    时,则此变异区域不会被移除,且运算贴序???40一定会将此变异区域与
    数据库???50中的数据进行比对。

    在步骤S230中,重复序列记录???30用以当特定变异区域与另一特定
    变异区域存在相同的跨检体子序列时,储存跨检体子序列至一记录表135
    中。

    于一实施例中,重复序列记录???30更用以记录跨检体子序列所对应
    的特定变异区域、跨检体子序列所对应的特定变异区域的所属的第一菌体样
    本、另一特定变异区域、跨检体子序列所对应的另一特定变异区域的所属的
    第二菌体样本。藉由记录此些数据,可利于减少后续贴序时及/或分析可操
    作性的分类单位体时所需要的运算量,例如,于分析可操作性的分类单位体
    时,可透过记录表13追溯出对应某一跨检体子序列的某一变异区域及其所属
    的菌体样本,无须再次重新比对所有基因样本序列。

    在步骤S240中,运算贴序???40用以当存在跨检体子序列时,将跨检
    体子序列与数据库???50中的多个已知菌种基因序列进行比对,以分析第
    一基因样本序列与第二基因样本序列中对应跨检体子序列的菌种。

    由此,当存在跨检体子序列时,运算贴序???40会将此跨检体子序列
    摘取出来,再将此垮检体子序列与数据库???50中的全部数据或已知菌种
    的部分变异区域进行比对一次,并将比对结果记录于记录表135中。因此,
    当多个菌体样本中都具有相同的基因子序列(即跨检体子序列)时,运算贴序
    ???40仍只需要将此相同的基因子序列时与已知数据比对一次,即可得知
    基因子序列对应到某一特定的已知菌体,亦可推得此些菌体样本中都包含此
    特定的已知菌体,而无须将每一个菌体样本中所有相关于跨检体子序列的基
    因序列都一一进行比对。

    此外,于后续计算环境基因体比对分析时,运算贴序???40可回查记
    录表135,以得知此变异区域在哪些菌种上面,且此些菌种存在于哪几个菌
    体样本中(步骤S230),藉此可减少运算贴序的次数。

    接着,参阅图4A-4C,图4A-4C是根据本发明一实施例绘示的一种基因
    片段的示意图。以下进一步说明于步骤S220及S240中相关于单一检体去重
    复的细部方法及其基因序列的比对方法。

    于一实施例中,参照图4A,第一基因样本序列包含第一基因片段D1及
    第二基因片段D2。于步骤S210中还包含判断第一基因片段D1与第二基因片
    段D2是否完全相同,当第一基因片段与第二基因片段完全相同时,特定变
    异区域排除第二基因片段D2。

    举例而言,当第一基因片段D1与第二基因片段D2完全相同时,单一检
    体去重复序列???10将第二基因片段D2视为至少第一保守区域的其中之
    一,故可将特定变异区域视为排除(或不包含)第二基因片段D2。此外,运算
    贴序???40将第一基因片段D1与数据库???50中的已知菌种基因序列进
    行比对,以分析对应第一基因片段D1的所属菌种。

    于一实施例中,参照图4B,第一基因样本序列包含第一基因片段D1及
    第二基因片段D2,且当第一基因片段D1长于第二基因片段D2时,于步骤
    S210中,还包含判断第二基因片段D2是否完全相同于第一基因片段D1的一
    部分;当第二基因片段D2完全相同于第一基因片段D1的一部分时,特定变
    异区域排除第二基因片段D2。

    举例而言,当第一基因片段D1长于第二基因片段D2,且第二基因片段
    D2完全相同于第一基因片段D1的一部分时,可将特定变异区域视为排除(或
    不包含)第二基因片段D2。此外,运算贴序???40将第一基因片段D1与数
    据库???50中的已知菌种基因序列进行比对,以分析对应第一基因片段D1
    的所属菌种。

    于一实施例中,参照图4C,其中第一基因样本序列包含第一基因片段
    D1及第二基因片段D2,当第一基因片段D1长于第二基因片段D2,且第二基
    因片段D2完全相同于第一基因片段D1的一部分时,运算贴序???40将第二
    基因片段D2储存至记录表135中。

    此外,于一实施例中,在确认某一基因序列对应至何种菌种及其所属菌
    体样本后,可进一步进行环境基因体比对分析,以判断此些分析出来的菌种
    及所属菌体样本中的益菌或坏菌所占的比例;于一实施例中,亦可基于分析
    结果进一步进行群集分析,以分析细菌分布的情况,例如,癌症患者的细菌
    群集中的某些特定菌数量会较多,由此可分析病患的健康程度;于一实施例
    中,可基于分析结果进一步进行菌落功能分析,以判断此些菌种是否具有益
    生菌或是与某些特定疾病相关的已知菌种,由此以得知病患的健康状况。

    综上所述,本发明所示的用以分析细菌菌种的测序数据的系统及其方
    法,可对样本检体序列做前置处理,减低需要查询贴序的数量,以精简需要
    进行比对的基因序列,可减少用以分析细菌菌种的测序数据的系统的运算
    量,以提升分析检体数据的速度。

    虽然本发明已以实施方式揭露如上,然而其并非用以限定本发明,任何
    本领域技术人员,在不脱离本发明的精神和范围内,可作各种修改与改变,
    因此本发明的?;し段б运饺ɡ笫樗缍ㄕ呶?。

    关于本文
    本文标题:用以分析细菌菌种的测序数据的系统及其方法.pdf
    链接地址://www.4mum.com.cn/p-6021346.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 重庆时时规律破解器 pk10技巧稳赚买法最新 福彩双色球走势图 6码2期倍投计划公式 北京pk10高手实战稳赚技巧 双色球开奖结果下软件 3d组六3码遗漏分析 双色球怎么填手写 pk10计划软件破解版免费版 幸运飞艇双面玩法怎么玩 大发超神快三计划app下载 11选5计划软件哪个最好 2019第50期太子报玄机图 上海时时11选5开奖结果走势图 玩单双有什么技巧 大乐透中奖规则表