• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 5
    • 下载费用:30 金币  

    重庆时时彩有线下实体店吗: 一种针对单细胞转录组数据的降噪声算法.pdf

    关 键 词:
    一种 针对 单细胞 转录 数据 噪声 算法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201611014369.3

    申请日:

    2016.11.18

    公开号:

    CN106777870A

    公开日:

    2017.05.31

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 专利申请权的转移 IPC(主分类):G06F 19/00登记生效日:20190108变更事项:申请人变更前权利人:邹欣变更后权利人:上海三誉华夏基因科技有限公司变更事项:地址变更前权利人:200240 上海市闵行区东川路800号系统生物医学研究院b104变更后权利人:202150 上海市崇明区陈家镇瀛东村53号3幢801-830室(上海智慧岛数据产业园)变更事项:申请人变更前权利人:上正大(上海)基因生物工程有限公司|||实质审查的生效IPC(主分类):G06F 19/00申请日:20161118|||公开
    IPC分类号: G06F19/00(2011.01)I 主分类号: G06F19/00
    申请人: 邹欣; 上正大(上海)基因生物工程有限公司
    发明人: 邹欣
    地址: 200240 上海市闵行区东川路800号系统生物医学研究院b104
    优先权:
    专利代理机构: 上海旭诚知识产权代理有限公司 31220 代理人: 郑立
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201611014369.3

    授权公告号:

    ||||||

    法律状态公告日:

    2019.01.25|||2017.06.23|||2017.05.31

    法律状态类型:

    专利申请权、专利权的转移|||实质审查的生效|||公开

    摘要

    本发明公开了一种针对单细胞转录组数据的降噪声算法,涉及分子生物学领域,包括:步骤1、计算每一个基因的平均表达水平μ和方差σ2;步骤2、μ和σ2被配置为有以下关系:σ2=a0μ2+a1μ;步骤3、已知a0,a1和μ,噪声的方差水平σ02用a0μ2+a1μ来估计;步骤4、建立数据读数筛选准则;步骤5、输出的结果中只包含高可靠的基因表达数值。本发明的优点是可以全自动的判定数据的可靠性,从而找出受噪声影响的大基因表达值读数。这个过程基于统计最优化原则,摒除了人为因素的干扰,从而提高了数据处理效率,降低了信息丢失的可能性。

    权利要求书

    1.一种针对单细胞转录组数据的降噪声算法,其特征在于,包括:
    步骤1、计算每一个基因的平均表达水平μ和方差σ2;
    步骤2、μ和σ2被配置为有以下关系:σ2=a0μ2+a1μ;
    步骤3、通过使用回归模型建立μ和σ2之间的关系,从而估计a0,a1的值?;诠兰频腶0,a1
    和每一个基因的平均表达水平μ,噪声的方差水平σ02用a0μ2+a1μ来估计;
    步骤4、建立数据读数筛选准则;
    步骤5、输出的结果中只包含高可靠的基因表达数值。
    2.如权利要求1所述的针对单细胞转录组数据的降噪声算法,其特征在于,所述步骤2
    中,使用GLM回归模型来计算公式中的系数a0和a1。
    3.如权利要求1所述的针对单细胞转录组数据的降噪声算法,其特征在于,所述数据读
    数筛选准则包括:
    (1)对于一个基因,基于μ和σ02计算95%置信区间,如果该区间包括零点,则该基因被认
    为噪声污染基因;
    (2)如果一个基因,其表达水平方差σ2<σ02,则该基因被认为噪声污染基因;
    (3)对于一个基因在某一个细胞中的表达量读数x,如果x<σ0,则认为该数值的信号噪声
    比<1,此时x被设为0。

    说明书

    一种针对单细胞转录组数据的降噪声算法

    技术领域

    本发明涉及分子生物学领域,尤其涉及一种针对单细胞转录组数据的降噪声算
    法。

    背景技术

    单细胞转录组数据测量的是每一个细胞中基因的表达量,并由此鉴定出不同类型
    细胞的区别。单细胞技术可以揭示同一组织中细胞的多样性,因此已经被广泛应用于很多
    基础生物医学领域的研究中,比如组织发育和癌症等。然而由于每个细胞中所含的RNA数量
    有限,这使得单细胞转录组数据中往往较传统转录组数据含有更多的技术噪声。技术噪声
    的存在会极大的影响数据的解读和细胞类型的判定。

    针对广泛存在的技术噪音,目前主要依靠人工判定的方法,去除受噪声影响大的
    基因。由于表达量低的基因往往受噪声影响比较大,这部分基因通常被除去。同时,在不同
    细胞间表达量波动小的基因可以被认为对细胞分类无贡献,这部分基因通常也可以被除
    去。然而,这种方法受研究者主观因素影响很大,并有可能将真正的差异表达基因去除掉,
    从而引起数据信息损失。

    针对单细胞转录组数据的自动去噪算法还比较少。Bo Ding最近提出了一种算法
    通过建立RNA浓度与转录组数据FPKM数值之间的回归模型,降低噪声水平。但是这种方法并
    不能有效的降低那些低表达基因的噪声水平,并可能引起更多的偏差,因为相对于低表达
    水平的基因,它们的FPKM值并不能反映其真实RNA浓度。

    因此,本领域的技术人员致力于开发一种针对单细胞转录组数据的降噪声算法,
    摒除了人为因素的干扰,从而提高了数据处理效率,降低了信息丢失的可能性。

    发明内容

    有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何去除单细胞转录
    组数据中的技术噪声。

    为实现上述目的,本发明提供了一种针对单细胞转录组数据的降噪声算法,包括:

    步骤1、计算每一个基因的平均表达水平μ和方差σ2;

    步骤2、μ和σ2被配置为有以下关系:σ2=a0μ2+a1μ;

    步骤3、通过使用回归模型建立μ和σ2之间的关系,从而估计a0,a1的值?;诠兰频?br />a0,a1和每一个基因的平均表达水平,噪声的方差水平σ02用a0μ2+a1μ来估计;

    步骤4、建立数据读数筛选准则;

    步骤5、输出的结果中只包含高可靠的基因表达数值。

    进一步地,所述步骤2中,使用通用线性(GLM)回归模型来计算公式中的系数a0和
    a1。

    进一步地,所述数据读数筛选准则包括:

    (1)对于一个基因,基于μ和σ02计算95%置信区间,如果该区间包括零点,则该基因
    被认为噪声污染基因;

    (2)如果一个基因,其表达水平方差σ2<σ02,则该基因被认为噪声污染基因;

    (3)对于一个基因在某一个细胞中的表达量读数x,如果x<σ0,则认为该数值的信
    号噪声比<1,此时x被设为0。

    本发明的优点是可以全自动的判定数据的可靠性,从而找出受噪声影响的大基因
    表达值读数。这个过程基于统计最优化原则,摒除了人为因素的干扰,从而提高了数据处理
    效率,降低了信息丢失的可能性。

    以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以
    充分地了解本发明的目的、特征和效果。

    附图说明

    图1是本发明的一个较佳实施例的算法运行流程图。

    具体实施方式

    以下结合具体实施步骤和附图,对本发明作进一步的详细说明。实施本发明的过
    程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,对
    于本领域公知的一些技术特征未进行描述,本发明没有特别限制内容。

    本发明提出了一种针对单细胞转录组数据的降噪声算法,包括:

    步骤1、计算每一个基因的平均表达水平和表达水平方差;

    步骤2、建立平均表达水平和方差之间的回归模型;

    步骤3、利用建立的回归模型,估计噪声的方差;

    步骤4、利用自定义的准则,对数据进行筛选,去除受噪声影响大的读数。

    参照图1,具体实施步骤包括:

    步骤1、计算每一个基因的平均表达水平μ和方差σ2;

    步骤2、μ和σ2有以下关系:σ2=a0μ2+a1μ,使用通用线性(GLM)回归模型来计算公式
    中的系数a0和a1;

    步骤3、已知a0,a1和μ,噪声的方差水平σ02可以用a0μ2+a1μ来估计;

    步骤4、建立可靠数据读数筛选准则:(1)对于一个基因,基于μ和σ02计算95%置信
    区间,如果该区间包括零点,则该基因被认为噪声污染基因;(2)如果一个基因,其表达水平
    方差σ2<σ02,则该基因被认为噪声污染基因;(3)对于一个基因在某一个细胞中的表达量读
    数x,如果x<σ0,这认为该数值的信号噪声比<1,此时x被设为0;

    步骤5、输出的结果中只包含高可靠的基因表达数值。

    以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创
    造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员
    依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术
    方案,皆应在由权利要求书所确定的?;し段?。

    关于本文
    本文标题:一种针对单细胞转录组数据的降噪声算法.pdf
    链接地址://www.4mum.com.cn/p-6021272.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 研究七星彩有什么技巧吗 大小单双软件 微信交易单号尾数控制 pk10计划下载 七乐彩开奖 365投注抵用金 3d福彩三胆是什么意思 欢乐生肖官方开奖号码结果 合法的网上彩票投注站 最好pk10计划软件app 棋牌龙虎大战技巧?原因是这个 pk10永久可用出号公式 网上压大小有什么规律 7星彩开奖结果走势图 哪里有好的彩票平台 旺彩双色球