• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 10
    • 下载费用:30 金币  

    重庆时时彩经验混选: 基于循环神经网络构建预测模型的方法.pdf

    关 键 词:
    基于 循环 神经网络 构建 预测 模型 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201611027689.2

    申请日:

    2016.11.18

    公开号:

    CN106777874A

    公开日:

    2017.05.31

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G06F 19/00申请日:20161118|||公开
    IPC分类号: G06F19/00(2011.01)I; G06N3/04; G06N3/08 主分类号: G06F19/00
    申请人: 中国科学院自动化研究所
    发明人: 吴书; 王亮; 谭铁牛
    地址: 100190 北京市海淀区中关村东路95号
    优先权:
    专利代理机构: 中科专利商标代理有限责任公司 11021 代理人: 吕雁葭
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201611027689.2

    授权公告号:

    |||

    法律状态公告日:

    2017.06.23|||2017.05.31

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本发明公开了一种基于循环神经网络构建血压序列预测模型的方法,该预测模型能够根据用户历史的血压序列预测用户未来的血压趋势。包括:获取多组特征数据,所述特征数据包括血压特征、月份特征、月份间隔特征以及用户个人信息特征;将所述多组特征数据依次输入到循环神经网络模型中进行训练,其中:根据输入每组特征数据得到的输出血压预测结果更新所述循环神经网络模型的参数;以及用下一组特征数据训练更新后的循环神经网络模型,直到所述循环神经网络模型的参数收敛。本发明基于循环神经网络模型来解决序列预测问题,将时序信息充分利用,通过将其输入到同一隐含层来获得更高维度的表达,以此提高模型预测的准确度。

    权利要求书

    1.一种基于循环神经网络构建血压序列预测模型的方法,包括:
    获取多组特征数据,所述特征数据包括血压特征、月份特征、月份间隔特征以及用户个
    人信息特征;
    将所述多组特征数据依次输入到循环神经网络模型中进行训练,其中:
    根据输入每组特征数据得到的输出血压预测结果更新所述循环神经网络模型的参数;
    以及
    用下一组特征数据训练更新后的循环神经网络模型,直到所述循环神经网络模型的参
    数收敛。
    2.根据权利要求1所述的构建血压序列预测模型的方法,其特征在于,所述获取多组特
    征数据包括:
    获取多组用户数据;
    清洗所述多组用户数据;
    选取多组特征数据。
    3.根据权利要求2所述的构建血压序列预测模型的方法,其特征在于,所述用户数据包
    括用户个人信息数据和血压观测数据。
    4.根据权利要求2所述的构建血压序列预测模型的方法,其特征在于,所述清洗所述多
    组用户数据包括删去异常值点。
    5.根据权利要求1所述的构建血压序列预测模型的方法,其特征在于,所述将所述多组
    特征数据依次输入到循环神经网络模型中进行训练包括将所述多组特征数据根据时间先
    后依次输入到循环神经网络模型中进行训练。
    6.根据权利要求1所述的构建血压序列预测模型的方法,其特征在于,所述根据所述输
    出血压预测结果更新所述循环神经网络模型的参数包括:
    根据输出血压预测结果与用户血压真实值构建损失函数;
    根据损失函数更新所述循环神经网络模型的参数。
    7.根据权利要求1所述的构建血压序列预测模型的方法,其特征在于,所述循环神经网
    络的初始参数是随机设置的。

    说明书

    基于循环神经网络构建预测模型的方法

    技术领域

    本发明涉及人工智能和深度学习领域,特别涉及一种基于循环神经网络构建预测
    模型的方法。

    背景技术

    随着计算机技术的发展,其中人工智能作为一项核心技术已经被广泛应用到了很
    多具体问题中去,人工智能技术的出现使得机器能够胜任一些通常需要人类智能才能完成
    的复杂工作,为人们提供了更高效的生活。人工神经网络作为人工智能领域兴起的研究热
    点,它从信息处理的角度对人脑的神经元网络进行抽象,建立了某种简单模型,按不同的连
    接方式组成了不同的网络。人工神经网络是一种运算模型,由大量节点(或者称神经元)之
    间的相互联接构成。每个节点都代表了一种特定输出的函数,称为激励函数。每两个节点之
    间的连接都代表一个对于通过此连接信号的加权值,称为权重,这相当于神经网络中的记
    忆。网络输出则根据网络连接的方式,权重值与激励函数之间的不同而不同。网络自身通常
    都是对自然界某种算法或函数的逼近,也可能是对一种对逻辑策略的表达。深度学习的概
    念源于人工神经网络的研究,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿
    人脑的机制来解释数据。

    近年来,互联网的飞速发展促使医疗行业也想着该领域推进,移动医疗是近年来
    全球的一个市场热点,涉及到利用人工智能和大数据等一系列计算机领域技术对健康数据
    分析和预测?;谏鲜龉彩?,本发明开发并建立有关用户血压数据序列的预测算法和模型,
    将深度学习中的循环神经网络模型(Recurrent Neural Network,RNN)运用到数据挖掘的
    工作中。力争为个性化用户提供最优化策略和直观量化引导,协助实现最大效果的干预措
    施,为用户提供个性化的血压健康监测服务,改善其高血压的健康状况。

    发明内容

    (一)要解决的技术问题

    针对背景技术中的问题,本发明提出了一种基于循环神经网络构建预测模型的方
    法,以实现上述为用户提供个性化血压健康监测服务的目的。

    (二)技术方案

    本发明的一个方面提供了一种基于循环神经网络构建血压序列预测模型的方法,
    包括:

    获取多组特征数据,所述特征数据包括血压特征、月份特征、月份间隔特征以及用
    户个人信息特征;

    将所述多组特征数据依次输入到循环神经网络模型中进行训练,其中:

    根据输入每组特征数据得到的输出血压预测结果更新所述循环神经网络模型的
    参数;以及

    用下一组特征数据训练更新后的循环神经网络模型,直到所述循环神经网络模型
    的参数收敛。

    上述方案中,所述获取多组特征数据包括:

    获取多组用户数据;

    清洗所述多组用户数据;

    选取多组特征数据。

    上述方案中,所述用户数据包括用户个人信息数据和血压观测数据。

    上述方案中,所述清洗所述多组用户数据包括删去异常值点。

    上述方案中,所述将所述多组特征数据依次输入到循环神经网络模型中进行训练
    包括将所述多组特征数据根据时间先后依次输入到循环神经网络模型中进行训练。

    上述方案中,所述根据所述输出血压预测结果更新所述循环神经网络模型的参数
    包括:

    根据输出血压预测结果与用户血压真实值构建损失函数;

    根据损失函数更新所述循环神经网络模型的参数。

    上述方案中,所述循环神经网络的初始参数是随机设置的。

    (三)有益效果

    本发明涉及基于循环神经网络的血压序列预测模型,将大数据和深度循环神经网
    络建模序列信息,应用于血压健康信息的预测中。同时将干预情境进行建模,得到用户血压
    序列更准确的预测效果。

    附图说明

    图1是根据本发明实施例的基于循环神经网络构建预测模型的方法流程图。

    图2是根据本发明实施例的循环神经网络模型图。

    具体实施方式

    为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照
    附图,对本发明作进一步的详细说明。

    根据本发明实施例,基于循环神经网络模型来解决序列预测问题,将时序信息充
    分利用,通过将其输入到同一隐含层来获得更高维度的表达,以此提高模型预测的准确度。
    该神经网络模型能对健康数据(血压数据)信息进行建模,并利用时间序列信息更好地预测
    未来健康趋势。在本发明实施例中,基于循环神经网络的血压序列预测模型,将大数据和深
    度循环神经网络建模序列信息,应用于血压健康信息的预测中。

    图1是根据本发明实施例的基于循环神经网络构建预测模型的方法流程图。

    如图1所示,在步骤S1,获取用户数据。根据本发明实施例,用户数据包括用户信息
    数据和血压观测数据,将用户数据导入数据库,构建用户-血压信息数据库。例如,训练和测
    试样本抽取的规则为2016年3月有测量并且2015年1月到2016年2月至少有3个月有测量的
    用户(有测量是指一个月至少有5次测量)。

    在步骤S2,清洗数据。根据本发明实施例,异常值点包含异常的用户信息数据和/
    或血压观测数据。根据先验知识检查用户信息数据和血压观测数据,删去异常值点,将数据
    集变为可以用于深度学习模型训练的目标数据。在本发明实施例中,用户信息数据的筛选
    规则可以包括以下任意一项或多项:去除用户信息数据中年龄大于110岁和小于10岁的用
    户;去除身高小于120厘米或者大于200厘米的数据;去除体重小于20kg或者大于130kg的数
    据。在本发明实施例中,血压观测数据的筛选规则可以包括以下任意一项或多项:去除低压
    小于和大于该用户历史血压测量平均值40的观测数据;去除高压小于和大于该用户历史血
    压测量平均值40的观测数据;去除心率为0的观测数据。

    在步骤S3,选取特征。根据本发明实施例,选取的特征例如包括用户信息数据和该
    用户的血压观测数据。用户信息数据可以包括:年龄、性别、身体质量指数(BMI,BMI是用用
    户体重公斤数除以身高米数平方得出的数字,是目前国际上常用的衡量人体胖瘦程度以及
    是否健康的一个标准)。血压观测数据可以包括用户每个月的血压特征、月份特征和月份间
    隔特征。其中,血压特征指有测量月份的用户低压、高压、心率的该月平均值(有测量月份是
    指该用户在该月份中至少有5次及以上次数测量);月份特征为12维度,one-hot(0-1)编码
    的向量,通过1在序列中的位置来表达月份信息;月份间隔特征为当月与下个有测量月份的
    时间差。选取在所有数据月份期间中至少有3个月份有测量的用户数据。

    在步骤S4,训练模型。根据本发明实施例,将该用户每个月的血压特征、月份特征
    月份间隔特征以及用户信息数据拼接为输入特征,根据时间前后依次输入到循环神经网络
    的输入向量中,通过将其输入到同一隐层来获得更高维度的表达,以此来提高拟合的准确
    度。在本发明实施例中,RNN模型输入维度包含:用户的BMI、年龄、性别(2维向量),当月的平
    均低压、高压、心率和服药,所述服药包括用户在该次测量血压前是否服用过降压药,例如
    在测量前填写是/否,该月月份(12维向量),与下个有测量点月份的时间间隔。将一组数据
    顺序输入模型,该组数据的前n条作为模型输入值输入到模型中进行训练,得到预测值,该
    组数据的第n+1条作为预测目标值,预测目标值可以为低压值或高压值,从而可以计算预测
    目标值与预测值的差值,借助此差值即可用梯度下降算法对模型参数进行修改。

    如图2所示,本发明所用循环神经网络模型为三层展开的循环神经网络
    (Recurrent Neural Network,RNN)模型,RNN模型可以通过时序展开,变成一个基础的深层
    神经网络,该深层神经网络的权值是共享的。模型通过时序反向传播算法来学习。反向传播
    算法本质上是一种梯度下降,它通过将神经网络的输出与标签值进行对比得到残差,然后
    利用链式求导法则将残差沿着梯度方向一步步向前传。以下为模型具体学习公式。

    向前传导过程如下,其中x(t)为模型输入,为横向量;h(t)为模型隐层表达,U、W均
    为转移矩阵;t为时间;V为线性回归参数,为竖向量;y为计算出的预测结果:

    x(t-2)*U+h(t-3)*W=h(t-2) (1)

    x(t-1)*U+h(t-2)*W=h(t-1) (2)

    x(t)*U+h(t-1)*W=h(t) (3)

    y=h(t)*V (4)

    在步骤S5,构建损失函数并更新模型参数。根据本发明实施例,根据步骤S4中的预
    测结果与真实值构建损失函数,并根据损失函数更新该预测模型的参数。如图2所示,例如:
    我们将预测值与真实值得差值用error表示,j为真实值,

    error=y-j (5)

    损失函数公式表示为,V为线性回归参数,为竖向量;λ为惩罚项系数,可用来减少
    模型的过拟合,


    分别求出当前时刻t时Loss对V的偏导和当前时刻t时损失函数对隐层的偏导,



    与公式(8)相乘可分别求出损失函数对U的偏导,对W的偏导和当前隐层对t-1时刻
    隐层的偏导:




    将公式(8)的结果作为中间变量,利用公式(8)和公式(12)的传播梯度结果修改模
    型参数U和模型参数W:




    利用公式(11)求Loss对上一时间戳隐层的偏导


    利用反向传播的梯度修改t-1时刻的参数,修改第二层:




    利用反向传播的梯度修改t-2时刻的参数,修改第三层:



    将最后一层线性回归得到的预测值与真实值相减,得到了一个差值error。模型损
    失函数设置为最小平方差,通过最小化损失函数来修改模型。对模型里的参数求偏导,先修
    改输出层的转移矩阵,再求输出层对隐层的偏导,借此继续做反向求导,直到修改到t-2时
    刻的模型参数。

    在步骤S6,判断参数是否收敛,如果参数收敛则进行步骤S7,进行步骤S4。根据本
    发明实施例,如果模型的参数收敛则认为模型训练完成,如果模型的参数不收敛则需要选
    取新的用于重新训练模型,即重复上述步骤S4-S5,直至模型参数收敛。根据本发明实施例,
    所述收敛为模型的参数在一定的范围内震荡。

    在步骤S7,完成预测模型构建。根据本发明实施例,如果模型参数已经收敛,则认
    为得到的参数使得模型相对于训练数据达到最优化,完成模型训练。

    根据本发明的实施例,将80%的用户作为训练集,训练方法如上所示;将20%的用
    户作为测试集,测试目标为每个用户最后一个月的低压值或高压值,通过将用户最后一个
    月之前的数据输入模型,可得到预测值,再将预测值与测试目标相减,利用相减得到的差值
    的绝对值,可以评估模型预测的准确度。拟合数值基础(baseline)为直接用用户上一个月
    的低压数据拟合下一个月的数值,得到baseline为4.33。实验结果如表1(表1是利用本发明
    模型预测用户在2016年3月的平均低压)和表2(表2是利用本发明模型预测用户在2016年3
    月的平均高压)所示。用上一个月的结果直接拟合baseline与RNN的预测结果进行对比,在
    真实血压数据集上的实验结果有显著提高。用循环神经网络模型预测一个后的目标月份血
    压低压值与高压值,分别提高了25.4%和26.2%,预测两个月后的目标月份血压低压值与
    高压值,分别提高了22.2%和23.4%。表3(表3是利用本发明模型预测用户在长周期后的血
    压低压值)表示循环神经网络模型预测用户长周期后的低压值,在3至6个月的长周期时间
    内,本模型均能得到较好的预测结果。

    表1



    表2



    表3 循环神经网络模型预测用户在长周期后的低压值

    预测周期(月)
    平均误差
    训练样本
    3
    4.02
    352
    4
    3.98
    237
    5
    4.12
    175
    >=6
    4.32
    310

    以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详
    细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在
    本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的?;?br />范围之内。

    关于本文
    本文标题:基于循环神经网络构建预测模型的方法.pdf
    链接地址://www.4mum.com.cn/p-6021106.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 太子中心六肖中特 秒速时时手机版 2019够力七星彩安装 长期包九肖能不能赚钱 澳门赌牌规则 下载双色球奖 千里马计划软件时时 北京快三大小怎么猜测 黑马计划软件怎样 北京时时在线开奖 新11选5稳赚方案 实战后二直选45至50注 三分时时彩技巧稳赚公式 四川时时走势图 广西福利彩票自助投注 最高反水彩票