• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 16
    • 下载费用:30 金币  

    重庆时时彩晚上2点: 基于最小二乘支持向量机模型的城市短期用水量预测方法.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201510141201.8

    申请日:

    2015.03.27

    公开号:

    CN104715292A

    公开日:

    2015.06.17

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 著录事项变更IPC(主分类):G06Q 10/04变更事项:发明人变更前:王景成 戢钢 葛阳 刘华江 杨丽雯 胡涛变更后:王景成 戢钢 朱慧峰 戴雷杰 葛阳 刘华江 杨丽雯 胡涛|||实质审查的生效IPC(主分类):G06Q 10/04申请日:20150327|||公开
    IPC分类号: G06Q10/04(2012.01)I; G06Q50/06(2012.01)I 主分类号: G06Q10/04
    申请人: 上海交通大学
    发明人: 王景成; 戢钢; 葛阳; 刘华江; 杨丽雯; 胡涛
    地址: 200240上海市闵行区东川路800号
    优先权:
    专利代理机构: 上海旭诚知识产权代理有限公司31220 代理人: 郑立
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201510141201.8

    授权公告号:

    ||||||

    法律状态公告日:

    2017.06.16|||2015.07.15|||2015.06.17

    法律状态类型:

    著录事项变更|||实质审查的生效|||公开

    摘要

    本发明提供一种基于最小二乘支持向量机模型的城市短期用水量预测方法,包括以下步骤:对历史用水量进行预处理;进行相关性分析;采用最小二乘支持向量机方法,建立城市短期用水量预测模型,选取相关系数大于设定值的历史用水量的时间序列组合作为训练样本集进行训练;采用城市短期用水量预测模型进行实时预测;计算预测误差,如果预测误差不满足预测精度要求,对城市短期用水量预测模型进行改进。本发明提供的城市短期用水量预测方法,对历史用水量进行预处理,尽可能保持原有的变化规律从而提高预测的精度;采用最小二乘支持向量机方法,解决了供水系统非线性、无法建立精确模型的问题;综合考虑气象数据和/或节假日因子,提高预测的精度。

    权利要求书

    权利要求书
    1.  一种基于最小二乘支持向量机模型的城市短期用水量预测方法,其特征在于,包括以下步骤:
    (1)获取原始数据,所述原始数据包括历史用水量序列;
    (2)对所述历史用水量序列进行预处理,以去除所述历史用水量序列中的异常数据;
    (3)对预处理后的历史用水量序列进行相关性分析;
    (4)采用最小二乘支持向量机方法,建立所述城市短期用水量预测模型,选取相关系数大于设定值的一组历史用水量的时间序列组合作为训练样本集,对城市短期用水量预测模型进行训练;
    (5)采用所述城市短期用水量预测模型进行实时预测;
    (6)计算预测误差,如果所述预测误差不满足预测精度要求,对所述城市短期用水量预测模型进行改进。

    2.  如权利要求1所述的基于最小二乘支持向量机模型的城市短期用水量预测方法,其特征在于,步骤(1)获取原始数据包括以下步骤:
    (11)获取一个城市供水管网中的一个支线在一个时间段内的历史用水量序列;
    (12)获取所述时间段内每日的气象数据,包括最高气温和最低气温,计算所述最高气温与所述最低气温的平均值作为日平均气温;
    (13)从日历中判断所述时间段内每日是否为节假日,获得节假日因子。

    3.  如权利要求1所述的基于最小二乘支持向量机模型的城市短期用水量预测方法,其特征在于,步骤(2)对所述历史用水量序列进行预处理包括以下步骤:
    (21)异常数据包括突变跳点数据,对所述历史用水量序列中的突变跳点数据进行处理。

    4.  如权利要求3所述的基于最小二乘支持向量机模型的城市短期用水量预测方法,其特征在于,步骤(21)对所述历史用水量序列中的突变跳点数据进行处理包括以下步骤:
    (211)采用流量阈值约束处理所述突变跳点数据;
    (212)采用相邻值变化率阈值约束处理所述突变跳点数据。

    5.  如权利要求3所述的基于最小二乘支持向量机模型的城市短期用水量预测方法,其特征在于,步骤(2)对所述历史用水量序列进行预处理还包括以下步骤:
    (22)异常数据包括缺失数据,对所述历史用水量序列中的缺失数据进行处理。

    6.  如权利要求3所述的基于最小二乘支持向量机模型的城市短期用水量预测方法,其特征在于,步骤(22)对所述历史用水量序列中的缺失数据进行处理包括以下步骤:
    (221)数据缺失率小于设定值10%,采用统计方法中的前后相邻填充方法进行缺失数据填补;
    (222)数据缺失率大于或等于设定值10%,采用关联规则算法的类均值填补算法进行缺失数据填补,选取相关性最大的三个属性作为标准数据对缺失属性进行分组,然后用各组的均值去填补相应的缺失数据。

    7.  如权利要求1所述的基于最小二乘支持向量机模型的城市短期用水量预测方法,其特征在于,步骤(4)选取相关系数大于设定值的一组历史用水量,其中所述设定值为0.75,所述一组历史用水量包括预测时刻前1h、23h、24h、25h、48h、72h、96h、120h、144h以及168h的用水量,h为小时。

    8.  如权利要求1所述的基于最小二乘支持向量机模型的城市短期用水量预测方法,其特征在于,所述原始数据还包括气象数据和/或节假日因子,步骤(4)中作为训练样本集的时间序列组合还包括所述气象数据和/或所述节假日因子。

    9.  如权利要求1所述的基于最小二乘支持向量机模型的城市短期用水量预测方法,其特征在于,所述气象数据为日平均温度。

    10.  如权利要求1所述的基于最小二乘支持向量机模型的城市短期用水量预测方法,其特征在于,步骤(6)对所述城市短期用水量预测模型进行改进为选择最小二乘支持向量机中核参数σ和正规化参数γ,包括以下步骤:
    (61)采用精英策略kbest,只有较优的粒子会影响其他粒子的位置及速度,加快收敛速度;
    (62)采用自适应的惯性权重策略,按照粒子与最优粒子的差距自适应地改变位置及速度,提高搜索能力;
    (63)引入历史最优信息,结合了PSO的个体历史最优及群体历史最优提高算法的搜索能力。

    说明书

    说明书基于最小二乘支持向量机模型的城市短期用水量预测方法
    技术领域
    本发明涉及一种城市用水量预测方法,特别是涉及一种基于最小二乘支持向量机模型的城市短期用水量预测方法。
    背景技术
    随着城市化进程的加快,城市规模和人口数量不断增加,生产用水和居民生活用水的需求越来越大。根据水利部的统计资料,中国660个城市中约有2/3已面临水资源?;?,预计到2030年,全国将会消耗水资源7500亿立方米,约占可用水资源总量的90%。同时中国也面临着严重的水污染问题,中国地质调查局报告表示,全国90%的地下水资源受到污染,其中60%污染严重。如何有效的指导并做好水资源开发、城市用水规划以及城市供水系统的优化调度工作,已成为城市发展亟需解决的问题。城市用水量预测能够对未来一段时间的用水量进行分析,如今在水资源规划、用水管理以及对供水系统进行科学调度等方面发挥着越来越重要的指导作用。因此,研究城市用水量预测技术和方法是实现水资源可持续利用的重要工作。
    现阶段水量预测方法主要有时间序列、人工神经网络、回归分析、灰色模型、系统动力学等方法。时间序列预测方法基于历史水量数据预测未来用水量,存在较为明显的滞后性,且无法反映气象因素(温度、降水量等)的影响。当气象等因素的突然变化导致用水量波动较大时,无法及时跟踪水量变化,导致预测效果较差。而人工神经网络存在以下不足:1)有陷入局部极值的风险,导致训练误差较大;2)算法学习基于经验风险最小,使得算法的训练误差最小,因而建立的网络模型泛化能力不强;3)网络的结构设计(例如隐含层的层数和节点数的选择)依赖先验知识和经验。因此,在采用神经网络模型预测城市用水量时误差较大?;毓榉治龇ㄊ歉萦盟坑胗跋煲蛩丶涞墓叵刀杂δP?,通过分析影响因素的变化来对用水量的变化情况进行预测,这些影响因素与用水量之间存在稳定的变化关系,是较为宏观的影响,比如人口规模等。因此,该方法适用于长期预测。由于灰色模型对数据量的要求不高,系统动力学方法分析过程复杂、工作量大,主要用于预测城市长期用水量。
    本领域技术人员致力于提供一种城市短期用水量预测方法,能够需要满足以下几点基本要求:(1)模型建立过程方便、易行;(2)能够反映气象因素(温度、降水量等)和节假日对用水量的影响;(3)能够有效处理工程实际数据中数据缺失、数据异常等常见情况;(4)预测方法精度高、泛化能力好,满足工程应用的要求。而现有预测技术和方法尚未能有效地解决上述问题。
    发明内容
    针对上述预测方法中存在的不足,本发明的目的是提供一种基于最小二乘支持向量机模型的城市短期用水量预测方法,该方法简单易行,能同时反映用水量自身变化规律、气象因素(温度、降水量等)和节假日等对用水量的影响,预测误差满足城市供水规划、水资源开发利用、供水系统科学调度。
    支持向量机是一种小样本学习方法,实现了高效的从训练样本到预测样本的转导推理,算法简单,且具有较好的“鲁棒性”。
    最小二乘支持向量机是支持向量机的扩展,目前已被广泛地推广至预测领域。LS-SVM系统方法在解决小样本,高维模式识别等问题中有着独特的优势,具有较高的泛化性能其将模型的训练过程归结为线性方程组求解问题,大大提高了训练的速度,LS-SVM的正规化参数和核参数影响模型的预测精度和泛化能力,可以兼顾经验风险和置信范围,取得模型复杂性和学习能力之间的平衡。
    本发明提供一种基于最小二乘支持向量机模型的城市短期用水量预测方法,包括以下步骤:
    (1)获取原始数据,原始数据包括历史用水量序列;
    (2)对历史用水量序列进行预处理,以去除历史用水量序列中的异常数据;
    (3)对预处理后的历史用水量序列进行相关性分析;
    (4)采用最小二乘支持向量机方法,建立城市短期用水量预测模型,选取相关系数大于设定值的一组历史用水量的时间序列组合作为训练样本集,对城市短期用水量预测模型进行训练;
    (5)采用城市短期用水量预测模型进行实时预测;
    (6)计算预测误差,如果预测误差不满足预测精度要求,对城市短期用水量预测模型进行改进。
    进一步地,步骤(1)获取原始数据包括以下步骤:
    (11)获取一个城市供水管网中的一个支线在一个时间段内的历史用水量序列;
    (12)获取时间段内每日的气象数据,包括最高气温和最低气温,计算最高气温与最低气温的平均值作为日平均气温;
    (13)从日历中判断时间段内每日是否为节假日,获得节假日因子。
    进一步地,步骤(2)对历史用水量序列进行预处理包括以下步骤:
    (21)异常数据包括突变跳点数据,对历史用水量序列中的突变跳点数据进行处理。
    进一步地,步骤(21)对历史用水量序列中的突变跳点数据进行处理包括以下步骤:
    (211)采用流量阈值约束处理突变跳点数据;
    (212)采用相邻值变化率阈值约束处理突变跳点数据。
    进一步地,步骤(2)对历史用水量序列进行预处理还包括以下步骤:
    (22)异常数据包括缺失数据,对历史用水量序列中的缺失数据进行处理。
    进一步地,步骤(22)对历史用水量序列中的缺失数据进行处理包括以下步骤:
    (221)数据缺失率小于设定值,采用统计方法中的前后相邻填充方法进行缺失数据填补;
    (222)数据缺失率大于或等于设定值,采用关联规则算法的类均值填补算法进行缺失数据填补,选取相关性最大的三个属性作为标准数据对缺失属性进行分组,然后用各组的均值去填补相应的缺失数据。
    进一步地,步骤(4)选取相关系数大于设定值的一组历史用水量,其中设定值为0.75,一组历史用水量包括预测时刻前1h、23h、24h、25h、48h、72h、96h、120h、144h以及168h的用水量,h为小时。
    进一步地,原始数据还包括气象数据和/或节假日因子,步骤(4)中作为训练样本集的时间序列组合还包括气象数据和/或节假日因子。
    作为训练样本集的时间序列组合还包括气象数据和/或节假日因子,能够综合反映气象和/或节假日等因素对用水量的影响,从而提高城市短期用水量预测的精度。
    进一步地,气象数据为日平均温度。
    进一步地,步骤(6)对城市短期用水量预测模型进行改进为选择最小二乘支持向量机中核参数σ和正规化参数γ,包括以下步骤:
    (61)采用精英策略kbest,只有较优的粒子会影响其他粒子的位置及速度,加快收敛速度;
    (62)采用自适应的惯性权重策略,按照粒子与最优粒子的差距自适应地改变位置及速度,提高搜索能力;
    (63)引入历史最优信息,结合了PSO的个体历史最优及群体历史最优提高算法的搜索能力。
    与现有技术相比,本发明提供的基于最小二乘支持向量机模型的城市短期用水量预测方法,具有以下有益效果:
    (1)对历史用水量数据进行了充分的预处理(包括修正和填补处理),尽可能使得用水量序列保持原有的变化规律;
    (2)城市用水系统是一个多变量非线性的动态系统且无法建立精确模型。最小二乘支持向量机方法对系统采取黑箱模拟的方式,能够实现对任意非线性函数的逼近,很好地解决了供水系统非线性、无法建立精确模型等问题;且该方法建立在统计学习理论的VC维理论和结构风险最小原理上,能够兼顾经验风险和置信范围,取得模型复杂性和学习能力之间的平衡,具有更好的泛化能力;
    (3)采用最小二乘支持向量机模型,输入变量包括历史用水量以及气象数据和/ 或节假日因子,能够综合反映用水量自身变化规律的作用以及气象和/或节假日等因素对用水量的影响,从而提高城市短期用水量预测的精度。
    附图说明
    图1是本发明的一个实施例的基于最小二乘支持向量机模型的城市短期用水量预测方法的框图;
    图2是本发明针对高数据缺失率提出的类均值填补算法流程图;
    图3是本发明预测模型的数据样本流量趋势图;
    图4是本发明采用类均值填补算法进行缺失数据填补的效果图;
    图5是本发明城市短期水量预测模型的预测效果图。
    具体实施方式
    以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果,但本发明的?;げ唤鱿抻诖?。
    本发明的一个实施例的基于最小二乘支持向量机模型的城市短期用水量预测方法,包括以下步骤:
    (1)获取原始数据,原始数据包括历史用水量序列;
    (2)对历史用水量序列进行预处理,以去除历史用水量序列中的异常数据;
    (3)对预处理后的历史用水量序列进行相关性分析;
    (4)采用最小二乘支持向量机方法,建立城市短期用水量预测模型,选取相关系数大于设定值的一组历史用水量的时间序列组合作为训练样本集,对城市短期用水量预测模型进行训练;
    (5)采用城市短期用水量预测模型进行实时预测;
    (6)计算预测误差,如果预测误差不满足预测精度要求,对城市短期用水量预测模型进行改进。
    步骤(1)获取原始数据包括以下步骤:
    (11)获取一个城市供水管网中的一个支线在一个时间段内的历史用水量序列;
    (12)获取时间段内每日的气象数据,包括最高气温和最低气温,计算最高气温与最低气温的平均值作为日平均气温;
    (13)从日历中判断时间段内每日是否为节假日,获得节假日因子。
    步骤(2)对历史用水量序列进行预处理包括以下步骤:
    (21)异常数据包括突变跳点数据,对历史用水量序列中的突变跳点数据进行处理。
    突变跳点数据是指:某时刻或时间段的用水量与前后相邻时刻或时间段用水量的偏差值超过一定阈值,则认为该时刻或时间段用水量为异常数据。
    本实施例中,设定前后数据的偏差阈值θ为平均用水量的10%,若超过这一阈值,则采取数据修正或数据填补操作。
    所述的数据修正是指:当任一时刻K的用水量数据存在异?;蛉笔?,判断K+1和K-1两个时刻的用水量数据是否存在异?;蛉笔?,若不存在异?;蛉笔?,则求取K+1和K-1两个时刻用水量的平均值后作为K时刻的用水量数据;若存在异?;蛉笔?,则进行数据填补处理。
    所述的数据填补是指:当数据缺失率低时,采用统计方法中的前后相邻填充方法进行缺失值填补,即分段线性插值来估计缺失数据;当数据缺失率高时,采用基于关联规则的类均值填补算法。
    步骤(21)对历史用水量序列中的突变跳点数据进行处理包括以下步骤:
    (211)采用流量阈值约束处理突变跳点数据;
    (212)采用相邻值变化率阈值约束处理突变跳点数据。
    步骤(2)对历史用水量序列进行预处理还包括以下步骤:
    (22)异常数据包括缺失数据,对历史用水量序列中的缺失数据进行处理。
    步骤(22)对历史用水量序列中的缺失数据进行处理包括以下步骤:
    (221)数据缺失率小于设定值,采用统计方法中的前后相邻填充方法进行缺失数据填补;
    (222)数据缺失率大于或等于设定值,采用关联规则算法的类均值填补算法进行缺失数据填补,选取相关性最大的三个属性作为标准数据对缺失属性进行分组。然后用各组的均值去填补相应的缺失数据。
    步骤(4)选取相关系数大于设定值的一组历史用水量,其中设定值为0.75,一组历史用水量包括预测时刻前1h、23h、24h、25h、48h、72h、96h、120h、144h以及168h的用水量,h为小时。
    步骤(6)对城市短期用水量预测模型进行改进为选择最小二乘支持向量机中核参数σ和正规化参数γ,包括以下步骤:
    (61)采用精英策略kbest,只有较优的粒子会影响其他粒子的位置及速度,加快收敛速度;
    (62)采用自适应的惯性权重策略,按照粒子与最优粒子的差距自适应地改变位置及速度,提高搜索能力;
    (63)引入历史最优信息,结合了PSO的个体历史最优及群体历史最优提高算法的搜索能力。
    本发明的另一个实施例的基于最小二乘支持向量机模型的城市短期用水量预测方法,原始数据还包括气象数据和/或节假日因子,步骤(4)中作为训练样本集的时间序列组合还包括气象数据和/或节假日因子。
    气象数据为日平均温度。
    可以选取温度作为气象数据对用水量预测的影响,计算出日最高温度与用水量的相关性为0.75,日最低温度与用水量的相关性为0.71,日平均温度与用水量的相关性为0.85,因此选取日平均温度作为预测模型的输入。
    本实施例的基于最小二乘支持向量机模型的城市短期用水量预测方法,包括如下步骤:
    a)分别通过供水公司数据采集与监视控制系统和天气预测网站获取历史用水量数据和气象数据;
    b)针对历史用水量序列中的异常和缺失数据进行预处理,包括数据修正和数据填补;
    c)根据修正或填补处理后的历史用水量数据,分析各因素和用水量之间的关联性;
    d)采用最小二乘支持向量机方法,建立城市短期用水量预测模型,选取预测时刻前固定长度的历史用水量、气象数据和节假日因子时间序列组合作为训练样本集,对预测模型进行训练,且在进行下一时刻预测前实时更新训练样本,即添加上一时刻的实际用水量和气象数据并去除最原始的数据;
    e)对最小二乘支持向量机模型得出的用水量预测值,进行误差检验并将模型应用于未来用水量的预测。采用未经训练的一定时间段的用水量和气象数据时序样本组合(即测试样本集)带入模型预测输出,并与实际用水量数据进行比较,判断模型的预测误差是否满足预测精度要求。若不满足要求,则对预测模型进行改进。在此基础上,将预测模型应用于未来用水量的实时滚动预测。
    以下更具体地描述本发明的基于最小二乘支持向量机模型的城市短期用水量预测方法。
    如图1所示,基于最小二乘支持向量机模型的城市短期用水量预测方法,具体步骤如下:
    步骤一、原始数据获取
    选取某特大城市供水管网某支线2013年6月1日~2014年5月31日的用水量实测数据作为样本数据库。供水数据采集系统SCADA每隔10分钟记录一次瞬时流量,因此分析样本共有52560条数据。
    从气象部门查询对应时间内每日的最高气温和最低气温,取其平均值作为日平均气温。
    查询日历,确定对应时间内每日是否为节假日。
    步骤二、用水量数据的预处理
    按照供水管网实际运营,判断流量数据是否为异常点。由于支线的瞬时流量数据 是10分钟级,因此得到的流量序列理应是一个缓慢变化过程,不会产生突变、跳跃的数据点。而详细分析原始数据可以发现,部分数据点与其相邻数据的变化幅度很大,此种数据点我们也将其归类为异常数据。综上所述,我们可将异常点分为突变跳点数据及缺失数据两大类。
    突变跳点:本文的样本实测流量数据频率为十分钟级,相邻流量之间的变化应是平缓的,但分析数据发现,样本数据具有严重的毛刺现象。本文采取两种规则来对突变跳点数据进行处理:1、流量阈值约束;2、相邻值变化率阈值约束。流量阈值约束是按照供水管网某支线实际运营情况给流量设置一个合理的上下限,保证流量在下限值Qmin和上限值Qmax之间。处理规则为:
    Qt=Qmax,ifQt>QmaxQt=Qmin,ifQt<Qmin---(1)]]>
    相邻变化率阈值约束是将流量Qt与前后时刻的流量Qt-1,Qt+1进行比较,若当前时刻的流量值与前后两个时刻的流量相对误差绝对值超过10%,则将Qt设为异常数据。处理规则为:

    通过统计可知,采用流量阈值约束及相邻值变化率阈值约束对突变跳点数据进行处理后,可保持单点相对误差绝对值在3%以内。
    缺失数据清理:针对缺失数据有两种常用的方法,一种是忽略不完整数据,另外一种是基于填充技术的填补算法。本文采用基于填充技术的缺失值清洗算法。与针对数据缺失率低及数据缺失率高两种类型,采用不同的处理策略:
    (1)数据缺失率低:采用统计方法中的前后相邻(Before And After,BA)填充方法进行缺失值填补,能够达到较好的效果。由于线性函数能够近似短时间内的流量变化曲线,所以本文采用分段线性插值来估计缺失数据。假设t时刻的流量缺失,找到距离t时刻最近的前后tA和tB时刻(tA<t<tB),设这两个时刻的流量分别为QtA和QtB,则缺失数据Qt的计算公式为:
    Qt=QtA+QtB-QtAtB-tA(t-tA)---(3)]]>
    经验证统计,采用线性插值的对单点缺失数据进行填补,可保证填补相对误差绝对值在3%以内。
    (2)缺失数据率高:若由于掉电,网络中断,检修等原因造成长时间缺失数据,此时采用线性插值的清洗方法会影响缺失数据与其他数据之间的相关性,而且过多的 中值会造成尖峰态分布,打破原始流量数据的规律,在此基础上的模型预测精度肯定不高。采用关联规则算法的类均值填补算法(Class-Mean,CM)有效地避免了流量数据对时间相关性的依赖。因此当数据缺失率较高时,采用CM算法填补准确率远远超过了BA算法。
    CM算法的首要任务是进行属性的相关性分析,得出与缺省属性关联性较高的属性。通过分析可知,t时刻的流量Qt与Qt-1,Qt-23,Qt-24,Qt-25,…,Qt-168,Tmean,H有关,为了便于简化计算,选取相关性最大的Qt-1,Qt-24,Qt-48三个属性作为标准数据对缺失属性进行分组。然后用各组的均值去填补相应的缺失值。CM填补算法相应的流程如图2所示。
    针对CM填补算法中的缺失属性分组,本文采用k-means聚类方法对总体进行分类。k-means聚类的流程为:
    为待聚类的数据点寻找聚类中心;
    计算每个数据点到聚类中心的距离,将这个点聚类到离该点最近的类中;
    计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心;
    反复执行ii和iii,直到聚类中心不再进行大范围移动或者聚类次数达到要求为止。
    采用上述缺省值填补方法对某段时间内14个瞬时流量值的用水量实测数据进行数据预处理,处理的结果如图4所示。
    步骤三:因素相关性分析和输入变量选择
    气象因素分析:城市短期用水量通?;崾艿狡?温度、降水量等)的影响,这些影响不能规律性地表现在历史数据序列中。本实施例中选取温度作为气象对时用水量预测的影响。分析出最高温度与流量的相关性为0.75,最低温度与流量的相关性为0.71,日平均温度与流量的相关性为0.85,因此选取日平均温度作为模型的输入。
    节假日分析:在节假日(元旦、春节、五一、国庆)期间,时用水量比平时工作日明显降低。长假使得居民用水占的比例增大,居民用水量有所增加,但由于节假日工业用水减少,使得总用水量反而有所下降。因此需将节假日影响因素纳入预测模型的输入变量。设定节假日因素为布尔变量H,当预测时刻处于工作日期间,设定H=1;当预测时刻处于节假日期间,设定H=0。
    历史用水量分析:每天的流量表现出了很强的相关性。因此可采用自相关系数来定量衡量预测时刻前期流量数据对预测时刻的影响程度。时用水量序列Q(t)(t=1,2,…,N)的自相关系数计算公式为:
    rk=Σt=1N-k(Qt-Q&OverBar;)(Qt+k-Q&OverBar;)Σt=1N(Qt-Q&OverBar;)2---(4)]]>
    式中,rk表示t时刻的用水量Qt与(t+k)时刻的用水量Qt+k之间的相关程度。设定当|rk|∈(0.75,1)时属于高度相关;当|rk|∈(0.5,0.75)属于中度相关。
    对某特大型城市供水管网某支线一段时间内8760个时用水量作自相关性分析,计算r=1~264的rk。以24小时为周期,周期内的自相关系数先逐渐减小,再逐渐增大。同一周期内当k为24的整数倍时,|rk|达到周期内的最大值。随着周期数的增加,周期内的最大|rk|逐渐减小。选取预测时刻之前|rk|大于0.75的历史流量作为模型的输入。通过计算,得到r1=0.8753,r23=0.7682,r24=0.8211,r25=0.7665,r48=0.7985,r72=0.7838,r96=0.7767,r120=0.7718,r144=0.7645,r168=0.7605。其中当k=24×n,24×n-1,24×n+1,n=1,2,…10时,随着k值的增大,|rk|逐渐减小。因此本实施例将预测时刻前1h、23h、24h、25h、48h、72h、96h、120h、144h、168h的时用水量纳入模型的输入变量中。
    综上所述,若预测某日t时刻的用水量,则需选取1)预测时刻前1h、23h、24h、25h、48h、72h、96h、120h、144h、168h的时用水量(m3/h);2)预测日平均温度Tmean(℃);3)节假日因素H。将以上变量作为时用水量预测模型的输入,预测当天t时刻的时用水量。时用水量预测模型如下:
    Qt=f(Qt-1,Qt-23,Qt-24,Qt-25,...,Qt-168,Tmean,H)   ⑸
    步骤四:基于最小二乘支持向量机建立预测模型
    基于机器学习的LS-SVM算法计算简单,且具有良好的收敛精度及泛化能力,广泛用于模式识别、故障诊断、灰污监测等领域,并取得了良好的应用效果。原始数据经过数据清洗,保证了建模数据的一致性,恢复数据有用信息;经过特征提取选取影响用水量的主要因素,作为模型的输入变量,保证模型预测精度几乎不受训练样本的影响;模型输入矩阵的归一化处理消除了不同量纲对预测模型精度的影响?;谥秩旱囊λ阉魉惴ㄒ丫弑附虾玫挠呕阅?,表现出较强的全局搜索能力,针对其容易陷入局部解及收敛速度较慢的问题对算法进行了三方面的改进,使算法的综合性能最佳。因此本实施例采用LS-SVM建立城市时用水量的预测模型,并采用AGSA对LS-SVM模型的参数进行优化,以提高参数优化速度和预测精度。
    采用改进AGSA算法优化LS-SVM小时级水量预测模型的核参数和正规化参数的具体步骤如下:
    初始化基于AGSA的LS-SVM模型的参数,包括粒子个数,初始位置,初始速度等。
    将正规化参数和核参数种群用于LS-SVM水量预测模型,得到训练样本点的预测值,通过训练样本的预测值与实际值,计算参数种群粒子适应度。
    终止条件判断。若满足以下条件之一,则结束AGSA寻优过程,得到最优解;否则 转至步骤4,继续下一次寻优迭代。算法终止条件为:
    (1)、寻优过程达到最大迭代次数;
    (2)、训练样本预测精度达到误差设定值。
    确定个体的最优位置和群体最优位置。如果粒子当前适应度值小于其最优适应度值,则用当前值替代个体最优值,否则个体最优值保持不变;对比群体最优适应度值与当前种群各粒子的个体最优适应度值,若存在个体最优适应度值优于群体最优适应度值,则进行替换。根据循环次数更新G(t);根据粒子适应度,计算粒子的质量。
    根据式
    αid(t)=Σj&Element;kbest,j&NotEqual;irandjG(t)Mj(t)Mi(t)Rij(t)(xjd(t)-xid(t))---(6)]]>
    更新粒子的加速度;
    根据式
    vid(t+1)=(1-Mi(t)Mbest(t))*vid(t)+c1*l1*(Xpbesttid-xid(t))+c2*l2*(Xgbesttid-xid(t))+αid(t)---(7)]]>
    更新粒子速度;
    根据式
    αid(t)=Σj&Element;L,j&NotEqual;irandjG(t)Mj(t)Rij(t)(xjd(t)-xid(t))d=1,2,...,D;i=1,2,...,Lvid(t+1)=randit*vid(t)+αid(t)Δtxid(t+1)=xid(t)+vid(t+1)Δt---(8)]]>
    更新粒子位置;
    转至iii开始下一次迭代。
    算法搜索结束,将搜索到的xgbest作为LS-SVM水量预测模型的参数,进行未来24小时的水量预测。
    步骤五:城市用水量小时级预测模型
    利用上述算法,利用的数据样本训练得到水量预测模型,将历史水量、气温和节假日因子作为模型输入,得到一段时间内模型的预测输出结果如图5所示。
    以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理和有限的实验可以得到的技术方案,皆应在由权利要求书所确定的?;し段?。

    关 键 词:
    基于 最小 支持 向量 模型 城市 短期 用水量 预测 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:基于最小二乘支持向量机模型的城市短期用水量预测方法.pdf
    链接地址://www.4mum.com.cn/p-5890633.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03