• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 19
    • 下载费用:30 金币  

    重庆时时彩计划下载手机版: 一种基于大数据的高精度曲面建模方法.pdf

    关 键 词:
    一种 基于 数据 高精度 曲面 建模 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201710013712.0

    申请日:

    2017.01.09

    公开号:

    CN106683185A

    公开日:

    2017.05.17

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G06T 17/20申请日:20170109|||公开
    IPC分类号: G06T17/20; G06T17/30; G06T17/05(2011.01)I 主分类号: G06T17/20
    申请人: 中国科学院地理科学与资源研究所
    发明人: 赵娜; 岳天祥
    地址: 100101 北京市朝阳区大屯路甲11号中国科学院地理科学与资源研究所
    优先权:
    专利代理机构: 北京远创理想知识产权代理事务所(普通合伙) 11513 代理人: 卫安乐
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201710013712.0

    授权公告号:

    |||

    法律状态公告日:

    2017.06.09|||2017.05.17

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本发明涉及一种基于大数据的高精度曲面建模方法,包括:创建各采样点的地理坐标信息和待测变量采样值;将待测区域空间离散化为网格点形式,建立采样方程;将曲面的偏微分方程组进行高阶差分离散,获得对应的代数系统,将代数系统与采样方程组合成等式约束最小二乘问题,然后转化为求解截断目标函数极小值问题,再转化为求解对称不定方程组;随机选取迭代初值;将系数矩阵进行行分块,对分解后的块矩阵进行存储;采用块行投影迭代法,求解HASM方程组,判断求解结果是否收敛;判断解是否满足高斯科达齐方程组;输出高精度模拟曲面模型。本发明可求解大规模问题,所需存储空间小,在保证精度的情况下,解决了HASM在求解大规模问题中的缺陷。

    权利要求书

    1.一种基于大数据的高精度曲面建模方法,包括以下步骤:
    步骤1:创建各采样点的地理坐标信息和待测变量采样值,所述地理坐标信息中包括采
    样点的经度信息和采样点的纬度信息;
    步骤2:将待测区域空间离散化为网格点形式,得到网格点离散值,根据地理坐标信息
    和待测变量采样值建立采样方程,所述采样方程用于判断采样点是否在网格点上,其中,如
    果采样点在所述网格点上,则该网格点的值即为待测变量采样值;如果采样点在网格内,则
    将距该采样点最近的网格点上利用泰勒展开得到该网格点上的近似采样值;
    步骤3:根据网格点离散值计算待测区域每个网格点的第一类基本量E、F、G和第二类基
    本量L、M、N,其中所述第一基本量用于表示模拟曲面上曲线的长度、模拟曲面的面积和模拟
    曲面上曲线的曲率,所述第二基本量用于表示模拟曲面的局部弯曲变化程度,将用第一基
    本量和第二基本量表示的曲面的偏微分方程组进行高阶差分离散,获得离散方程组对应的
    代数系统,将所述代数系统与所述采样方程组合成等式约束最小二乘问题;
    步骤4:将等式约束最小二乘为题转化为求解截断目标函数极小值问题;
    步骤5:把求解截断目标函数极小值问题转化为求解对称不定方程组,所述对称不定方
    程组为高精度曲面建模HASM方程组;
    步骤6:随机选取HASM方程组的迭代初值;
    步骤7:将HASM方程组中的系数矩阵进行行分块,并对系数矩阵分解后的块矩阵进行存
    储;
    步骤8:对迭代初值采用块行投影迭代法,求解HASM方程组,并判断求解结果是否收敛;
    步骤9:当求解结果不收敛时,对求解结果重新采用块行投影迭代法,求解HASM方程组,
    并判断求解结果是否收敛,如果收敛,执行步骤10,否则,重新执行步骤9;
    步骤10:当HASM方程组的解收敛时,进一步判断HASM方程组的解是否满足高斯科达齐
    方程组,若不满足,则执行步骤6;若满足,则根据HASM方程组的解输出关于待测变量的高精
    度模拟曲面模型。
    2.根据权利要求1所述的方法,其特征在于,所述曲面的偏微分方程组为:
    <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <msub> <mi>f</mi> <mrow> <mi>x</mi> <mi>x</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>&Gamma;</mi> <mn>11</mn> <mn>1</mn> </msubsup> <msub> <mi>f</mi> <mi>x</mi> </msub> <mo>+</mo> <msubsup> <mi>&Gamma;</mi> <mn>11</mn> <mn>2</mn> </msubsup> <msub> <mi>f</mi> <mi>y</mi> </msub> <mo>+</mo> <mfrac> <mi>L</mi> <msqrt> <mrow> <mi>E</mi> <mo>+</mo> <mi>G</mi> <mo>-</mo> <mn>1</mn> </mrow> </msqrt> </mfrac> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>f</mi> <mrow> <mi>y</mi> <mi>y</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>T</mi> <mn>22</mn> <mn>1</mn> </msubsup> <msub> <mi>f</mi> <mi>x</mi> </msub> <mo>+</mo> <msubsup> <mi>&Gamma;</mi> <mn>22</mn> <mn>2</mn> </msubsup> <msub> <mi>f</mi> <mi>y</mi> </msub> <mo>+</mo> <mfrac> <mi>N</mi> <msqrt> <mrow> <mi>E</mi> <mo>+</mo> <mi>G</mi> <mo>-</mo> <mn>1</mn> </mrow> </msqrt> </mfrac> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>f</mi> <mrow> <mi>x</mi> <mi>y</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>&Gamma;</mi> <mn>12</mn> <mn>1</mn> </msubsup> <msub> <mi>f</mi> <mi>x</mi> </msub> <mo>+</mo> <msubsup> <mi>&Gamma;</mi> <mn>12</mn> <mn>2</mn> </msubsup> <msub> <mi>f</mi> <mi>y</mi> </msub> <mo>+</mo> <mfrac> <mi>M</mi> <msqrt> <mrow> <mi>E</mi> <mo>+</mo> <mi>G</mi> <mo>-</mo> <mn>1</mn> </mrow> </msqrt> </mfrac> </mrow> </mtd> </mtr> </mtable> </mfenced>
    其中,F=fx·fy,
    <mrow> <mi>L</mi> <mo>=</mo> <mfrac> <msub> <mi>f</mi> <mrow> <mi>x</mi> <mi>x</mi> </mrow> </msub> <msqrt> <mrow> <mn>1</mn> <mo>+</mo> <msubsup> <mi>f</mi> <mi>x</mi> <mn>2</mn> </msubsup> <mo>+</mo> <msubsup> <mi>f</mi> <mi>y</mi> <mn>2</mn> </msubsup> </mrow> </msqrt> </mfrac> <mo>,</mo> <mi>M</mi> <mo>=</mo> <mfrac> <msub> <mi>f</mi> <mrow> <mi>x</mi> <mi>y</mi> </mrow> </msub> <msqrt> <mrow> <mn>1</mn> <mo>+</mo> <msubsup> <mi>f</mi> <mi>x</mi> <mn>2</mn> </msubsup> <mo>+</mo> <msubsup> <mi>f</mi> <mi>y</mi> <mn>2</mn> </msubsup> </mrow> </msqrt> </mfrac> <mo>,</mo> <mi>N</mi> <mo>=</mo> <mfrac> <msub> <mi>f</mi> <mrow> <mi>y</mi> <mi>y</mi> </mrow> </msub> <msqrt> <mrow> <mn>1</mn> <mo>+</mo> <msubsup> <mi>f</mi> <mi>x</mi> <mn>2</mn> </msubsup> <mo>+</mo> <msubsup> <mi>f</mi> <mi>y</mi> <mn>2</mn> </msubsup> </mrow> </msqrt> </mfrac> <mo>,</mo> </mrow>
    <mrow> <msubsup> <mi>&Gamma;</mi> <mn>11</mn> <mn>1</mn> </msubsup> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mrow> <mo>(</mo> <msub> <mi>GE</mi> <mi>x</mi> </msub> <mo>-</mo> <mn>2</mn> <msub> <mi>FF</mi> <mi>x</mi> </msub> <mo>+</mo> <msub> <mi>FE</mi> <mi>y</mi> </msub> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <mi>E</mi> <mi>G</mi> <mo>-</mo> <msup> <mi>F</mi> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <msubsup> <mi>&Gamma;</mi> <mn>11</mn> <mn>2</mn> </msubsup> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mrow> <mo>(</mo> <mn>2</mn> <msub> <mi>EF</mi> <mi>x</mi> </msub> <mo>-</mo> <msub> <mi>EE</mi> <mi>y</mi> </msub> <mo>-</mo> <msub> <mi>FE</mi> <mi>x</mi> </msub> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <mi>E</mi> <mi>G</mi> <mo>-</mo> <msup> <mi>F</mi> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> </mrow>
    <mrow> <msubsup> <mi>&Gamma;</mi> <mn>22</mn> <mn>1</mn> </msubsup> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mrow> <mo>(</mo> <mn>2</mn> <msub> <mi>GF</mi> <mi>y</mi> </msub> <mo>-</mo> <msub> <mi>GG</mi> <mi>x</mi> </msub> <mo>-</mo> <msub> <mi>FG</mi> <mi>y</mi> </msub> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <mi>E</mi> <mi>G</mi> <mo>-</mo> <msup> <mi>F</mi> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <msubsup> <mi>&Gamma;</mi> <mn>22</mn> <mn>2</mn> </msubsup> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mrow> <mo>(</mo> <msub> <mi>EG</mi> <mi>y</mi> </msub> <mo>-</mo> <mn>2</mn> <msub> <mi>FF</mi> <mi>y</mi> </msub> <mo>+</mo> <msub> <mi>FG</mi> <mi>x</mi> </msub> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <mi>E</mi> <mi>G</mi> <mo>-</mo> <msup> <mi>F</mi> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> </mrow>
    <mrow> <msubsup> <mi>&Gamma;</mi> <mn>12</mn> <mn>1</mn> </msubsup> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mrow> <mo>(</mo> <msub> <mi>GE</mi> <mi>y</mi> </msub> <mo>-</mo> <msub> <mi>FG</mi> <mi>x</mi> </msub> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <mi>E</mi> <mi>G</mi> <mo>-</mo> <msup> <mi>F</mi> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <msubsup> <mi>&Gamma;</mi> <mn>12</mn> <mn>2</mn> </msubsup> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mrow> <mo>(</mo> <msub> <mi>EG</mi> <mi>x</mi> </msub> <mo>-</mo> <msub> <mi>FE</mi> <mi>y</mi> </msub> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <mi>E</mi> <mi>G</mi> <mo>-</mo> <msup> <mi>F</mi> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> </mrow>
    x为空间离散化的网格点的横坐标,y为空间离散化的网格点的纵坐标,fx为函数f对x的
    一阶偏导数,fxx为函数f对x的二阶偏导数,fy为函数f对y的一阶偏导数,fyy为函数f对y的二
    阶偏导数Ex、Fx、Gx分别为E、F、G对x的一阶偏导数,Ey、Fy、Gy分别为E、F、G对y的一阶偏导数,
    为第二类克里斯托弗尔符号。
    3.根据权利要求2所述的方法,其特征在于,所述步骤3具体包括:
    步骤3.1:根据第一类基本量E、F、G和第二类基本量L、M、N的有限差分逼近计算待测区
    域每个网格点的第一类基本量和第二类基本量的值;
    步骤3.2:结合第一类基本量的有限差分逼近、第二类基本量的有限差分逼近和第二类
    克里斯托弗尔符号的有限差分得到离散方程组;
    步骤3.3:将所述离散方程组转换成矩阵形式的代数系统;
    步骤3.4:将所述代数系统与采样方程组合成等式约束最小二乘问题。
    4.根据权利要求3所述的方法,其特征在于,所述步骤7中将HASM方程组中的系数矩阵
    进行行分块的具体方法为:设系数矩阵A的每个子块Ai最多有u行,且Ai∈Ru×n,u<<n均为
    满秩,即每块的行是独立的,假设正在生成一个子块Ai,该子块已包含矩阵A中的j行(j<
    u),且已知AiT的QR分解为AiT=QjRj,块AiT的行相关性的估计其中
    rhh为位于Rj的(h,h)位置的元素,a1为矩阵A中的一行,令
    根据AiT的QR分解,采用QR分解更新方法来得到的QR分解,然后计算的行
    相关性估计,如果该估计仍小于κ,则a1加入块Ai,其中,κ为预先设定的一个正数。
    5.根据权利要求4所述的方法,其特征在于,所述QR分解采用FrancisQR分解策略。
    6.根据权利要求4或5所述的方法,其特征在于,所述步骤7中对系数矩阵分解后的块矩
    阵进行存储的方式为行压缩存储方式CSR。
    7.根据权利要求6所述的方法,其特征在于,所述步骤8和步骤9具体包括:假设当前迭
    代点为,判断xk是否收敛,若不收敛,则找出离xk直交距离最远的块,选取xk在所述块上的投
    影作为下一个迭代点。

    说明书

    一种基于大数据的高精度曲面建模方法

    技术领域

    本发明涉及涉及一种针对大规模问题的空间曲面建模的方法,可用于大数据背景
    下数字高程模型的生成、气象、生物量、土壤的空间分布模拟等领域,也可以视为曲面栅格
    逼近的一种方法,可用于大规模的物理、化学、医学等方面的曲面造型。

    背景技术

    为了解决了半个世纪以来困扰曲面建模的误差问题和多尺度问题,我们以微分几
    何原理和优化控制论为理论基础,建立了一个以全局性近似数据(包括遥感数据和全球模
    型粗分辨率模拟数据)为驱动场、以局地高精度数据(包括监测网数据和调查采样数据)为
    优化控制条件的高精度曲面建模(High Accuracy Surface Modelling,简写为HASM)方法,
    并在20多年大量应用研究基础上,提炼形成了地球表层建?;径?。

    HASM最后可转化为一个由地面采样约束的等式约束最小二乘问题(Equality
    constraint least squares problem:LSE),目的是为了在保证采样点处模拟值等于采样
    值的条件下,保持整体模拟误差最小。充分利用采样信息,也是保证迭代趋近于最佳模拟效
    果的有效手段。尽管HASM方法比传统的插值方法在模拟精度上有了很大的改善,但研究表
    明,当前HASM只能处理小规模的问题,上述求解过程是将LSE问题转化为法方程组求解。一
    方面,转化后的方程组系数矩阵条件数非常大,造成了问题的敏感性及病态性,这使得求解
    方程组的迭代方法收敛速度非常慢,或者不收敛,并由此造成会得不到原求解问题的近似
    解;另一方面,当前采用的预处理共轭梯度法求解HASM方程组需要将方程组系数矩阵全部
    的一次性输入内存,随着求解问题规模的增加,其存储空间会明显增长,对于大规模问题当
    前求解策略已不再使用。当前HASM对于全国1km分辨率数据的模拟,往往采用分片处理策
    略,这增加了分区边界处的误差,从而降低了模拟结果的整体精度。

    发明内容

    本发明针对现有的HASM模型在求解大规模问题中的缺陷,提供了一种改进的
    HASM,所需存储空间小,能够在保证精度的情况下,解决了大规模问题。

    本发明解决上述技术问题的技术方案如下:一种基于大数据的高精度曲面建模方
    法,包括以下步骤:

    步骤1:创建各采样点的地理坐标信息和待测变量采样值,所述地理坐标信息中包
    括采样点的经度信息和采样点的纬度信息;

    步骤2:将待测区域空间离散化为网格点形式,得到网格点离散值,根据地理坐标
    信息和待测变量采样值建立采样方程,所述采样方程用于判断采样点是否在网格点上,其
    中,如果采样点在所述网格点上,则该网格点的值即为待测变量采样值;如果采样点在网格
    内,则将距该采样点最近的网格点上利用泰勒展开得到该网格点上的近似采样值;

    步骤3:根据网格点离散值计算待测区域每个网格点的第一类基本量E、F、G和第二
    类基本量L、M、N,其中所述第一基本量用于表示模拟曲面上曲线的长度、模拟曲面的面积和
    模拟曲面上曲线的曲率,所述第二基本量用于表示模拟曲面的局部弯曲变化程度,将用第
    一基本量和第二基本量表示的曲面的偏微分方程组进行高阶差分离散,获得离散方程组对
    应的代数系统,将所述代数系统与所述采样方程组合成等式约束最小二乘问题;

    步骤4:将等式约束最小二乘为题转化为求解截断目标函数极小值问题;

    步骤5:把求解截断目标函数极小值问题转化为求解对称不定方程组,所述对称不
    定方程组为高精度曲面建模HASM方程组;

    具体的,

    步骤6:随机选取HASM方程组的迭代初值;

    步骤7:将HASM方程组中的系数矩阵进行行分块,并对系数矩阵分解后的块矩阵进
    行存储;

    步骤8:对迭代初值采用块行投影迭代法,求解HASM方程组,并判断求解结果是否
    收敛;

    步骤9:当求解结果不收敛时,对求解结果重新采用块行投影迭代法,求解HASM方
    程组,并判断求解结果是否收敛,如果收敛,执行步骤10,否则,重新执行步骤9;

    步骤10:当HASM方程组的解收敛时,进一步判断HASM方程组的解是否满足高斯科
    达齐方程组,若不满足,则执行步骤6;若满足,则根据HASM方程组的解输出关于待测变量的
    高精度模拟曲面模型。

    本发明旨在解决空间曲面建模领域中的大数据问题,具有如下优点:

    1、完善并发展了已有的模型,改进后的模型具有较低的存储需求及较少的计算时
    间;

    2、引入截断系统,给出了求解约束最小二乘问题的优化求解方法,结果更稳定;

    3、给出了大型方程组系数矩阵特定的分块方式,保证了矩阵各行之间的线性独立
    性,避免了信息冗余,从而给出了行投影算法的加速算法即块行投影迭代法,提高了方法的
    收敛速度;

    4、改进后的方法可求解大规模问题,计算时间与计算网格数成线性关系,所需存
    储空间远远小于HASM方程组系数矩阵中非零元素个数;在保证精度的情况下,解决了HASM
    在求解大规模问题中的缺陷。

    在上述技术方案的基础上,本发明还可以做如下改进。

    进一步,所述曲面的偏微分方程组为:


    其中,E=1+fx2,F=fx·fy,






    x为空间离散化的网格点的横坐标,y为空间离散化的网格点的纵坐标,fx为函数f
    对x的一阶偏导数,fxx为函数f对x的二阶偏导数,fy为函数f对y的一阶偏导数,fyy为函数f对
    y的二阶偏导数Ex、Fx、Gx分别为E、F、G对x的一阶偏导数,Ey、Fy、Gy分别为E、F、G对y的一阶偏
    导数,为第二类克里斯托弗尔符号。

    采用上述进一步方案的有益效果是,使得HASM建立在完整的微分几何学理论基础
    之上,保证了HASM的稳定性,提高了HASM的模拟精度。

    进一步,所述步骤3具体包括:

    步骤3.1:根据第一类基本量E、F、G和第二类基本量L、M、N的有限差分逼近计算待
    测区域每个网格点的第一类基本量和第二类基本量的值;

    步骤3.2:结合第一类基本量的有限差分逼近、第二类基本量的有限差分逼近和第
    二类克里斯托弗尔符号的有限差分得到离散方程组;

    步骤3.3:将所述离散方程组转换成矩阵形式的代数系统;

    步骤3.4:将所述代数系统与采样方程组合成等式约束最小二乘问题。

    采用上述进一步方案的有益效果是,HASM最后转化为一个由地面采样约束的等式
    约束最小二乘问题,目的是为了在保证采样点处模拟值等于采样值的条件下,保持整体模
    拟误差最小。充分利用采样信息,也是保证迭代趋近于最佳模拟效果的有效手段。

    进一步,所述步骤7中将HASM方程组中的系数矩阵进行行分块的具体方法为:设系
    数矩阵A的每个子块Ai最多有u行,且Ai∈Ru×n,u<<n均为满秩,即每块的行是独立的,假设
    正在生成一个子块Ai,该子块已包含矩阵A中的j行(j<u),且已知AiT的QR分解为AiT=QjRj,
    块AiT的行相关性的估计其中rhh为位于Rj的(h,
    h)位置的元素,a1为矩阵A中的一行,令根据AiT的QR分解,采用QR分解更新方法
    来得到的QR分解,然后计算的行相关性估计,如果该估计仍小于κ,则a1加入块Ai,其
    中,κ为预先设定的一个正数。

    进一步,所述QR分解采用Francis QR分解策略。

    采用上述进一步方案的有益效果是,对于涉及到的QR分解,采用Francis QR分解
    策略,可将其计算花费由O(u3)降低为O(u2),u<<n,从而提高计算效率。对矩阵分块可加速
    行投影迭代法的收敛,减少HASM方程组求解计算时间。

    进一步,所述步骤7中对系数矩阵分解后的块矩阵进行存储的方式为行压缩存储
    方式CSR。

    采用上述进一步方案的有益效果是,CSR格式是最常见和灵活的压缩格式,它将矩
    阵的非零元素进行按行压缩存储,并用专用数组来记录非零元素原有的位置,压缩效率高,
    压缩过程便于理解,由此显著降低了内存需求。

    进一步,所述步骤8和步骤9具体包括:假设当前迭代点为,判断xk是否收敛,若不
    收敛,则找出离xk直交距离最远的块,选取xk在所述块上的投影作为下一个迭代点。

    采用上述进一步方案的有益效果是,加快收敛速度。

    附图说明

    图1为本发明实施例提供的一种基于大数据的高精度曲面建模方法步骤流程图;

    图2为标准数学曲面及采样点分布图;

    图3为HASM、FRK、IDW和FRS模拟曲面与真实曲面的误差图。

    具体实施方式

    以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并
    非用于限定本发明的范围。

    如图1所示,本发明实施例提供的一种基于大数据的高精度曲面建模方法,包括以
    下步骤:

    步骤1:创建各采样点的地理坐标信息和待测变量采样值,所述地理坐标信息中包
    括采样点的经度信息和采样点的纬度信息;

    步骤2:将待测区域空间离散化为网格点形式,得到网格点离散值,根据地理坐标
    信息和待测变量采样值建立采样方程,所述采样方程用于判断采样点是否在网格点上,其
    中,如果采样点在所述网格点上,则该网格点的值即为待测变量采样值;如果采样点在网格
    内,则将距该采样点最近的网格点上利用泰勒展开得到该网格点上的近似采样值;

    步骤3:根据网格点离散值计算待测区域每个网格点的第一类基本量E、F、G和第二
    类基本量L、M、N,其中所述第一基本量用于表示模拟曲面上曲线的长度、模拟曲面的面积和
    模拟曲面上曲线的曲率,所述第二基本量用于表示模拟曲面的局部弯曲变化程度,将用第
    一基本量和第二基本量表示的曲面的偏微分方程组进行高阶差分离散,获得离散方程组对
    应的代数系统,将所述代数系统与所述采样方程组合成等式约束最小二乘问题;

    所述步骤3具体包括:

    步骤3.1:根据第一类基本量E、F、G和第二类基本量L、M、N的有限差分逼近计算待
    测区域每个网格点的第一类基本量和第二类基本量的值;

    步骤3.2:结合第一类基本量的有限差分逼近、第二类基本量的有限差分逼近和第
    二类克里斯托弗尔符号的有限差分得到离散方程组;

    步骤3.3:将所述离散方程组转换成矩阵形式的代数系统;

    步骤3.4:将所述代数系统与采样方程组合成等式约束最小二乘问题。

    具体的,根据曲面论基本定理:设曲面的第一类和第二类基本量E、F、G、L、M和N满
    足对称性,E、F、G正定,E、F、G、L、M和N满足曲面的偏微分方程组,即Gauss方程组,则全微分
    方程组在f(x,y)=f(x0,y0)(x=x0,y=y0)初始条件下,存在着唯一的解z=f(x,y)。

    Gauss方程组的表达式为,








    x为空间离散化的网格点的横坐标,y为空间离散化的网格点的纵坐标,fx为函数f
    对x的一阶偏导数,fxx为函数f对x的二阶偏导数,fy为函数f对y的一阶偏导数,fyy为函数f对
    y的二阶偏导数Ex、Fx、Gx分别为E、F、G对x的一阶偏导数,Ey、Fy、Gy分别为E、F、G对y的一阶偏
    导数,为第二类克里斯托弗尔符号。

    若{(xi,yj)}是计算域Ω的正交剖分、[0,Lx]×[0,Ly]为无量纲准化计算域、max
    {Lx,Ly}=1、Lx为研究区域水平长度的归一化后的取整数值。Ly为研究区域垂直方向长度
    的归一化后的取整数值。为计算步长、{(xi,yj)|0≤i≤I+1,0≤j≤J+1}为标
    准化计算域的栅格,则第一类基本量的有限差分逼近为,


    其中,Ei,j,Fi,j,Gi,j、分别为E、F、G在网格点(i,j)上的值,fi,j为模拟曲面在网格点
    (i,j)上的值;

    第二类基本量的有限差分逼近为,


    其中,Li,j,Mi,j,Ni,j分别为L、M、N在网格点(i,j)上的值;

    第二类克里斯托弗尔符号的有限差分表达为,







    其中,为第二类克里斯托弗
    尔符号在网格点(i,j)上的值;

    高斯方程组的有限差分形式为,



    (1.1.2)的矩阵形式可写为:


    其中,



    其中,


    为上述(1.1.2)式右端项采用有限差分格式离散后的值。

    结合采样信息的有效约束控制,上述约束最小二乘问题(1.1.3)可表达为HASM所
    求解的等式约束的最小二乘问题,


    Sx=k为采样点满足的采样方程,其中S和k分别为采样矩阵和采样向量;如果
    是z=f(x,y)在第p采样点(xi,yj)的值,则sp,(i-1)×J+j=1,

    HASM最后转化为一个由地面采样约束的等式约束最小二乘问题(Equality
    constraint least squares problem:LSE)

    步骤4:将等式约束最小二乘为题转化为求解截断目标函数极小值问题;

    具体的,通过研究发现,引入一参数λ,LSE问题可首先通过Lagrange乘子法将其转
    化为如下求截断目标函数极小值问题:

    其中

    步骤5:把求解截断目标函数极小值问题转化为求解对称不定方程组,所述对称不
    定方程组为高精度曲面建模HASM方程组;

    具体的,对求导,另其导数为0,可得
    结合及Sx=k可得如下对称不定系
    统:


    其中,I为对角线元素全为1,其他元素为0的单位矩阵。为矩阵的转置矩阵。ST
    为S的转置矩阵。λ为采样点权重构成的权重矩阵,在HASM中取值为1~2之间。

    步骤6:随机选取HASM方程组的迭代初值;

    步骤7:将HASM方程组中的系数矩阵进行行分块,并对系数矩阵分解后的块矩阵进
    行存储;

    具体的,对于系数矩阵的分块方式,本研究给出了A的一分块算法,应用该算法每块
    最多有u行,且每块Ai∈Ru×n,u<<n均为满秩,即每块的行是独立的。假设正在生成一个块
    Ai,该块已包含矩阵A中的j行(j<u),且已知AiT的QR分解为AiT=QjRj,令rhh为位于Rj的(h,
    h)位置的元素??锳iT的行相关性的估计其中
    对于矩阵A中的一行a1是否加入该块Ai的准则为a1没有被分配给任何其他的块,且a1加入后
    Ai的行相关性估计βi不超过κ,κ为预先设定的一个正数。为了决定一个新的行a1是否加入块
    Ai,令且根据已有的AiT的QR分解来得到的QR分解,对此采用QR分解更新方
    法来实现。然后计算的行相关性估计,如果该估计仍小于κ,则a1加入块Ai。

    该块分解算法描述如下,该算法基于C++实现。

    令Γ=1,2,…,m,Γs={l:A中的a1列已分配给某块}

    初始化:令i=1,Γs=φ,

    whileΓs≠Γ,do

    令Γc=Γ\Γs,j=1,Γi=φ

    选取l∈Γc,令Ai=[a1],R1=[||a1||2,0]T,

    计算Q1=In-2vvT

    令dmax=||a1||2,dmin=||a1||2

    Γc←Γc\{l},Γs←Γs∪{l},Γi←Γi∪{l}

    while(j<u且Γc≠φ)do

    选取l∈Γc

    令v=[||a||2,0]T∈Rn-j

    计算


    tmax←max{dmax,||a||2},tmin←min{dmin,||a||2},

    if tmin≠0,且则

    更新Ai←[Ai,a1]

    Γc←Γc\{l},Γs←Γs∪{l},Γi←Γi∪{l}

    j=j+1

    dmax←tmax,dmin←tmin

    else

    Γc←Γc\{l}

    end

    end

    i←i+1

    end

    为了提高计算效率,对于涉及到的QR分解,我们采用了Francis QR分解策略,并将
    其计算花费由O(u3)降低为O(u2),u<<n.

    上述算法中,涉及到稀疏矩阵块Ai间的乘法及稀疏矩阵与向量乘的运算,向量内
    积及向量加法运算。稀疏矩阵通常存储为压缩格式。随着应用场景及计算平台的不同,矩阵
    通常被压缩为不同的存储格式。压缩格式的选择要综合考虑矩阵的稀疏特点及计算平台。
    本研究对矩阵存储采用行压缩存储方式(CSR),CSR格式是最常见和灵活的压缩格式,它将
    矩阵的非零元素进行按行压缩存储,并用专用数组来记录非零元素原有的位置,压缩效率
    高,压缩过程便于理解。CSR格式并于被移植到不同平台上。许多新的压缩格式也都基于CSR
    格式修改而来。这种方法存储n阶矩阵A时,假设A中共有l个非零元素,则需要用一个l维向
    量x按先行后列的顺序依次存放A中的非零元素,用一个l维向量xJ按同样的顺序依次存放A
    中的这些非零元素列号,同时还需要引入一个n+1维整型向量x(R),指明A中第i
    行中第一个非零元素被存储在x中的位置,此研究中不定方程组(4)的系数矩阵
    为对称矩阵,因此实际中只需存储上三角部分非零元素。对于Huge型,对应的采用了块行压
    缩存储方式。

    基于上述格式实现的矩阵与向量乘法y=Av可写为:


    y(x(R)(i))=x(i)×v(xJ(i))

    end

    基于CSR行压缩存储方式,可分析得上述算法的计算花费最大为O(n),其中n为计
    算网格数。

    步骤8:对迭代初值采用块行投影迭代法,求解HASM方程组,并判断求解结果是否
    收敛;

    步骤9:当求解结果不收敛时,对求解结果重新采用块行投影迭代法,求解HASM方
    程组,并判断求解结果是否收敛,如果收敛,执行步骤10,否则,重新执行步骤9;

    具体的,对于上述对称不定系统的求解方法一般为直接法及迭代法。直接法涉及
    到矩阵的分解等对大规模问题并不适合。常用的迭代法为Krylov子空间迭代法,比较预处
    理共轭梯度法PCG、基于最小二乘的QR分解方法LSQR,及广义极小残差化方法GMRES等。由于
    此类迭代法需要将方程组系数矩阵全部一次性输入内存,随着计算规模的增加,此类方法
    已不再使用。行投影迭代法可避免此类问题,行投影迭代法应用广泛,算法简单,经典的行
    投影迭代法如Cimmio算法、Kaczmar算法等。

    定义Hi为集合:Rn为n维实数向量构成的空间,i=1,…,p。
    因此任何即x*为p个子空间Hi的交集,为线性系统ATx=b的解。设所求(1.1.5)
    中的对称不定系统为Ax=b,根据计算区域的网格刨分将矩阵A分解为块行形式:

    并定义Pk(AiT)为AiT值域上的投影算子。总体思路是先将xk投影到
    p个超平面

    Algorithm:块Cimmino行投影法:

    选取x(0),令k=0,

    重复上述步骤直到收敛,

    begin

    do in parallel i=1,…p

    δi(k)=Ai+bi-PA(AiT)x(k)=Ai+(bi-Aix(k))

    end parallel


    set k=k+1

    end

    此方法可避免不用每次都将矩阵元素全部输入,每次只需输入矩阵的一块行,保
    证了大规模问题的求解可能性。但缺点是收敛速度慢,因此在实际中较少应用。

    为此本研究基于Kaczmar算法,给出了一个新的行投影块迭代算法。通过选取离当
    前迭代点距离最远的块来进行直交投影,并将投影作为下一个迭代点,从而加速了收敛速
    度。假设当前迭代点为xk,首先计算xk在所有Hi上的直交投影Pi(xk),对于i=1,…,p,然后比
    较所有的||Pi(xk)-xk||2并求出其中最大者,即找出离xk直交距离最远的块Hi,假设||Pj
    (xk)-xk||2最大,即选取xk在Hj上的投影Pj(xk)作为下一
    个迭代点,即xk+1=Pj(xk),继续上面的过程,得到一序列{xk},不断迭代直至收敛。该算法描
    述如下:

    初始化:对矩阵A进行分块,给定初始点x0∈Rn,0≤ε<1,令k=0



    步骤10:当HASM方程组的解收敛时,进一步判断HASM方程组的解是否满足高斯科
    达齐方程组,若不满足,则执行步骤6;若满足,则根据HASM方程组的解输出关于待测变量的
    高精度模拟曲面模型。。

    下面介绍本发明实施例的验证,

    1、数值试验

    首先以标准数学曲面为例,研究算法的有效性。比较改进后的HASM方法与可适应
    大规模求解问题的Kriging方法(FRK)、可适应大规模求解问题的Spline方法(FRS)及反距
    离权重法IDW的模拟性能差异。


    定义域为[0,1]×[0,1]。

    如图1所示,在标准数学曲面上随机选取1/100的采样点,所有实验在64位机上运
    行,HASM中?;荚蛭狦auss-Codazii方程组。将计算区域刨分为1000×1000.u=100,κ=
    5.对计算误差的衡量,采用平均绝对误差RMSE,其计算公式如下:

    其中fi,为第ith个真实值与模拟值,N为采样点个数,计
    算结果如表1所示:

    表1不同方法计算效率分析比较

    方法
    HASM
    G-IDW
    FRK
    FRS
    RMSE
    1.3076×10-4
    1.66×10-2
    2.20×10-3
    5.78×10-4
    计算时间(s)
    54.06s
    20.11s
    40.00s
    24.79s

    结果表明,HASM计算精度最高,其次是FRS方法。HASM计算精度分别为IDW,FRK及
    FRS的127倍,17倍及4倍。但HASM的计算速度低于其他方法。这是因为HASM计算过程中需要
    对偏微分方程组有限差分离散,需要计算方程组右端项,及求解方程组等,计算过程更加复
    杂。

    图2为根据(a)HASM,(b)FRK,(c)G-IDW,和(d)FRS模拟曲面与真实曲面的误差图,
    其中,可以看出IDW模拟误差最大,最大误差出现在边界及峰值处。最大偏差为0.2139.FRK
    也产生了较大误差,最大误差为0.02737.FRS的最大偏差出现在边界处为-0.0123.误差最
    小的是HASM方法,可以看出误差分布相对均匀。

    尽管HASM的计算时间多于其他方法,但其计算时间与计算网格成线性比例关系。
    表2给出了不同计算规模下HASM的计算时间。计算时间与计算网格的关系式可表达为:

    t=1.1099×10-5n+26.7447,R2=0.91

    表2.不同计算规模下HASM的计算时间

    计算网格数
    1million
    4million
    9million
    16million
    25million
    计算时间(s)
    54.06
    88.21
    107.54
    155.19
    339.15

    2、实际案例

    以中国为研究区,采用上述方法计算过去50年1961-2010年多年平均降水的分布,
    空间分辨率为1km,对应计算网格数为19,606,916。

    从HASM、FRK、IDW和FRS模拟的中国范围多年平均降水分布结果可以看出,所有方
    法都能较好的反映出降水的分布趋势。HASM及FRK方法模拟的曲面相对其他方法较为更加
    光滑。IDW及FRS方法出现了很多牛眼现象,且FRS方法在边界处产生了较大幅度的振荡。

    随机选择15%的作为验证点验证不同方法。此过程重复了10次,并计算这10次的
    平均RMSE。结果如表3所示??煽吹紿ASM计算精度是最高的,其模拟精度分别我FRK,IDW及
    FRS的1.4,1.5及1.6倍。FRS的模拟误差最大。IDW计算时间最少,其次是HASM.

    表3.实际案例中不同方法的比较

    方法
    HASM
    FRK
    IDW
    FRS
    RMSE(mm)
    90.87
    123.51
    133.44
    147.10
    计算时间(s)
    166
    237
    63
    172

    数值试验与实际案例,表明改进后的HASM方法在保证精度的同时,使得其计算时
    间与计算网格数成线性关系,在存储上,由于在求解约束最小二乘问题时,采用了块行投影
    算法,只需存储矩阵的一块行,并采用行压缩存储方式对其进行存储,保证了求解问题的规
    模。

    以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和
    原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的?;し段е?。

    关于本文
    本文标题:一种基于大数据的高精度曲面建模方法.pdf
    链接地址://www.4mum.com.cn/p-6079661.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 五分时时彩怎么玩 中国福利彩票投注站 重庆时时77计划网 一万期验证时时心得 赌场骰子 安徽时时l凉拖 6个平码算下期的平特肖 快乐时时走势图开奖号码 七星彩技巧和方法 必赢客pk10软件官网 小店面适合做什么生意 时时彩稳赚 人工 安徽快三计划软件手机版 欢乐生肖实时计划网 246好彩天天免费资枓大概全 竟彩2串1稳赚不赔技巧