地理建模方法
第一章
1.模型含义:模型是对现实世界中的实体或现象的抽象或简化,是对实体或现象中的最重要构成及其相互关系的表述。
2.模型的基本特征:结构性,简单性,清晰性,客观性,有效性,可信性,易操作性。3.模型的分类(了解):概念模型、物理模型、数学模型
(1)概念模型:概念模型是指利用科学归纳方法,以对研究对象的观察、抽象形成的概念为基础,建立起来的关于概念之间的关系和影响方式的模型。
(2)物理模型:物理模型又称实体模型,是现实世界在尺寸缩小或放大后构成的相似体。(3)数学模型:数学模型是用数学方程(通常是一些代数方程和微分方程的组合)来描述4.从不同的角度模型分为几类(了解)P6
(1)根据模型与时间有无关系:静态与动态模型
(2)根据模型在时空表达上的连续性:连续与离散模型
(3)根据计算机在建模中的作用:解析与模拟模型
(4)根据模型使用的数学方法:微分方程、差分方程和矩阵模型
(5)根据模型涉及的地理过程和机制的多少:现象、机理和过程模型
(6)根据模型的内容:干扰传播模型,复合种模型,植被动态模型,土地利用变化模型,生物地球化学模型
(7)根据模型所涉及的组织参次:种模型,落模型,生态系统模型,景观模型,全球模型
(8)根据模型包含空间异质性的程度或处理空间信息的方式:非空间模型,准空间模型,空间显示模型,
(9)根据模型对空间数据的表达:栅格和矢量模型
5.模型用途(了解):预测工具、理解工具、诊断工具、综合工具、管理与决策工具。
6.建模步骤:建立概念模型,建立定量模型,模型检验,模型的应用P7
7.地理模型特点:地理模型是地理建模的结果。其特点为复杂性,空间性,时间性,模糊性。
8.地理建模与地理学和地理信息系统区别:P9 ???
第二章
1.概念(了解):又称术语,专业名词,是一组观念,一种结构,是对于问题的普遍的本质特征的反应
2.变量分类(了解):1)定量变量,可以用数值表示2)定性变量,不能用数值表示3)方位变量,用方位角的值表示的特殊变量
3.离散与连续数据的定义与转换???
4.精密性:测量数据彼此接近程度,是随机误差
精确性:测量值集中于真值附近的程度。取决于仪器的测量精度
准确性:测量值与真值之间的偏离程度,是系统误差。
5.测量尺度:
名义尺度:是最低的测量尺度。根据事物的固有特征进行区分是采用名义尺度。名义尺度数据是定性的,其顺序与类别之间没有关系,即使将数值赋予类别变量,也没有意义。
次序尺度:包含了名义尺度,也是基于某种数量的量按数据的等级序列进一步细分。只包含了等级,规定变量从低到高的等级次序。
间隔尺度:它的间隔为单位距离,任意两个数的差异均可表示为其他单位的数值。在描述类别和顺序的排列中间增加距离信息。
比例尺度:是最高的测量级,具有间隔尺度性质和零起点性质的变量就是比例尺度变量。
6.系统含义:系统是内部包含若干组成,其间通过有规则的相互作用而相互依赖,并以某些形式联合而成的统一整体。
系统分类:物质系统,能量系统,信息系统
物质系统的特征:
1)存在系统边界(自然或人为的),系统外部称为环境。
2)内部含有若干相互联系的组成成分称为要素。
3)各组分之间存在着物质和能量方面的联系。
4)物质和能量出入系统边界时称为输出和输入。
5)系统能量输出和输入趋于动态平衡时,系统相对稳定。
6)系统存储能量越大,对输出的敏感性就越小。
7)停止能量出入,开放系统就会逐渐衰退,乃至破坏。
8)系统之间通过一定的组成更为复杂的系统,称为耦合。
系统结构:系统的部分组成要素之间在实践空间方面的有机联系与相互作用方式或者顺序结构特点:稳定性,多层次性,相对性,开放性,变异性
系统的功能:系统与外部环境相互联系和作用过程的秩序跟能力
系统功能分类:孤立系统,封闭系统,开放系统
7.地理系统:太阳辐射进入地球表层后在各个圈层中的流通转化,使它们相互依存,相互作用,形成一个复杂的整体,这就是地理系统。
8.系统分析的基本要素:主要是指目的、可行方案、模型、费用、效果和价值标准
9.系统的结构分析方法:
(1)形式结构方法:加和性与非加和性分析,反馈分析,因果关系分析
(2)空间结构方法:等级结构方法,并列结构方法,等级—并列结构方法
(3)时间结构方法;(4)空-时结构方法
10.反馈、正反馈、负反馈的原理P36
11、近似数:和真数相近,但还不是真值,这样的数叫近似数。
有效数字:指9中的人一个数字,0除了用于确定小数点,填补未知的或被抹去的数字位置以外,也就是有效数字
数的抹尾:指吧一个数抹尾凑整简称抹尾,就是从数的左边算起,保留一定位数的数字,而把其余的数字都抹掉。抹尾的规则:四舍五入,奇进偶退。
绝对误差:测量的真值与给定的测量值或由计算得到的近似值之间的数之差
相对误差:绝对误差除以测量的量的真值
百分误差:相对误差乘以100
第四章
1.统计学基本概念:
(1)总体:是研究对象中所有要素的集合,分为有限总体和无限总体。
(2)总体特征:指总体中任一要素的的可观测属性,它的只是变化的,用变量来表示。(3)变量:是能够取不同值得的要素的总特征。
(4)总体普查:是总体中所有要素的相关总体特征的完全列表。
(5)样本:是总体中要素的子集,用来推断总体的某些特征。
(6)采样误差:是总体特征值与样本得到的总体特征值之间的差异。
(7)非采样误差:是数据在采集、记录、编辑等过程中产生地误差。
(8)估计:利用样本信息推测未知的总体特征的值。
(9)假设检验:判断样本数据是否支持假设的某些总体特征的特定值。
2.模型分类:
(1)相关分析模型:研究变量之间的相互关系并进行信度检验。相关分析模型主要通过相关系数、偏相关系数和典型相关分析来建立。研究的结果有助于分析概念模型中变量的关系,并将其定量化和细化。
(2)因子分析模型:是使用数学方法建立起来的关于变量之间组合关系的方法。该方法利用协方差结构来组合不同的因子,进而分析推断可能存在的地理过程。
(3)回归分析模型:使用统计回归方法,建立解释变量与因变量之间的关系表达式。从统计学的角度看,回归是利用均值性质进行推断的一种方法。包括多元回归分析,岭回归分析,逻辑回归分析,概率回归,积分回归,稳健回归,逐步回归分析。
3.建模的步骤:
(1)数据整理:1.变量名是否规范;2.明确变量的测量尺度和数据类型;3.检查样本;
4.数据录入;5填写说明日志;
(2)数据预处理;(3)模型计算;(4)模型检验;(5)模型解释与应用;
4.平均特征描述:反应数据分布的位置;
(1)期望和均值;
(2)中位数:指将观察值按照由大到小的顺序排列后,位于中间位置的数;
(3)众数:是在指定的变量(数列、观察序列)中出现的次数最多的数(频数最高的数);
5.变化特征描述:反应数据的离散程度或变化尺度;
(1)离差:描述形式:极差:最大值与最小值的差
偏差:数据序列中各个数据与其均值的差;
离差平方和::数据序列中各个数据与其均值的差的平方在加和;(2)方差、标准差:方差是变量的离差平方和除以样本数;标准差是方差的平方根。(3)变异系数:又称离差系数,指标准差与均值的比值。变异系数越大,数据离散城的越高。
建模方法6.分布特征描述:峰度和偏差。偏度大于0为正偏(平均值在正态分布的右边),小于0为负偏(平均值在正态分布的左边),0表示偏度对称;峰度大于0表示数据的分布比正态分布更为集中,小于0则更为分散。偏度或峰度远偏于0,那么数据为非正态分布。
7.正态分布检验(理解)P109
(1)图示法:直方图,概率图,盒子图
(2)参数检验法:常用的正态分布检验方法有Kolmogorov-Smirnov d and Lilliefors p 检验和Shapiro-Wilk’s W检验
8.数据变换的方法
(1)改变数据尺度的分度的变换:包括标准化变换,极差变换,均匀化变换,反正弦和反余弦变换,平方根变换,对数变换,博克斯-麦克斯变换。
(2)改变变量连续性的变换
(3)曲线化变换:双曲线,冥函数,指数函数,对数函数,取对数与其他方式结合。(4)增加数据可解释性的变换:变换时注意数据的范围,残差,试差法。
9.线性相关系数:用r表示,相关系数值变化在-1—1之间,相关系数为-1和1时两个变量之间是直线关系,相关系数为0时变量之间不相关
10.回归分析:研究一个随机变量与多个变量之间的线性关系。检验解释变量的显著程度并比较其作用的大小,进而用两个或多个变量的变化解释和预测因变量的变化。
11. 回归分析的基本模型:y=f(xj)+a(随机干扰项),j=1,2……,p,p<=m
12.随机干扰项的意义:随机干扰项又称残差或误差,当回归方程确定时,是因变量回归结果与原始值得差。干扰项被认为是从模型中省略下来的而又集体的影响着Y的其他变量的代替物。
13. 回归分析的步骤:(了解)(1)根据数据的测量尺度和目的选择适当的回归方法;
(2)选择解释变量和因变量;
(3)计算回归方程;
(4)结果分析和检验;
(5)模型的对比和确认;
14.回归分析方法(了解):P147
15.最小二乘法:是残差的平方和最小,检验回归分析模型的方法。
16. 为什么用最小二乘法:(1)关注因变量的变化;
(2)在非计算机时代,平方和比其他运算更容易得出结果;17.一元线性回归方程分析:参照P149多元线性回归分析实例和P144的回归方程检验
第六章
1.动态数据分类:
(1)动态数据按照时间和属性值进行分类。按照时间t的取值,动态数据分为离散数据和连续数据两类。当t取整数值时,数据序列是离散的;当t在某一实数集合上取值时,数据序列是连续的。对于观察得到的记录来说,序列是离散的。
(2)按照属性数据的表现形式,动态数据分为绝对数时间序列(包括时期序列、时点序列、相对数和
平均数时间序列)、相对数时间序列和平均数时间序列三种序列。其中绝对数时间序列是原始序列,相对数和平均数实践序列是派生序列。
2.动态数据的可比性原则
1、同一时间序列,属性值所述时间应当统一。
2、总体范围应一致。
3、属性内容保持一致。
4、计算方法要一致。
5、计量单位要一致。
4动态数据的构成部分
1、趋势变动
2、季节变动
3、循环变动
4、随机变动
5、动态数据的构成分析
(包括加法和乘法模型)
5.动态数据的分解(了解):动态数据的分解就是按照动态数据的分析模型,测定出各种变动形态的具体分析。
构成因素:1.仅包含趋势变动和随机变动;2:包含趋势变动、季节变动和随机变动
动态数据的分解分析的作用概括为:1、分析和测定有关构成因素的数量表现,可以更好的认识和掌握现象变化发展的规律性。2、将测定出的某一构成因素数值从动态数据中分离出去,便于分析动态数据中其他因素的变动规律。3、为动态数据的预测奠定基础。
6.建模方法(了解):1、统计学方法2、灰系统方法3、系统动力学方法
7.模型分类(了解):1、时间序列模型2、动态系统模型
8.建模步骤:1、分析动态数据的特征  2、分解动态数据的类型  3、数据预处理  4、建模5、模型确认
9时间序列常用的方法:1、单属性序列的分析预测2、多属性序列的分析预测
10.按照观测结果是否具有随机性,将时间序列分为两类:确定性时间序列和随机性时间序列
11.确定性时间序列分析:1、趋势外推的数学模型    2、移动平均法:一次移动平均法(掌握P219),二次平均法。3、指数平滑法(掌握P222)  4、季节指数法    5、灰模型
第七章
1.空间分析的内容包括: (1)空间数据处理;(2)空间数据分析;(3)空间统计分析(4)空间模型
2.空间数据分析的基本内容
空间自相关:指空间位置上越靠近事物或现象就越相似,即事物或现象具有对空间位置的依赖性。
可变区域单位问题
生态学谬论
空间尺度
空间非均一性
3.空间数据的关系
拓扑关系:在拓扑变换中保持不变的几何属性;
度量关系:距离(直线,球面,时间,莫哈顿)
顺序关系
交互:可认为是距离邻接的综合,它来源于一个基本想法:近的事物关系更密切。
邻接:邻接可以认为是名义的、双向的、相等的距离。确定相邻的最简单方式是,如果两个空间实体在指定的空间距离内,那么它们是相邻的,否则不相邻。
近邻特定空间实体的近邻是与该实体邻接的其他空间实体的集合,此时,近邻依赖邻接的定义。
4.空间数据插值,常用的插值方法:
①距离倒数插值②样条插值③三角网插值④最小去想法插值⑤等方位加权法插值⑥多项式拟合(趋势面分析)插值⑦克里格插值
5.距离倒数法插值方法:(P276、理解)(IDW)是一种常用的插值方法,他利用插值点周围样点值来
计算插值点的值。
这一假设是影响随着距离衰减,样店距插值点越近,影响越大
使用时注意的问题:距离的影响程度,搜索半径,中断线,样点分布

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。