1、1第一章 绪论1.数学地质的现代定义。数学地质是利用数学的思维、数学的 逻辑、数学模型和 计算机科学的理 论和方法,智能化、定量化研究地质过程中所 产生的地质体和资源体的科学。2.数学地质的主要研究内容。 、地质多元统计分析:回归分析、趋势面分析、聚类分析、判别分析、相关分析(数据序列分析)、地质因子分析、对应分析、矿产资源预测:蒙特卡罗模拟、油田规模序列法、Weng 旋回模型法、历史趋势外推法。、地质数据库:它是存储在某种存储介质上的地质信息(数值型、符号型、文字及图形等)和信息处理软件的集合。、地质过程的数学模拟 :用数学模型描述地质过程的发生和演化过程,并在计算机上现地质过程的一种试验。
2、、计算机自动绘图第二章 地质变量与地质数据1.地质变量、地质数据的概念和类型。、地质变量:是反映某地质现象在时间或空间上变化规律的量。如生油岩的厚度、地层的埋藏深度、生油岩中有机 质的丰度等。分类:观测变量、综合变量、地质数据:用物理、化学及直接 观测方法获得的用以表示地 质样品特性的各种数据和其它形式记录的资料统称为地质数据(或样品观测值)分类:观测数据、综合数据、经验数据2 地质数据预处理概念及所包含的内容。地质数据预处理:指在定量研究地质问题时,预先对原始数据 进行的各种处理。主要内容:定量数据的标准化、定性数据的定量化、原始数据的网格化、原始数据的简缩和增补、离群(异常)数据的 识别与
3、剔除。3.定量数据的标准差标准化、极差标准化、极差正 规化的含义是什么?各种标准化后的新数据有何特点?、定量数据的标准差标准化:变量 xj 的每个观测值 xij 减去该变量观测值的平均值,再除以观测值的标准差 sj 。标准化后数据的特点:平均值为 0,标准差为 1。、极差标准化:是变量 Xj 的每个 观测值 Xij 减去该变量观测值的平均值,再除以极差Xj (变量观测值的最大值与最小值之差)。标准化后数据的特点:各列的极差为 1。、极差正规化:变量的每个观测值减去观测值的最小值,再除以极差。极差正规化后新数据的特点是:最大值为 1,最小 值为 0,即新数据分布在区间0,1 内。第三章 回归分析
4、1.回归分析的概念及解决的主要问题。回归分析: 根据相关 变量 xi (i=1,2,m)、y 的观测值,建立 y 与 xi 之间近似定量关系的一种多元统计方法。回归分析解决的问题:、变量 间是否存在相关性; 、各变量间的相关程度;、建立相关变量间的定量表达式;、实际应用。22.最小二乘求回归系数。3.求非线性回归的一般方法(变量替换法)。非线性相关变量进行回归分析时,先用变量替换法将其转化为线性关系,然后再求回归方程。4.回归模型检验(两种方法)。回归检验是解决 y 与 xi 之间是否具有线性关系的问题。总偏差平方和 Q:反映 y 观测值离散程度的一个指标;偏差平方和 Q1:反映观测值与回 归
5、值的逼近程度;回归平方和 Q2:反映 xi 的变 化对 y 引起的波动。 21Q、复相关系数检验:定义变量 y 与 xi 的复相关系数 : ,R 的值越接/)(近于 1,变量间的相关性越密切, 即回归方程越显著。、F 分布检验:假设 H0: 变量 y 与 xi 没有线性关系若 H0 为真,则 Q1 相对较大, Q2 相对较小。当 Q2/Q1 小于某个临界值时,就接受假设 H0 ,否则否定原假设 H0 ,既认为变量 y 与 xi (i=1,2,m)有显著的线性关系。对于给定的检验水平 ,在 F 分布表上查得临界值 F,当 F F时 ,否定原假设H0,这时称回归方程是显著的,可以使用;否 则,接收
6、原假设 H0 ,认为求得的回归方程不能应用 。5.逐步回归分析的概念及基本步骤。逐步回归分析:在回归过程中,按 变量 xi (i=1,2,m)对 y 作用的大小,把作用达到一定程度的变量 xr(1rm)逐个“ 引入 ”回归方程,同时逐个检验已引入回归方程的变量对 y 的影响,若 x ( xxr )对 y 作用已不显著,就再从回归方程中“剔除”它,如此直到既没有对 y 作用显著的变量引入回归方程,又没有作用不 显著的变量从回 归方程中“剔除”。基本步骤: 、检验 Xk 是否 选入( 引入);、检验 Xk 是否剔出6.逐步回归引入和剔除变量的原则(假设检验)。(1)检验 xk 是否选入(引入)假设
7、 H0:变量 xk对 y 作用不显著( 作用不大)统计量 Fk 服从 F(1, n l - 2 ) 分布, 给 定 检验 水平 (H0 成立的概率 ) ,查 F 分布表得一个 临 界 值 ,记为 F1 。当 Fk F1 时 ,则 否定原假 设 ,说 明原假 设 不成立 ,应 把 变 量 xk 引入回 归 方程,否 则 引入 变 量 结 束。(2) 检验 xk 是否剔出假设 H0:变量 xk对 y 作用不显著( 作用不大)统计量 Fk、服从 F(1, n l - 1 ) 分布, 给 定 显 著性 检验 水平 ,查 F 分布表得 临 界 值F2 ,若 Fk F2,则 否定 H0 ,即 xk对 y
8、作用大,将其留在回 归 方程中,否 则 接受假 设 H0,从方程中去掉 变 量 xk。7.举例说明回归分析在油气勘探开发中的应用。第四章 趋势面分析1.趋势面分析的概念。趋势面分析:就是在空间中已知点 Mi (xi , yi , zi) 的控制下,拟合一个连续的数学曲面,并以此研究地质变量在区域上和局部范围内变化规律的一种统计方法。2.求多项式趋势面方程的方法。假设 1、2、3的估计值为 b1、b2、b3,则近似可得多 项式趋势面方程;把地理坐标 (xi , yi) (i=1,2, n )代入多项式趋势面方程,可得地质变量的趋势值;3确定多项式系数的原则是使回归分析中的偏差平方和 Q1 达到最
9、小,Q1 是关于 b1, b2, b3, 的二次函数,且 Q10。对 bk 求偏导数解一个 L 阶线 性方程组便可得 b1, b2, bL。3.趋势面拟合度定义及趋势面次数选择。趋势面的拟合度:是指观测值与趋势值在总体上的逼近程度。C= (Q2/Q)*100%趋势面的次数选择:方法 1:进行 1 次、2 次 趋势面分析,相应拟合度为 C1 ,C2,作图标出点(1,C1),(2,C2),(3,C3),连接各点构成一条折 线,在折线上取斜率最大的线 段末对应的 k 为趋势面的次数。方法 2:进行 1 次、2 次 趋势面分析,相应的拟合度为 C1、C2 。预先给定一个小正数 , 当 Ci+1-Ci异
10、常下限为正异常点 。从 zi-中划分负异常时,e -(或 -2s-)为异常上限,zi- 0,令bnkmjji bxcy11)()(mj aiji niaxcay ),2,1()( mj bkji nbxcby1 ),2,1()( ),2(0jcVj mxcxy14由上述线性方程组解出 cj,从而确定判别函数简单说,两总体判别就是确定 样品 X 是属于总体 A 还是属于 B 的统计分析方法。设 ,把 样品观测值 xj (j=1,2,m) 代入判别函数,得:当 y x), 显然: P(Xx)=1-P(X x)=1-F(x)以统计所得的 Fn(x)代替 F (x), 并记:AF(x)就是油气资源评价
11、中的经验分布函数。4.随机变量的抽样法种类及经验函数抽样法。种类:、经验分布函数抽样法; 、直接抽样法; 、变换抽样法。经验分布函数的抽样:将坐标原点设为( xmin ,0),若已知0,1区间上均匀分布的随机数 ri ,则在下图纵轴上可确定点( xmin , ri ), 过该点作横轴的平行线交分布曲线于点( xi , ri ), xi 则是对应于随机数 ri 的一次随机抽样值。5.估算一个地区油气资源总量的一般步骤。第十章 油气资源量与含油气有利地带预测1. Weng 旋回模型的一般形式及参数含义。若体系 Q 在时间 t0 时不存在,那么它是个不连续的体系,记为:若设 Q 的发展速度 dQ/d
12、t 与 Q 的当前状态关系为:(t0) ),(21nXYMxrn/)(mod1Mxrn/)(mod1)1)()FAFn0,tQ1)/(/xd7式中( x/t )-1-比例因子x-Q 达到顶峰期的时间(某一正实数)。由上式得: 式中 A 为积分常数。上式可以写成:这就是 Weng 旋回模型 Q 的兴起正比于时间 t 的 x 次方(兴起因子); Q 衰亡正比于时间 t 的负指数函数(衰亡因子)。Q 是时间 t 的函数,而 t 又可看成是时间间隔( T-T0)与 C 的比值。因此 Weng 旋回模型又可写为: (t0) T0-生命起始时刻; T-生命过程中的某时刻; x 、 C、 A-待确定的拟合系
13、数。2. Weng 旋回模型的预测结果及旋回阶段划分。预测结果: 适合于生命有限体系的描述和预测,可用于预测油气田的最终可采储量等。确定模型中的参数 x、 C、 A 后,则可用 式: 预测油气田未来产量的变化Q 的生命旋回大致分为五个阶段: (t0)加速上升阶段( );一般上升阶段( );稳定阶段 (t=xx 1/2)一般下降阶段( ); 缓慢下降阶段( )。3.历史趋势外推法的概念及所包含的曲线模型。历史趋势外推法(经验外推法、历史状态法、历史趋势法、特性曲线法):是根据探区内过去的油气勘探工作量(如勘探钻井进尺、勘探井数或勘探时间等)与其相应的油气发现量,利用统计分析方法预测探区未来油气发
14、现量的方法。曲线模型:、下降曲线模型指数下降曲线模型模型一般形式为:y=ae bx双曲线下降曲线模型一般形式为:y=ax -bx-勘探工作量(钻井进尺、探井井数或时间等);y-油气体积。根据历史资料,利用回归分析方法求出上式中参数和 a、b 的估计值后,就可用其预测未来油气发现量。、累计曲线模型由指数下降曲线积分并整理可得n、 m -已进行过的、未来增加的勘探阶段数;a 、 b-指数模型中参数,y-未来 m 个勘探阶段增加的待发现累计资源量方法的使用条件:这种方法主要适用于勘探成熟区。在没有重大意外事件打乱探区发现率总趋势的情况下,这种方法预测探区今后的油气发现量是可行的。4.油田规模序列法预
15、测油气资源量的条件及预测结果.油田规模指油田的最终可采储量;油田规模序列指含油区内的油田最终可采储量从大到小排出的序列。、使用条件:对于一个完整而独立的石油地质体系,油田规模序列法的预测效果较好)0(lnllntAttxeQCext/)0x0xbdeeynbdmnbd/)(1()1(CTteAQtx/)(08一个完整而独立的石油地质体系是指该体系内的油气生成、运移、聚集以及其后的地质变迁都是在同一石油地质演化历史条件下发生的,即含油气区内油气田(或油气藏)应具有统一的地质成因。另外,该方法适用于含油气区勘探初期至晚期。、预测结果: 油田规模序列具有下列统计分布规律: 在双对数坐标系中, 油田规
16、模的分布大致为直线,并在一定范围内呈直线递减,直 线段往往包含了油区 90%以上的储量,直线的急剧下倾, 反映油田规模随油田数目的增多而迅速下降。主要任务:根据已发现的油田规模,确定系数 k 和已知油气田在规模序列中的序号,预测未发现的油田规模及全区石油总储量。5.油田规模序列法的详细计算过程。(1)排序及选择推算点若已发现 t 个油田,按其规模(储量) Qri ( i= 1 ,2, t)由大到小进行排序,取 Qr1 作为推算点(预测油田规模序列的基准点 ),假 设 Qr1、Qri ( i1 )在油田规模预测模型中的序号分别为r1 、ri 。 (2)选择油田规模分布系数 k 若能确定已发现油田
17、中两个以上的规模序号,由于其在双对数坐标系中分布在一条直线上,因此可据其近似求出 该直线的斜率,以此确定 k 值 。 采取变换 k 值的方法,进行多次油田规模序列的拟合计算,根据预测结果和实际对比,确定最佳 k 值。因为 k0, 可令 k=-tg(90o180o )。统计表明,当 115o155o时,可较快地选择到油田规模分布系数 k。按一定步 长( 如 5o)逐次选择 k,记第 s 次选择的油田规模分布系数为 ks 。(3)确定油田规模序列的预测模型预测模型为:Qri /Qr1=(r1/ri)ks 。对于选定的 ks ,进一步确定油田规模在预测模型中的序号 r1、ri 。 确定 r1、ri
18、的具体步骤如下 计算 Ai Ai=(Qri/Qr1)1/ks (i=1,2, t) 故 r1=Airir1 是欲求的 Qr1 的序号,依次取 r1=1,2,3,并每次分别尝试取 ri , 使 t 个 Airi 均最大限度等于所取的 r1。计算矩 阵 B 中的元素:bji= Airi ( j=1,2,3,.; i=1,2,t)ri -使每个 bji 最大限度地接近矩阵 B 行号的正整数计算各行的标准偏差,若矩阵 B 中第 m 行的 小于给定的误差 , 则取 r1=m即 r1 在允许的误差范围内符合帕雷托定律。可将矩 阵 B 的第 m 行做为油田规模序列的预测行。(4)计算已发现油田规模的序号由
19、r1=Ai ri,可求得已 发现的其它油田在油田规模序列中的序号 ri (i=2,3, t)。(5)预测的最大油田规模预测的最大油田规模(储 量) 为:即:预测的最大油田规模为任一已发现油田的规模 Qri 乘以预测序号 ri 的 ks 次幂。若认为已发现的所有油田规模均可靠, 则可取:(6)计算油区内预测的油田规模序列由帕雷托定律,在已知最大 规模油田的基础上, 预测的油田 规模序列为:),21(max tirQsiktikirs1max),2,1(max pjjQskj 9p 值取决于认定的油区内最小经济油田规模(7)预测油田规模序列的循环计算对所取的多个 ks,重复(3) 、(4)、(5)、(6)步的计算,可得多个预测油田规模序列。若开始有把握确定 ks 则无须重复。若计算了 L 个预测油田规模序列,则选择标准偏差tirr LQii12/1),()(中最小者对应的序列作为最终的油田规模序列。(8)油区石油总储量由已确定的油田规模序列计算油区石油总储量: pz21