数据统计与预测模型
数据资料是数学模型与实际问题接轨的重要途径和手段,有时还可以直接从数据资料中发现规
律组建模型。数据分析和处理是统计学研究的主要内容,也是计算数学的工作领域,近年来随
着计算机科学的发展,对“海量”数据的分析形成了一门新的交叉学科“数据挖掘”。这一章仅
介绍用统计学的最小二乘法构造拟合数据模型,以及用计算数学的函数插值方法处理数据解决
实际问题。
一. 数据资料与数学模型
1 数据资料 数据资料是在实际问题中收集到的观测数值,是组建数学模型的重要依据和检验
数学模型的重要标准。
数据获取 年鉴报表、学术刊物、网络资源、实验观测等等
数据误差 观测数据中一般都包含有误差。正确对待和处理这些误差是数学建模中不可回避的问
题.
系统误差:偏差,来自于系统,有规律,可避免。
随机误差:无偏,来自随机因素,无规律,不可免
2. 资料与模型
1
0
. 数据资料可以直接应用于数学模型的组建。对于情况较复杂的实际问题(因素不易化
简,作用机理不详)可直接由数据寻找简单的因果变量之间的数量关系,从而对未知的情形作
预报。这样组建的模型为拟合模型。在统计学中有大量的利用数据组建的模型:判别模型、主
成分模型、聚类模型、因子模型、趋势面模型、时间序列模型等。
2°模型的设计、参数估计都依赖于现有的和可能获得的数据资料。当数据资料不全时,数
值分析的插值技术就将发挥作用。如信号和图像处理领域就广泛应用插值技术。
二. 拟合模型
拟合模型的组建是通过对有关变量的观测数据的观察、分析,选择恰当的数学表达方式得
到的。拟合模型主要是探讨变量间的内在规律,分析的数据具有明显的随机误差。模型侧重于
选择规律的简单的数学表达。在简单的数学表达式中选择拟合效果好的。因此,在数据拟合的
精度和数学表达式简化程度之间要取一个折中。折中方案的选择将取决于实际问题的需要。
例 4.1 人口预测
1949 年—1994 年我国人口数据资料如下:
年 份 x
i
49 54 59 64 69 74 79 84 89 94
人口数 y
i
5.4 6.0 6.7 7.0 8.1 9.1 9.8 10.3 11.3 11.8
建模分析我国人口增长的规律, 预报 1999、2005 年我国人口数。
建模分析步骤:
1. 在坐标系上作观测数据的散点图。
2. 根据散点分布的几何特征提出模型
3. 利用数据估计模型的参数
4. 计算拟合效果
散点图
1