在数学建模过程中,常常需要确定一个变量依存于另一个或更多的变量的关系,即函数。但实际上确定函数的形式(线性形式、乘法形式、幂指形式或其它形式)时往往没有先验的依据。只能在收集的实际数据的基础上对若干合乎理论的形式进行试验,从中选择一个最能拟合有关数据,即最有可能反映实际问题的函数形式,这就是统计学中的拟合回归方程问题。
下面先看一个例子。
例 “人口问题”是我国最大社会问题之一,估计人口数量和发展趋势是我们制定一系列相关政策的基础。有人口统计年鉴,可查的我国从1949年至1994年人口数据智料如下:
| 年份 | 1949 | 1954 | 1959 | 1964 | 1969 | 1974 | 1979 | 1984 | 1989 | 1994 |
| 人口数 (百万) | 541.67 | 602.66 | 672.09 | 704.99 | 806.71 | 908.59 | 975.42 | 1034.75 | 1106.76 | 1176.74 |
分析:
(1)在直角坐标系上作出人口数的图象。
(2)估计出这图象近似地可看做一条直线。
(3)用以下几种方法(之一)确定直线方程,并算出1999年人口数。
方法一:先选择能反映直线变化的两个点,如(1949,541.67),(1984,1034.75)二点确定一条直线,方程为 N = 14.088 t –26915.842 代入t =1999,得N »12.46亿
方法二:可以多取几组点对,确定几条直线方程,将t = 1999代入,分别求出人口数,在取其算数平值。
方法三:可采用“最小二乘法”求出直线方程。
最 小 二 乘 法
设(x 1, y 1 ),(x 2, y 2), …, (x n, y n)是直角平面坐标系下给出的一组数据,若x 1<x2<…<x n,我们也可以把这组数据看作是一个离散的函数。根据观察,如果这组数据图象“很象”一条直线(不是直线),我们的问题是确定一条直线y = bx +a ,使得它能"最好"的反映出这组数据的变化。
对个别观察值来说,它可能是正的,也可能是负的。为了不使它们相加彼此抵消,故"最好"应该是

Mathematical Modeling
