数理统计教学内容拓展探讨

|

唐 立,吴锦标

(中南大学 数学与统计学院,长沙 410012)

数理统计起源于19 世纪,成熟于20 世纪,是从实践中逐步发展起来的一门数学学科。它不仅在理学门类统计专业课程中起着核心基础的作用,数理统计还与其他学科结合,形成生物统计、经济统计等统计学派[1]。无论是理学门类的数理统计,还是与其他学科结合的数理统计,都是力求为所有的统计方法提供理论基础。近几十年来,统计学科及其应用的内容飞速地发展,我们数理统计的教学内容理应适应这一要求,不断探索与时俱进的教学内容并提升和拓展。

从文献上来看,数理统计课程教学改革一直为人们所关注。但是教学改革的研究文章中,大家主要关注的是教学手段和教学方法的改进,对数理统计教学内容提出改革的文章很少。我们这篇文章,以理学门类统计专业数理统计教学为例,针对目前数理统计教学内容中可能存在的某些不足,提出对现有教学内容的一些拓展建议,使得数理统计这门课程更好地与后续课程和统计学科发展相衔接,更好地发挥其基础课程的重要作用。目前数理统计的教学内容,除了预备知识,主要由参数估计、假设检验和方法应用三部分构成,接下来,我们主要针对这三个部分,分别探讨教学内容的拓展思路。

首先,我们来看看现在数理统计教学使用的教材情况,因为教学内容与教材是密切联系的。世界上第一本数理统计教材公认是1946 年H.克拉美编写的《统计学的数学方法》,而我国的数理统计教材在20 世纪80 年代才开始走向成熟。其中代表教材有陈希孺、倪国熙[2]编著的《数理统计学教程》,以及魏宗舒[3]编著的《概率论与数理统计教程》等。现在国内有着丰富的数理统计相关教材,为老师授课、学生学好这门课程提供了良好的条件。但是经过我们多年的教学发现,这些教材内容基本上一致,几十年来变化不大,不能完全满足统计学科发展和后续课程的要求。因此,我们有必要考虑在现有教学内容的基础上,进行一些拓展。

数理统计理论知识是围绕统计推断展开的,统计推断包含两部分内容——(非)参数估计和假设检验。从参数估计这部分内容来看,这些教材和教学内容中涉及到的样本,都是从总体中抽取的独立样本。也就是说,所有讲解的知识,都是建立在样本独立性的假设下。但是,随着统计学科的发展,目前统计专业后续课程已经越来越丰富,通常包含随机时间序列分析、随机过程、数据挖掘和大数据探索等课程。随机时间序列分析和随机过程的统计推断需要数理统计理论的支撑,这个道理是不言而喻的[4]。另外,数据挖掘和大数据探索的一些核心算法同样依赖于数理统计[5]。我们注意到,这几门后续课程中涉及到的样本数据经常是同一总体中抽取的相关数据,也就是说抽取的样本数据不是独立的。这种从同一总体中抽取的相关数据的统计推断知识,在现有的数理统计教材和教学中几乎没有提到,学生在学到这些后续课程的时候,可能会感觉到理论上有一定的跳跃。所以,我们建议探讨如何在教学内容中,适当地补充相关样本数据的数理统计知识,特别地,可以适当地补充相关数据的参数估计内容。

例如,我们可以拓展教学内容:介绍最简单情况下的相关序列的矩估计法。与独立序列的矩估计法是用样本的原点矩去估计总体的原点矩类似,这种相关序列的矩估计法,就是用样本均值和样本协方差,去估计序列理论上的均值和协方差。由此,学生可以了解到,相关序列的参数估计方法,可以由独立序列的参数估计法延拓得到。

具体地,若记相关序列{Yn}理论上的均值为μ,协方差函数为

又设抽样得到的样本数据为{yn},其样本协方差函数为

类似于现有数理统计中,独立序列的矩估计法原理,是根据样本的原点矩依概率收敛到总体的原点矩。对于最简单情况下的相关序列{Yn},同样可以证明:相关序列的样本均值n和样本协方差函数(k),分别依概率收敛到相关序列理论上的均值μ 和协方差函数γ(k),即n→∞时

针对不同层次的学生,我们可以详细或者简略地给出这些结果的证明。事实上,想要给出详细的证明,我们只需在预备知识部分,引入最简单情况下相关序列的中心极限定理和大数定律即可[6]。显然,这两个极限定理是独立序列的中心极限定理和大数定律的拓展。

可见,作为现有数理统计教学内容中独立样本数据统计推断的延拓,我们可以在参数估计等部分中,适当地拓展相关数据的理论和应用,从而进一步完善数理统计身为基础课程的功能,为学生后续课程的学习埋下伏笔,打下基础。这些拓展知识,不只是对学生后续学习有很好的启迪作用,也让学生了解到统计方法之间的联系,了解到统计理论和应用发展的历史进程。

众所周知,在参数和非参数的假设检验中,似然比检验法是个非常常用而又高效的方法,其在假设检验中的地位等价于极大似然估计法在参数估计中的地位[7]。现有的数理统计教学中,对参数估计中的极大似然估计是非常重视的,它一直是教学的一个重点内容。但是在现有的数理统计教学中,对于在假设检验中具有同等地位的似然比检验法却很少涉及。然而,学生在后续的学习和实践中,极有可能会遇到只有用似然比检验法才能较好解决的问题。所以,我们若能在数理统计这门基础课程教学中,就初步讲授这一方法,让学生留下一定的印象,后面不管是理论上还是实际中需要用到这一方法时,学生都容易想到和接受。

似然比检验法和广义似然比检验法(这里我们统称为似然比检验法)是一种业已成熟的假设检验方法,其用途非常广泛。该方法可以用于独立数据,也可以用于相关数据,可以用于参数的假设检验,也常用于非参数的假设检验。对于简单假设的检验,奈曼—皮尔逊引理证明了似然比检验是最优检验。对于非简单假设,最优检验往往不存在。而对于最优检验不存在的情形,似然比检验常常也是表现最佳的。目前数理统计教材和教学中,对于似然比检验法极少提及,只有个别教材中有基本概念和一、两个例子。为了方便学生后续的学习和实践,我们建议增强这一方面的教学内容。

例如,我们可以在参数的假设检验教学内容中,增加参数似然比检验法介绍。具体地,设总体密度函数为f(x,θ),θ∈Θ,检验参数假设为

设x1,x2,…,xn为来自该总体的一组样本,可构造似然比检验统计量为

式中:L(θ)为似然函数。

若H0成立,则上式中分子的值与分母的值应该差异不大。若H0不成立,则上式中分子的值将远大于分母的值。所以,检验的拒绝域取为

式中:c 为某个常数,使得

式中:α 为检验的显著性水平。

在目前的数理统计教学中,关于参数的假设检验,我们主要讲解了一个正态总体的均值和方差的假设检验,以及两个正态总体均值差和方差比的假设检验。这些假设检验中用到检验统计量时,都是直接给出的,没有推导它们的由来。事实上,这些检验统计量,都可以由上述的参数似然比检验统计量Λ 推导得到。所以,我们可以考虑增加一个小节的教学内容,专门介绍用似然比检验法来做所有正态总体参数的假设检验。这样,既可以使学生更加深刻地体会现有的假设检验方法,又可以让学生掌握自己构造检验统计量的一般方法。

(一)拓展的教学内容的方法应用

针对上述一、二部分拓展的教学内容,我们可以在方法应用部分进一步举例应用这些方法,以便学生更加深入地理解和掌握这些方法。

1.针对相关数据参数估计拓展内容的应用

我们可以选择将前面拓展的相关数据的参数估计方法应用到最简单的一步线性相关模型中。具体地,一步线性相关模型可以表示为

式中:已知序列{εn}独立同分布,且εn~N(0,σ2),|θ|<1,μ,σ2,θ 是未知参数。

这个模型正好与目前数理统计教学中的经典内容——一元线性回归模型相呼应。一元线性回归模型使用的是独立数据进行参数估计,而这个一步线性相关模型使用的是相关数据进行参数估计。

这时注意到该模型理论上的协方差函数为

应用前面介绍的参数估计的拓展内容,即使用相关数据参数的矩估计方法,就可以得到一步线性相关模型中未知参数的估计。也就是说,只要令一步线性相关模型中序列{Yn}的样本均值n和样本协方差(k),等于序列的理论均值μ 和协方差γ(k),就可以估计出模型中的三个未知参数μ,σ2,θ。

2.针对拓展的似然比检验法教学内容的应用

为了加强学生对似然比检验法的理解,我们可以在方法应用部分的教学中,举一个似然比检验法用于对两类模型做出选择判断的例子。具体地,我们可以利用目前数理统计教学内容中,已有的线性回归模型来举例。下面简单地介绍这个方法的应用。

式中:εi,δi独立同分布,且εi~N(0,σ2),δi~N(0,τ2),β0,β1,σ2,γ0,γ1,γ2,τ2为未知参数。

这时,似然比检验统计量取为

在H0成立的情况下,Λ 渐近服从自由度为1 的卡方分布,即Λ~χ2(1)。故在显著性水平α 下,若,则拒绝H0,即选择模型Yi=γ0+γ1xi+γ2zi+δi较合适。否则接受H0,即选择模型Yi=β0+β1xi+εi较合适。

这个例子可以让学生认识到,似然比检验法不但可以用于参数的假设检验,也可以用于非参数的假设检验,它是一个有着广泛用途的重要方法。

(二)算例的拓展

1.加强与现实社会的联系

数理统计课程教学内容偏于理论,需要通过举例说明,才能让学生真正理解和掌握这些理论和方法。目前数理统计教学中需要举例说明的地方很多,从参数估计到假设检验,再到方法应用都大量存在。从教材上来看,一般的数理统计教材上的例题和习题都有一点年代久远了,更新不多。因此,我们建议在举例说明这方面,进一步加强与现实社会的联系。这样,既有利于提高学生的学习兴趣,又能为学生理论联系实际提供训练基础。

特别地,在方法应用部分,经典的数理统计教学内容包含方差分析和回归分析两部分。这里以方差分析为例来讨论算例的拓展。现有的方差分析举例说明主要是在经济、生产等方面,实际上,该方法可以用于现实社会中各行各业的各种数据分析。比如,方差分析在医学中就有着广泛的运用,解决了很多重要的问题[8]。而这类运用,在目前数理统计教学中却鲜少提及。所以,我们可以在这里考虑拓展一些医学相关的例子。

具体地,我们可以针对某种医学实验结果数据,使用方差分析方法,找出对该实验结果影响较大的那些因素。例如,表1 所示的一组数据,是在不同的缝合方法(因素A)、不同的缝合后的时间(因素B)下,得到的一组医学实验结果。该实验结果是用神经缝合后的轴突通过率来表示的。使用方差分析法就可以得到,不同的缝合方法或者不同的缝合后的时间及它们的交互效应对实验结果,亦即轴突通过率是否有显著性影响的结论。

表1 不同缝合方法和不同缝合后时间下的轴突通过率 %

2.充分利用统计软件

数理统计目前的教学内容中几乎没有提到如何使用统计软件来实现各种方法的数据计算或者图形演示等。事实上,现在几乎所有数理统计教学内容中方法的计算,都可以借助计算机和统计软件来实现[9]。

例如,像上面提到的方差分析,在实际中都是用统计软件来实现的。因为实际中的数据往往比较多,无法用手算来实现。所以,适当地增加各种数理统计方法对应的统计软件操作介绍,有利于学生未来在实际问题中运用这些方法。

又例如,课堂上介绍某个结果时,若用统计软件演示一下这个结果,可以让学生印象更加深刻,也使知识点变得生动有趣。比方说,正态性检验中比较直观的判断方法,就是看数据的直方图和qq 图。正如图1 和图2演示的那样,我们可以在教学时使用eviews 软件来实现这一操作。

图1 和图2 分别演示的是某组数据{Wn}的直方图和qq 图。从图中可以看出,这组数据{Wn}是大致服从正态分布的。但是,只看图形来判断数据的正态性,显然是比较粗糙、不够准确的。所以,我们就自然地引导学生进一步学习更为精准、细致的方法了。

图1 某组数据{Wn}的直方图

图2 某组数据{Wn}的qq 图

可见,随着计算机和统计软件的发展,我们应该将这一部分知识适当地引入数理统计教学中,从而避免数理统计教学内容与时代的发展脱节。

综上所述,我们除了可以在现有数理统计教学内容基础上,在参数估计部分增加相关数据参数估计的内容,在假设检验部分加强似然比检验法的介绍,在方法应用部分补充前面增加的知识的运用外,我们还建议加强数理统计教学内容中各种例子与现实社会的联系,以及统计软件的使用等。

总之,我们探讨了在数理统计教学内容的主要方面:参数估计、假设检验和方法应用怎样适当地拓展,以适应统计学科的发展和后续课程的需求。不断调整和拓展现有的数理统计教学内容是一项必须而又重要的工作,我们这里只是做了一点初步的探讨,抛砖引玉,希望与大家一起交流,共同促进数理统计教学的发展。

猜你喜欢 假设检验检验法数理统计 线上线下混合教学模式在概率论与数理统计课程中的应用大学教育(2022年3期)2022-05-16数学实验在概率论与数理统计中的教学应用内蒙古教育(2021年2期)2021-02-12假设检验结果的对立性分析现代职业教育·高职高专(2020年1期)2020-08-16梧州市高温事件气候特征分析现代农业科技(2019年19期)2019-11-21国际法中的“反事实推理”:作用与局限现代法学(2018年1期)2018-02-02统计推断的研究时代金融(2017年6期)2017-03-25论TRIPS协议中“三步检验法”存废之争和解决途径暨南学报(哲学社会科学版)(2016年11期)2016-11-26概率统计教学中培养学生创新思维和实践能力的探索与实践考试周刊(2016年38期)2016-06-12凤爪重量质量管理报告商场现代化(2016年11期)2016-05-20基于改进隐马尔科夫模型的畜禽全基因组关联分析中的多重检验方法安徽农学通报(2015年10期)2015-06-15

推荐访问:教学内容 数理 拓展