为了了解我校初中三年级300名男生的身体发育情况,从中抽测了20名男生的身高,结果如下(单位:cm):175161171176167181161173171177179172165157173173166177169181(1)这20名男-七年级数学

首页 > 考试 > 数学 > 初中数学 > 平均数/2019-04-13 / 加入收藏 / 阅读 [打印]

题文

为了了解我校初中三年级300名男生的身体发育情况,从中抽测了20名男生的身高,结果如下(单位:
cm):
175 161 171 176 167 181 161 173 171 177
179 172 165 157 173 173 166 177 169 181
(1)这20名男生身高的最大值、最小值、极差、平均数分别是多少?
(2)将这20名男生身高分成下面5组,分别计算各组的频数;
(3)根据上表,作出频数分布直方图和频数分布折线图。
题型:解答题  难度:中档

答案

(1)181;157;24;171.25; (2)“略”;(3)“略”

据专家权威分析,试题“为了了解我校初中三年级300名男生的身体发育情况,从中抽测了20名..”主要考查你对  平均数,极差,频数与频率,直方图,折线图  等考点的理解。关于这些考点的“档案”如下:

平均数极差频数与频率直方图折线图

考点名称:平均数

  • 平均数:
    是指在一组数据中所有数据之和再除以数据的个数。平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标。
    解答平均数应用题的关键在于确定“总数量”以及和总数量对应的总份数。
    在统计工作中,平均数(均值)和标准差是描述数据资料集中趋势和离散程度的两个最重要的测度值。

  • 平均数的分类:
    (1)算术平均数:一般地,如果有n个数 ,那么 ,叫做这n个数的算术平均数。
    (2)加权平均数:一组数据点的权分别为,那么称为这n个数的加权平均数。
    (3)样本平均数:样本中所有个体的平均数。
    (4)总体平均数:总体中所有个体的平均数,统计学中常用样本的平均数估计总体的平均数。

  • 平均数、中位数和众数关系:
    联系:
             平均数、中位数和众数都是来刻画数据平均水平的统计量,它们各有特点。对于平均数大家比较熟悉,中位数刻画了一组数据的中等水平,众数刻画了一组数据中出现次数最多的情况。
            平均数非常明显的优点之一是,它能够利用所有数据的特征,而且比较好算。另外,在数学上,平均数是使误差平方和达到最小的统计量,也就是说利用平均数代表数据,可以使二次损失最小。因此,平均数在数学中是一个常用的统计量。但是平均数也有不足之处,正是因为它利用了所有数据的信息,平均数容易受极端数据的影响。
             例如,在一个单位里,如果经理和副经理工资特别高,就会使得这个单位所有成员工资的平均水平也表现得很高,但事实上,除去经理和副经理之外,剩余所有人的平均工资并不是很高。这时,中位数和众数可能是刻画这个单位所有人员工资平均水平更合理的统计量。
            中位数和众数这两个统计量的特点都是能够避免极端数据,但缺点是没有完全利用数据所反映出来的信息。
            由于各个统计量有各自的特征,所以需要我们根据实际问题来选择合适的统计量。
            当然,出现极端数据不一定用中位数,一般,统计上有一个方法,就要认为这个数据不是来源于这个总体的,因而把这个数据去掉。比如大家熟悉的跳水比赛评分,为什么要去掉一个最高分、一个最低分呢,就认为这两个分不是来源于这个总体,不能代表裁判的鉴赏力。于是去掉以后再求剩下数据的平均数。需要指出的是,我们处理的数据,大部分是对称的数据,数据符合或者近似符合正态分布。这时候,均值(平均数)、中位数和众数是一样的。

    区别:
            只有在数据分布偏态(不对称)的情况下,才会出现均值、中位数和众数的区别。所以说,如果是正态的话,用哪个统计量都行。如果偏态的情况特别严重的话,可以用中位数。
             除了需要刻画平均水平的统计量,统计中还有刻画数据波动情况的统计量。比如,平均数同样是5,它所代表的数据可能是1、3、5、7、9,可能是4、4.5、5、5.5、6。也就是说5所代表的不同组数据的波动情况是不一样的。怎样刻画数据的波动情况呢?很自然的想法就是用最大值减最小值,即求一组数据的极差。数学中还有方差、标准差等许多用来刻画数据特征的统计量。当然这些都是教师感兴趣、值得了解的内容,不是小学数学的教学要求。

  • 平均数的求法:
    (1)公式法:
    (2)加权平均数公式: 。

考点名称:极差

  • 极差:
    全距,又称极差,是用来表示统计资料中的变异量数,其最大值与最小值之间的差距;
    即最大值减最小值后所得之数据。
    极差是指总体各单位的标志值中,最大标志值与最小标志值之差。它是标志值变动的最大范围。极差也称为全距或范围误差,它是测定标志变动的最简单的指标。换句话说,也就是指一组数据中的最大数据与最小数据的差叫做这组数据的极差。 极差英文为range ,简写为R,表示为:R=Xmax-Xmin。移动极差(Moving Range)是其中的一种。

  • 极差特点:
    刻画数据离散程度的最简单的统计量;
    计算简单;
    不能反映中间数据的分散状况。

    移动极差:
    是指两个或多个连续样本值中最大值与最小值之差,这种差是按这样方式计算的:
    每当得到一个额外的数据点时,就在样本中加上这个新的点,同时删除其中时间上“最老的”点,然后计算与这点有关的极差,因此每个极差的计算至少与前一个极差的计算共用一个点的值。一般说来,移动极差用于单值控制图,并且通常用两点(连续的点)来计算移动极差。

    计算公式:
    极差=最大值-最小值。
    全距=最大标志值—最小标志值
    R=Xmax-Xmin
    (其中,Xmax为最大值,Xmin为最小值)
    例如 :12 12 13 14 16 21
    这组数的极差就是 :21-12=9
    例如,“早穿皮袄午穿纱”,这句话说明的气温特征数就是极差。
    方差计算公式:s2=(1/n)×[(x1-x0)2 + (x2-x0)2 +...+ (xn-x0)2](x0即为x的平均值)

  • 极差用途:
    在统计中常用极差来刻画一组数据的离散程度,以及反映的是变量分布的变异范围和离散幅度,在总体中任何两个单位的标准值之差都不能超过极差。同时,它能体现一组数据波动的范围。极差越大,离散程度越大,反之,离散程度越小。
    极差只指明了测定值的最大离散范围,而未能利用全部测量值的信息,不能细致地反映测量值彼此相符合的程度,极差是总体标准偏差的有偏估计值,当乘以校正系数之后,可以作为总体标准偏差的无偏估计值,它的优点是计算简单,含义直观,运用方便,故在数据统计处理中仍有着相当广泛的应用。 但是,它仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响。 

考点名称:频数与频率

  • 频数:一般我们称落在不同小组中的数据个数为该组的频数。
    频率:频数与数据总数的比值为频率。频率反映了各组频数的大小在总数中所占的分量。

  • 频数
    在一组依大小顺序排列的测量值中,当按一定的组距将其分组时出现在各组内的测量值的数目。
    如有一组测量数据,数据的总个数N=148最小的测量值xmin=0.03,最大的测量值xmax=31.67,按组距为△x=3.000将148个数据分为11组,其中分布在15.05~18.05范围内的数据有26个,则称该数据组的频数为26。

    频率
    如在314159265358979324中,‘9’出现的频数是3,出现的频率是3/18=16.7%
    频数也称“次数”,对总数据按某种标准进行分组,统计出各个组内含个体的个数。而频率则每个小组的频数与数据总数的比值。
    在变量分配数列中,频数(频率)表明对应组标志值的作用程度。
    频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。

考点名称:直方图

  • 频数分布直方图的定义:
    在统计数据时,按照频数分布表,在平面直角坐标系中,横轴标出每个组的端点,纵轴表示频数,每个矩形的高代表对应的频数,称这样的统计图为频数分布直方图。
    相关概念:
    组数:在统计数据时,我们把数据按照不同的范围分成几个组,分成的组的个数称为组数。
    组距:每一组两个端点的差。

  • 频数分布直方图的特点:
    ①能够显示各组频数分布的情况;
    ②易于显示各组之间频数的差别。

    作直方图的目的有:
    作直方图的目的就是通过观察图的形状,判断生产过程是否稳定,预测生产过程的质量。
    1判断一批已加工完毕的产品;
    搜集有关数据。
    直方图将数据根据差异进行分类,特点是明察秋毫地掌握差异。
    2在公路工程质量管理中,作直方图的目的有:
    ①估算可能出现的不合格率;
    ②考察工序能力估算法
    ③判断质量分布状态;
    ④判断施工能力;

  • 直方图绘制注意事项:
    a. 抽取的样本数量过小,将会产生较大误差,可信度低,也就失去了统计的意义。因此,样本数不应少于50个。
    b. 组数 k 选用不当,k 偏大或偏小,都会造成对分布状态的判断有误。
    c. 直方图一般适用于计量值数据,但在某些情况下也适用于计数值数据,这要看绘制直方图的目的而定。
    d. 图形不完整,标注不齐全,直方图上应标注:公差范围线、平均值 的位置(点画线表示)不能与公差中心M相混淆;图的右上角标出:N、S、C p或 CPK.

  • 制作频数分布直方图的方法:
    ①集中和记录数据,求出其最大值和最小值。数据的数量应在100个以上,在数量不多的情况下,至少也应在50个以上。 我们把分成组的个数称为组数,每一个组的两个端点的差称为组距。
    ②将数据分成若干组,并做好记号。分组的数量在5-12之间较为适宜。
    ③计算组距的宽度。用最大值和最小值之差去除组数,求出组距的宽度。
    ④计算各组的界限位。各组的界限位可以从第一组开始依次计算,第一组的下界为最小值减去最小测定单位的一半,第一组的上界为其下界值加上组距。第二组的下界限位为第一组的上界限值,第二组的下界限值加上组距,就是第二组的上界限位,依此类推。
    ⑤统计各组数据出现频数,作频数分布表。
    ⑥作直方图。以组距为底长,以频数为高,作各组的矩形图。

    应用步骤:
    (1)收集数据。作直方图的数据一般应大于50个。
    (2)确定数据的极差(R)。用数据的最大值减去最小值 求得。
    (3)确定组距(h)。先确定直方图的组数,然后以此组数去除极差,可得直方图每组的宽度,即组距。组数的确定要适当。组数太少,会引起较大计算误差;组数太多,会影响数据分组规律的明显性,且计算工作量加大。
    (4)确定各组的界限值。为避免出现数据值与组界限值重合而造成频数据计算困难,组的界限值单位应取最小测量单位的1/2。分组时应把数据表中最大值和最小值包括在内。
    第一组下限值为:最小值-0.5;
    第一组上限值为:第一组下限值加组距;
    第二组下限值就是第一组的上限值;
    第二组上限值就是第二组的下限值加组距;
    第三组以后,依此类推定出各组的组界。
    (5)编制频数分布表。把多个组上下界限值分别填入频数分布表内,并把数据表中的各个数据列入相应的组,统计各组频数据(f )。
    (6)按数据值比例画出横坐标。
    (7)按频数值比例画纵坐标。以观测值数目或百分数表示。
    (8)画直方图。按纵坐标画出每个长方形的高度,它代表取落在此长方形中的数据数。(注意:每个长方形的宽度都是相等的。)在直方图上应标注出公差范围(T)、样本容量(n)、样本平均值(x)、样本标准偏差值(s)和x的位置等。

考点名称:折线图

  • 定义:
    用一个单位长度表示一定的数量,根据数量的多少描出各点,然后用线段把各点顺次连接起来。
    折线统计图不但可以表示项目的具体数量,又能清楚地反映事物变化的情况。

  • 折线图特点:
    易于显示数据的变化的规律和趋势。可以用来作股市的跌涨和统计气温。

    折线图具有下列图表子类型:

    折线图和带数据标记的折线图 折线图用于显示随时间或有序类别而变化的趋势,可能显示数据点以表示单个数据值,也可能不显示这些数据点。
    在有很多数据点并且它们的显示顺序很重要时,折线图尤其有用。如果有很多类别或者数值是近似的,则应该使用不带数据标记的折线图。

  • 几种折线图区别:
    堆积折线图和带数据标记的堆积折线图:
    堆积折线图用于显示每一数值所占大小随时间或有序类别而变化的趋势,可能显示数据点以表示单个数据值,也可能不显示这些数据点。如果有很多类别或者数值是近似的,则应该使用无数据点堆积折线图。
    提示:为更好地显示此类型的数据,您可能要考虑改用堆积面积图。

    百分比堆积折线图和带数据标记的百分比堆积折线图:
    百分比堆积折线图用于显示每一数值所占百分比随时间或有序类别而变化的趋势。

    三维折线图:三维折线图将每一行或列的数据显示为三维标记。
    三维折线图具有可修改的水平轴、垂直轴和深度轴。

  • 制作折线图的步骤:
    (1)根据统计资料整理数据;
    (2)作平面直角坐标系,横轴、纵轴都标上单位长度,取长适当;一般横轴表示时间(或先后次数),纵轴表示时间序列数据;
    (3)根据数据描点。并按先后顺序将点用折线连接起来。

  • 折线图制作技巧:
    1.“字体”的处理
    建议:取消图表的字体“自动缩放”功能,这样可防止在变动图表大小时,图表项的字体发生不必要的改变。
    取消所有图表项的“自动缩放”功能,要取消所有图表项的字体“自动缩放”功能,取消图表区的“字体缩放“功能即可。可通过双击图表区,并调出“图表区格式”对话框,切换到“字体”选项卡,取消“自动缩放”前面的复选框的选择,这样便是取消了所有图表项的字体缩放功能,然后分别对各图表项的字体按需要设定字体大小。
    2.“网格线”的处理
    使用“折线图”或“散点图”时,尤其要注意淡化网格线对数据系列的影响,可取消网格线或是将其设为虚线,并改为浅色。
    3. 数据系列格式的设置
    一般不使用默认的格式设置,根据自己的需求改变“线形“或是“数据标记”及“填充”。