截图
简介
这是统计学ppt作品,包括了总论,统计调查,统计资料整理,综合指标,动态数列分析,指数,相关与回归分析,抽样推断,综合复习,习题解答等内容,欢迎点击下载。
统计学ppt作品是由红软PPT免费下载网推荐的一款课件PPT类型的PowerPoint.
学习统计学的目的和要求:在理解基本概念的基础上,掌握统计资料的搜集、整理以及分析的方法。重点掌握抽样推断、动态分析、指数分析、相关与回归分析方法。建议教学参考书或资料: 1、黄良文主编:《社会经济统计学原理》,中国统计出版社; 2、陈允明主编:《国民经济统计学概论》,中国人大出版社; 3、宋文力 胡 波编著《统计学教程》,经济管理出版社; 4、中国统计信息网:http://www.stats.gov.cn 统计学内容第一章 总论第二章 统计调查第三章 统计资料整理第四章 综合指标第五章 动态数列分析第六章 指数第七章 相关与回归分析第八章 抽样推断第九章 综合复习第十章 习题解答 返回第一章 总论通过本章学习要求学生了解统计学产生与发展的历史,明确统计学的涵义、研究对象等一些基本问题,重点理解统计学中的几个基本概念。第一节 统计学的产生和发展第二节 统计学的基本问题第三节 统计学中的几个基本概念 返回第一节 统计学的产生与发展一、统计实践活动的产生与发展 二、古典统计学时期(十七世纪至十八世纪) 三、近代统计学时期(十八世纪末至十九世纪末) 四、现代统计学时期(二十世纪初至今) 返回 一、统计实践活动的产生与发展 统计实践活动产生于奴隶社会,当时的统治阶级为了对内统治和对外战争,需要征兵征税,开始了人口、土地和财产的统计。封建社会末期,特别是进入资本主义社会以后,社会生产力迅速发展,统计逐步成为社会分工中的一个独立的部门和专业。同时欧洲出现了一些统计理论著作,标志着统计学的产生。统计学产生后形成不同的学派。 返回 二、古典统计学时期(十七世纪至十八世纪) 1、 政治算术学〈1〉 创始人:威廉·配第 〈2〉产生的背景:当时的英国统治阶级为了管理国家、发展经济、争夺世界霸权,需要了解国内外的社会经济状况,于是在英国产生了政治算术学派。〈3〉研究方法:从数量方面研究社会经济现象。 2、 国势学派〈1〉创始人:海尔门·康令 〈2〉产生的背景:当时的德国正处于封建制度解体的时期,统治者要了解国内外的政治经济情况,决定国策,在当时封建制的德国产生了国势学派。 〈3〉研究方法:对国家重要事项的记述,几乎完全偏重于品质方面而忽视了量的分析。 返回三、近代统计学时期(十八世纪末至十九世纪末) 1、数理统计学派〈1〉创始人:阿道夫·凯特勒〈2〉产生的背景:当时资本主义国家的自然科学有了很大发展,促使英美统计学界尝试用研究自然的方法研究社会经济现象,并引入概率论,产生了数理统计学派. 〈3〉研究方法:用大数定律从社会经济现象复杂不定的偶然性中寻找其规律性。 2 、社会统计学派(1)创始人:德国的克尼斯 (2)产生的背景:实现了统一的德国,为了发展资本主义、争夺殖民地和海外市场,迫切需要掌握国内外大量的国民经济统计资料,以揭示社会经济现象的规律性,于是在德国形成了社会统计学派。 (3) 研究方法:在对统计资料进行搜集、整理、分析的基础上,明确现象内部的联系和规律性。四、现代统计学时期(二十世纪初至今) (数理统计学和社会统计学) 1、数理统计学 这一时期的数理统计学,在深度和广度上都有了迅速的发展,出现了新的分支和边缘科学,成为现代统计学的主流学派。 2、 社会统计学 这一时期的社会统计学也有所发展,其基本趋势是由实质性科学向方法论科学的转变,但相对缓慢。 3、 社会经济统计学 在德国社会统计学的影响下,以前苏联为首的社会主义国家逐步建立和发展了社会经济统计学。其理论和方法曾成功地应用于社会主义的计划经济分析。然而由于当时国际意识形态上的对立,这些国家用武断的方法解决学术上的争议,使得统计科学没有按照科学自身的规律不断进步,因此发展缓慢。 4、 中国的统计学 新中国成立后,输入了苏联的社会经济统计学,虽然曾经发挥了重要作用,但同样进步迟缓。八十年代以后,统计进入了全面改革的新时期,统计方法更加丰富、应用更加广泛,统计学得到了很大的发展。 返回 第二节 统计学的基本问题一、统计学的涵义 统计资料:以文字、图表等形式显示出来,用来说明事物的现状、事物之间的内在联系以及未来发展趋势的数据。 统计工作:统计工作者搜集、整理、计算分析或推断统计资料的工作过程。 统计学:是一门研究搜集、整理、分析或推断统计资料的方法论性质的科学。 返回 二、统计学的研究对象和性质统计学的研究对象是社会现象和自然现象的数量方面。就性质而言,统计学是一门适用于自然现象和社会现象的方法论学科。三、统计学的内容 (一)描述统计学 研究如何搜集、加工处理、显示及计算分析数据的方法。 (二)推断统计学 研究如何根据样本数据推断总体数量特此的方法。 四、统计学与其他学科的关系 (一)统计学与数学的关系 1、 统计学与数学的联系表现在统计方法以数学知识为基础。其共同点是两者都为各学科提供研究和探索客观规律的数量方法。 2、 统计学与数学的区别表现在两方面,一是统计研究的量是有计量单位的具体的量,而数学研究的量是没有量纲的抽象的量。二是统计学与数学研究中所使用的逻辑方法不同,统计研究是演绎与归纳的结合,而数学所使用的是纯粹的演绎。(二)统计学与其他学科的关系 统计方法是一种数量分析工具,它可以帮助其他学科探索各学科内在的数量规律性。但是对这种数量规律性的解释只能由各学科的研究完成。 返回 第三节 统计学中的几个基本概念一、总体与总体单位二、标志三、指标四、变量 返回 一、总体与总体单位(总体) (一) 总体 1、 概念 总体是在同一性质基础上结合起来的许多个别事物的整体。 2、 种类(1)有限总体:总体中的单位数是有限的。(2)无限总体:总体中的单位数是无限 3、总体的特点(1)同质性:构成总体的各个单位至少具有某种相同的性质。构成全国所有油田这个总体的各个单位经济职能是相同的,都是进行原油生产和加工的。(2)大量性:总体是由许多单位组成的,仅仅个别或少数单位不能形成总体。全国所有油田构成的总体,是由许多油田而不是个别油田组成。(3)差异性:构成总体的各个单位在诸多方面是不同的。全国所有油田构 成的总体,虽然经济职能相同,但各油田的规模大小、经济效益、职工人数等是不同的。统计研究就是在大量性和同质性的基础上研究总体的差异性的。 (二) 总体单位 构成总体的各个单位称为总体单位。 (三) 总体与总体单位不是固定的 随着研究目的和范围地改变,原来的总体(总体单位)可以变为总体单位(总体)。 返回 二、标志 1、 概念。标志是说明总体单位特征的名称。 2、 种类(1)品质标志:说明总体单位质的特征,不能用数值表示。如果总体单位是一位学生,性别、籍贯、是否近视等是品质标志。(2)数量标志:说明总体单位量的特征,是用数值表示的。年龄、身高、以百分制表示的学习成绩等是学生这个总体单位的数量标志 返回三、指标 (一)概念。指标是说明总体数量特征的名称及数值。(二) 种类 1、数量指标:反映总体绝对数量多少的指标。全国所有的人口组成一个总体,2002年末全国总人口128453万人,是一个数量指标。全国所有的工业企业组成一个总体,2002年国内生产总值102398亿元是一个数量指标。其特点是指标数值随总体范围的扩大(缩小)而增大(减小)。 2、质量指标:说明总体内部数量关系和总体一般水平的指标,一般表现为相对数和平均数。全国所有的人口组成一个总体,2002年全国人口出生率、性别比例、平均年龄是质量指标。其特点是指标数值大小不随总体范围的变化而增减。 (三)指标体系 1、 概念具有内在联系的一系列指标构成的整体称为指标体系。 2、 表现形式(1)以数学公式表现出来的指标体系,如:销售额 = 销售量×销售价格(2)指标之间仅存在一种间接的相互依存关系,如衡量企业经济效益的若干指标所构成的指标体系。 返回 (四) 指标与标志的关系 1、 区别:(1)指标是说明总体特征的,标志是说明总体单位特征的。(2)指标都是用数值表示的,标志有用数值表示的和不用数值表示的。 2、 联系:(1)综合关系,指标数值是总体单位的数量值综合而来的。(2)转换关系,由于研究目的或范围的变化,原来的总体(总体单位)变成总体单位(总体),相应的指标(标志)就变成标志(指标) 四、变量 1、 概念变量是可变的数量标志。 2、 种类(1)按数值表现形式的不同,有只能用整数表示的离散型变量(人数、企业数等)和可以取任意小数的连续型变量(销售额、身高等)。(2)按变量所受影响因素的不同,有影响因素是明确的,可以解释的确定性变量和影响因素是不确定的随机变量。 返回 返回 第二章 统计调查第一节 统计调查方式第二节 统计调查的具体方法第三节 统计调查方案 返回 第一节 统计调查方式 一、统计报表 (一) 概念:统计报表是按照国家有关法规的规定,自上而下统一布置,自下而上地逐级提供基本统计数据的一种调查方式。(二) 种类:1、按报送范围不同,有要求调查对象中每个单位都填报的全面报表和只要求调查对象中的一部分单位填报的非全面报表。2、按报送的周期不同,有日报、月报、季报、年报等。3、按报表的内容和性质不同,有国家统计报表、部门统计报表、地方统计报表。 二、普查 (一) 概念:普查是为某一特定目的而专门组织的一次性全面调查。(二) 特点:1、普查通常是一次性或周期性的。 2、普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏。标准时间一般定在调查对象比较集中,变动相对较小的时间上。 3 普查数据一般比较准确,规范化程度也较高。 4、 普查的适用对象比较狭窄,只能调查一些最基本、最一般的现象。 三、抽样调查抽样调查是从总体中随机抽取一部分单位进行调查,根据其调查结果推断总体数量特征的一种非全面调查方法。四、重点调查重点调查是从全部单位中选择少数重点单位进行调查,以了解总体的基本情况。五、典型调查是从研究对象的全部单位中选择一个或几个少数有代表性的单位进行全面深入的调查,用来揭示同类事物的本质规律性。 返回 第二节 统计调查的具体方法一、观察法调查者通过实际观察事情发生的经过和结果,得到自己所需要的资料。二、询问法调查者采用各种询问的方式向被调查者了解情况的一种方法。有(1)面谈询问法(2)邮寄法(3)留置问卷法(4)电话法三、实验法控制一个或几个变量,调查另外一个市场变量有关资料的方法。四、报告法被调查单位按照统一要求和表格形式,向有关部门提供统计资料的方法。 返回 第三节 统计调查方案 一、确定调查目的调查研究所要达到的具体目标,解决的问题,具有的社会经济意义。二、确定调查对象、调查单位和报告单位(1)调查对象:根据调查目的所确定的调查研究的总体。(2)调查单位:构成调查对象的每个单位。(3)报告单位:负责报告调查内容的单位。 返回 三、确定调查内容调查内容一般调查表或问卷的形式出现。(1)调查表有单一表和一览表。(2)问卷是一种特殊的调查表,其内容是由一系列问句所构成的。问卷通常由说明词、主题问句、作业记录三部分组成。其中主题问句中的问句有开放式、对选式、多项选择式、顺位式等形式。四、确定调查时间包括时期资料所属的时期、时点资料所属的时点和调查工作的期限。五、其他事项包括调查所采用的方法、组织和实施的具体细则等事项。 返回 返回第三章 统计资料整理 通过本章的学习了解对原始资料进行加工的基本方法,重点掌握统计分组的方法和次数分布表的编制。第一节 统计资料的预处理第二节 统计分组第三节 次数分布第四节 统计表 返回第一节 统计资料的预处理第二节 统计分组 一、按分组标志个数不同 1、简单分组 2、复合分组二、按分组标志性质不同 1、按品质标志分组 2、按数量标志分组 返回 一、按分组标志个数不同 1、简单分组把总体只按一个标志分组。 2、复合分组对同一总体选择两个或两个以上标志层叠起来进行分组。例如,可以 同时选择学科、学制、 性别三个标志对某学院全体在校学生这个总体 进行分组。 返回 举例: 理科学生组 文科学生组 本科学生组 本科学生组 男学生组 男学生组 女学生组 女学生组 专科学生组 专科学生组 男学生组 男学生组 女学生组 女学生组 二、按分组标志性质不同(一)按品质标志分组(二)按数量标志分组 1、单项式分组:一个变量值表示一个组的分组。适用于离散型变量 且变量的取值不多。例如,职工家 庭人口数,其取值不可能很多,且 每一个取值都可视为一种类型: 2、组距式分组凡是用一定范围内的两个变量值表示一个组的分组。适用于连续型变量或虽为离散型变量但取值很多,不便一一列举的情况。 1)连续型变量的组距式分组 如对商店按销售额进行分组 : 2)离散型变量的组距式分组 如对某企业的20生产小组按人数分组: 3)组距式分组中的有关问题(1)等距分组和异距分组(2)开口组和闭口组(3)上限、下限、组距 (4) (闭口组) (缺上限的开口组) (缺下限的开口组) 返回第三节 次数分布一、次数分布的概念在统计分组的基础上将总体的所有单位按组归类,并把所有的组及其单位数按一定顺序排列起来,用以反映总体单位在各组的分布状况。二、次数分布的表示(一)列表法(二)图示法三、次数分布的主要类型四、次数分布的编制 返回二、次数分布的表示 (一)列表法 1、某高校学生性别分布表 2、某厂工人日产量分布表 3、某班学生按考试成绩分组 (二)图示法 1、直方图 (1)单式直方图 2002年我国旅客周转量(亿人公里) (2)复式直方图 1998—2002年我国进出口总额(亿美元) 2、折线图 3、曲线图三、次数分布的主要类型 1、钟型分布 (1)对称的钟型分布 (2)左偏分布 (3)右偏分布 3、J型分布(1) J型分布(2)四、次数分布的编制例如,某生产车间50名工人日加工零件数如下: 117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121 编制过程首先,对上面的数据进行排序 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139 第二步,确定组数和组距 组数=4 组距可以根据(最大值-最小值)÷组数=8来确定,组距=10 第三步,计算各组次数、频率及累计次数、频率 50名工人日产零件数次数分布表 第四节 统计表一、统计表的结构(一)外形结构:总标题、横标题、纵标题、数字资料(二)内容结构:主词、宾词 二、统计表的种类(一)简单表(二)分组表(三)复合表 返回 一、统计表的结构 我国2002年国内生产总值二、统计表的种类 (一)简单表1、我国三个城市的人口数(1990年7月1日0时) 2、我国1998-2002拥有电话户数(万户) (二)分组表(见表的结构) 返回 (三)复合表 某年末某地区人口资料 第四章 综合指标通过本章的学习,要求学员在理解总量指标、相对指标、平均指标、变异指标概念的基础上,重点掌握各种指标的计算方法。第一节 总量指标第二节 相对指标第三节 平均指标第四节 变异指标 返回第一节 总量指标一、总量指标的概念总量指标是反映总体的总规模和总水平的综合指标。二、总量指标的计量单位 三、总量指标的种类(一)按其所反映的内容不同1、总体单位总量指标:反映总体中单位数多少的。2、总体标志总量指标:是反映总体中某种数量标志值总和的。(二)按其所反映的时间状况不同1、时期指标:反映现象在某一段时期内的总量。2、时点指标:反映现象在某一时刻上的总量。(三)按计量单位的不同1、实物量指标2、价值量指标3、劳动量指标 返回第二节 相对指标一、相对指标的概念二、相对指标的表现形式三、相对指标的种类及计算(一)结构、比例相对指标(二)比较、动态相对指标(三)强度相对指标(四)计划完成相对指标 返回 一、相对指标的概念用对比的方法反映某些相关事物之间数量联系程度的指标。二、相对指标的表现形式(一)名数(二)无名数 1、系数和倍数 2、成数 3、百分数 4、千分数 返回三、相对指标的种类及计算(结构、比例) (五)强度相对指标 1、基本公式 2、作用(1)反映现象的强弱程度 如: (2)反映现象的密度 如: (3)反映现象的经济效益 如: 返回(六)计划完成相对指标 1、基本公式 2、短期计划的检查(1)计划任务数为绝对数 某企业计划规定本年度销售收入达到1000万元,实际为950万元,计划完成相对指标为 (2)计划任务数为平均数 某企业计划某种产品单位成本为50元,实际为45元,计划完成相对指标为 (3)计划数为相对数 某企业计划劳动生产率今年比去年提高10%,实际提高了15%。计划完成相对指标为 (正指标) 某企业计划某种产品成本今年比去年降低5%,实际降低了6%。计划完成相对指标为 (逆指标) 3、中长期计划任务的检查(1)水平法:当计划任务是以计划期期末(最后一年)应达到的水平下达的,检查计划执行情况用水平法。 确定提前完成计划的时间:如果计划期内有连续一年的实际数,达到计划规定最后一年应达到的水平,后面所余的时间就是提前完成计划的时间。 (2)累计法当计划任务是以计划期全期累计应达到的水平下达的,检查计划执行情况用累计法。 确定提前完成计划的时间:从计划期开始至某一时间所累计完成的实际数达到了计划规定的累计数,以后的时间就是提前完成计划的时间。 返回 第三节 平均指标平均指标(平均数)是反映现象的一般水平或平均水平的指标。它具有代表性和抽象性。根据掌握资料、研究目的及现象性质不同,有多种计算方法。重点掌握 、H、G。一、算术平均数二、调和平均数三、几何平均数四、中位数五、众数六、切尾平均数和温氏化平均数七、各种平均数的比较 返回一、算术平均数( )(一)简单算术平均数(二)加权算术平均数 1、根据单项数列计算的 2、根据组距数列计算的 3、用比重权数计算的加权算术平均数 4、根据相对数(平均数)计算的加权 5、是非标志的平均数(三) 的数学性质(四) 的应用条件 返回 (一)简单算术平均数 计算公式: 应用条件:资料未分组,各组出现的次数都是1。 举例:5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为: 返回 (二)加权算术平均数 1、根据单项数列计算的 计算公式: 应用条件:单项式分组,各组次数不同。举例某车间20名工人加工某种零件资料: 2、根据组距数列计算的应用条件:组距式分组,各组次数不同。举例:某车间200名工人日产量资料: 3、由比重权数计算的应用条件:已知的是比重权数(次数是比重)公式: 举例:(仍用上例) 4、根据相对数(平均数)计算的加权 (1)根据相对数计算的某局所属的三个企业的资料: (2)根据平均数计算的某企业各班组工人劳动生产率资料: 5、是非标志的平均数是非标志:如果按照某种标志把总体只能分为具有某种特征的单位和不具有该种特征的单位两部分,这个标志就是是非标志。平均数的计算:把具有某种特征的用“1”表示,不具有该种特征的用“0”表示。 (三)算术平均数的数学性质 1、各个变量值与其平均数离差之和等于零 2、各个变量值与其平均数离差平方之和为最小值 性质(3、4) 3、给每个变量值增加或减少一个任意数A,则算术平均数也相应增增加或减少这个任意数A。 4、给每个变量值乘以或除以一个任意数A,则算术平均数也相应扩大或缩小A倍。 (四)算术平均数的适用范围 1、当变量值是绝对数时,变量值之间是和的关系,而且已知的是分母资料,在这种情况下,反映现象的平均水平用算术平均数。 2、当变量值是相对数或平均数时,变量值之间既不存在和的关系,也不存在相乘的关系,而且已知的是分母资料,在这种情况下,反映现象的平均水平用算术平均数。 返回 二、调和平均数(H) (一)简单调和平均数 计算公式: 应用条件:资料未分组,各个变量值次数都是1。举例:一个人步行两里,走第一里时速度为每小时候10里,走第二里时为每小时20里,则平均速度为: (二)加权调和平均数计算公式: 应用条件:资料经过分组,各组次数不同。 例1: 例2 例3 某局所属的三个企业的资料: 例4 某车间各班组工人劳动生产率资料: (三)调和平均数的适用范围 1、当变量值是绝对数时,变量值之间是和的关系,而且已知的是分子资料,在这种情况下,反映现象的平均水平用调和平均数。 2、当变量值是相对数或平均数时,变量值之间既不存在和的关系,也不存在相乘的关系,而且已知的是分子资料,在这种情况下,反映现象的平均水平用调和平均数。 返回 三、几何平均数(G)(一)简单几何平均数计算公式:应用条件:资料未分组(各变量值次数都是1)。 举例:某企业生产某种产品需经过三个连续作业车间才能完成。(二)加权几何平均数计算公式:应用条件:资料经过分组,各组次数不同。举例:将一笔钱存入银行,存期10年,以复利计息,10年的利率分配是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率 设本金为 (三)几何平均数的适用范围 当变量值是相对数,而且变量值之间存在连乘关系,反映现象的一般水平用几何平均数。 返回四、中位数( )把某一标志值按大小顺序排列起来居于中间位置的那个数就是中位数。(一)由未分组资料确定中位数 1、标志值的个数是奇数例:7名工人生产某种产品,日产量(件)分别为4、6、6、8、9、12、14。位于中间位置的第四名( )工人的日产量8件为中位数。 2、标志值的个数是偶数上例增加为8名工人,日产量为4、6、6、8、9、12、13、14。中位数为 ,其位 置在第四和第五名中间 ( ) (二)由单项数列确定中位数例: 中位数为第40 名和41名日产量的平均值 [ ] (三)由组距数列确定中位数 1、计算公式 2、举例五、众数( )总体中出现次数最多的标志值是众数。(一)由未分组资料确定众数例:7名工人日产量(件)为4、5、6、6、6、7、8。则众数是6。(二)由单项数列确定众数 (三)由组距数列确定众数 1、计算公式: 2、举例六、切尾平均数和温氏化平均数(一)切尾平均数将变量值两端的个别极值切去,对中间的变量值进行平均。 (二)温氏化平均数 1、四分位数:将数值由小到大排列,分成四等份,得到三个分割点,每个分割点对应的数值是四分位数。 在 处, 在 处, 在 处。 例:流行歌比赛中,11名评委对某歌手的打分分别为8.0 9.0 9.1 9.2 9.2 9.3 9.4 9.4 9.4 9.5 9.8 在 处 , 在 处 在 处 2、温氏化平均数 六、各种平均数的比较(一)各种平均数的特点及应用场合 是就全部数据计算的,具有优良的数学性质,实际中应用最为广泛。其主要缺点是易受极端值的影响,对偏态分布其代表性较差。 H主要用于不能直接计算 的数据易受极端值的影响。 G主要用于计算比率数据的平均数,易受极端值的影响。 不受极端值大小的影响,对偏态分布其代表性较 好。但不是根据所有的变量值计算的. 不受极端值的影响,对偏态分布其代表性较 好.但不是根据所有的变量值计算的. (二) 的关系第四节 变异指标变异指标是反映总体各标志值间差异程度的,且能衡量总体平均数的代表性。一、绝对数形式(一)全距(二)平均差(三)标准差(四)适用条件二、相对数形式 返回一、绝对数形式的变异指标 (一)全距(R)公式: R =最大值—最小值 优点:计算简便 缺点:易受极端值的影响 举例:5名学生的成绩为50、69、76、88、97 则R=97-50=47 (二)平均差(A.D) 1、简单平均差公式: 应用条件:资料未分组,各变量值出现的次数为1。举例:5名工人日产量资料 2、加权平均差公式: 应用条件:资料经过分组,各组次数不同。举例:前例, 3、平均差的优缺点优点:平均差是根据全部数值计算的,受极端值影响较全距小。缺点:由于采取绝对值的方法消除离差的正负号,应用较少。 返回(三)标准差( ) 1、简单标准差公式: 应用条件:资料未分组,各组次数都是1。举例:前例, 2、加权标准差公式: 应用条件:资料经过分组,各组次数不同。举例:前例, 3、是非标志的标准差如前:是非标志的平均数为P。(四)绝对数形式变异指标的适用条件当两个或多个数列的平均水平相等时,对比数列标志值间的变异程度及平均水平的代表性,用绝对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。 返回二、相对数形式的变异指标公式:有全距系数、平均差系数和标准差系数,应用最广泛的是标准差系数,其公式为: 举例:甲组日产量(件)为:60 65 70 75 80。 乙组日产量(台)为: 2 5 7 9 12。 相对数形式变异指标的适用条件当两个或多个数列的平均水平不等时,对比数列标志值间的变异程度及平均水平的代表性,用相对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。 返回 返回 第五章 动态数列分析本章主要介绍如何根据动态数列进行动态分析,动态分析包括两方面,一是计算各种动态分析指标,反映现象在某一段时期内发展变化的水平和速度。二是测定现象发展变化的规律性,对未来状况作出预测。重点掌握动态分析指标。第一节 动态数列的概念和种类第二节 动态分析指标 第三节 动态数列的趋势分析 返回 第一节 动态数列的概念和种类一、概念将一系列指标数值按时间先后顺序排列起来所形成的数列。二、种类(一)绝对数动态数列 1、时期数列 2、时点数列(二)相对数动态数列(三)平均数动态数列 返回 第二节 动态分析指标一、动态分析的水平指标 (一)发展水平 (二)平均发展水平 二、动态分析的速度指标 (一)增长量 (二)平均增长量 (三)发展速度 (四)增长速度 (五)增长1%的绝对值 (六)平均发展速度和平均增长速度 返回 一、动态分析的水平指标(一)发展水平是动态数列中每一项具体的指标数值。 假如动态数列为: 叫最初水平, 叫最末水平。 (二)平均发展水平 1、根据绝对数动态数列计算的 <1> 根据时期数列计算的 <2> 根据时点数列计算的 ①根据连续性时点数列计算的 间隔相等 间隔不等 ②根据间断性时点数列计算的 间隔相等 间隔不等 2、根据相对数动态数列计算的 3、根据平均数动态数列计算的 1、根据绝对数动态数列计算的 〈1〉根据时期数列计算的 例:1998-2002年我国国内生产总值(亿元)为78345 82067 89442 95933 102398,则平均国内生产总值为〈2〉根据时点数列计算的 ①连续性时点数列 某养猪场1—5日生猪存栏头数为1300 1400 1550 1550 1600则平均生猪存栏头数为(1300+1400+1550+1550+1600)÷5=1480(头) 某商品价格自4月11日起从70元降为50元,4月份平均价格 ②间断性时点数列间隔相等 4月份平均库存额= 5月份平均库存额= 6月份平均库存额= 第二季度的平均库存额 平均库存额间隔不等 2、根据相对数动态数列计算的平均发展水平 <1>基本公式 <2>由两个时期数列各对应指标的比值所形成的相对数动态数列计算的平均发展水平 <3>由两个时点数列各对应指标的比值所形成的相对数动态数列计算的平均发展水平 ①由两个连续性时点数列 ②由两个间断性时点数列 <4>由1个时期和1个时点数列各对应指标的比值所形成的相对数动态数列计算的平均发展水平 返回 <2>由两个时期数列各对应指标的比值所形成的 平均计划完成% <2>由两个时点数列各对应指标的比值所形成的 ①由两个连续性时点数列间隔相等 (公式同时期) 间隔不等 平均非生产人员% ②由两个间断性时点数列间隔相等 平均生产工人% 间隔不等 <4>1个时期和1个时点数列各对应指标比值形成的 第四季度平均每人增加值 3、根据平均数动态数列计算的平均发展水平 <1>根据一般平均数计算的 第一季度人均工资 <2>根据序时平均数组成的平均数动态数列例1:已知各季平均人数为351 353 352 350则全年平均人数为 例2:某企业人数,1月份平均452,2、3月平均455,第二季度平均每月458,则上半年平均人数为二、动态分析的速度指标 (一)增长量 1、公式:增长量=报告期水平—基期水平 2、种类:累计增长量=报告期水平—最初水平 逐期增长量=报告期水平—前期水平 3、关系:逐期增长量之和等于相应时期累计增长量 相邻两个累计增长量之差等于相应时期逐期增长量 (二)平均增长量(三)发展速度 1、公式: 2、种类: 3、关系 (四)增长速度 1、公式 2、种类定基增长速度 环比增长速度 3、关系增长速度=发展速度-1 返回(五)增长1%的绝对值指报告期比基期每增长1%所包含的绝对量。 公式 思路 (六)平均发展速度和平均增长速度(=平均发展速度- 1) 1、几何平均法 这种方法适宜于如产量、总值等水平指标平均发展速度的计算。例 某地区1995—2000年粮食产量(万吨)资料 如已知各年产量分别为320 332 340 356 380 395则 如已知各年的发展速度为104% 102% 105% 107% 104%则 如已知2000年是1995年的123%则 2、方程式法 当 时递增 当 时递减 查相应递增或递减表, 根据 的大小得到平均增长速度。 这种方法适宜于如基本建设投资总额、植树造林总面积等表示国民财产存量的指标平均速度的计算。 返回第三节 动态趋势分析一、动态数列变动因素的分解与模式二、长期趋势的测定(一)时距扩大法(二)移动平均法(三)数学模型法三、季节变动的测定(一)按月(季)平均法(二)趋势剔除法 返回 一、动态数列变动因素的分解与模式 (一)分解 1、长期趋势( ):是现象在一个相当长的时期内持续发展变化的方向性趋势。它是由各个时期普遍起作用的根本性因素所决定的。 2、季节变动(S):是一年以内有一定周期的每年重复出现的变动。它是由季节变换和社会习俗等因素影响而发生的。 3、循环变动(C):指现象因某种原因而发生的周期较长的涨落起伏的波动。 4、不规则变动(I):指由于意外的、临时的、偶然的因素作用而引起的非周期性的或非趋势性的随机变动。(二)模式 二、长期趋势的测定 (一)时距扩大法 某商场某年商品销售额资料(万元) (二)移动平均法 返回 (三)数学模型法 1、直线趋势测定 (1)确定动态数列是否有直线趋势。用散点图或一次增量大致相等。(2)假设方程(3)计算a、b两个参数。用最小平方法。从 出发,得到:举例:某地粮食产量(万公斤)资料(计算表) a、b两个参数的计算把上表第一种编码的有关资料代入方程 2567=10a+b×55 得:14642=55a+b×385 计算得: a=221.78 b=6.35 趋势方程为: y=221.78+6.35t 预测2003年产量: y=221.78+6.35×11=291.63(万公斤) 把第二种编码资料代入方程: 得: 2567=10a a=256.7 1047=330b b=3.17 趋势方程为: y=256.7+3.17t 2、曲线趋势的测定(指数曲线)步骤:(1)确定动态数列是否有指数曲线趋势,用散点图或各期环比速度大致相等。(2)假设指数曲线方程 (3)计算a、b两个参数 1)把指数曲线转化为直线 ㏒ =㏒a+t㏒b Y=A+Bt 2)计算A、B两个参数(用最小平方法) 3)计算a、b 例题(某省发电量资料计算表)计算a、b 把上表有关资料代入方程 得 A=2.2433 B=0.0496 查反对数表得 a=175.1 b=1.121 指数曲线方程为 返回 三、季节变动的测定(一)按月(季)平均法 (某禽蛋加工厂增加值资料 万元) 季节比率的计算 季节比率的计算如: 返回 (二)移动平均趋势剔除法 (某地保暖内衣零售量 万件)季节比率计算表 % 第六章 统计指数通过本章的学习,要求学员在理解指数基本概念的基础上,掌握各种指数的编制及因素分析方法,重点掌握两因素的综合指数因素分析及平均指标指数因素分析。第一节 指数的基本问题第二节 综合指数第三节 平均式指数第四节 平均指标指数第五节 指数体系及因素分析 返回第一节 指数基本问题一、概念反映不能直接相加的复杂现象综合变动程度的相对数。二、作用 1、综合反映复杂现象总体数量变动的方向和程度 2、利用指数体系进行因素分析 3、根据指数数列反映现象的变动趋势 三、指数的种类(一)按其所说明的对象范围不同 1、个体指数:反映个别现象变动的相对数。如 2、总指数:反映总体现象综合变动的相对数。 (二)按其所反映的指标性质不同 1、数量指标指数 2、质量指标指数 (三)总指数按对比的指标形式不同 1、综合指数 2、平均式指数 3、平均指标指数(四)按编制任务不同 1、时间指数 2、区域指数 3、计划完成程度指数第二节 综合指数一、综合指数编制的基本方法(一)数量指数编制方法(二)质量指数编制方法二、综合指数的其它编制方法三、综合指数的应用(一)成本计划完成指数(二)价格区域指数 返回一、综合指数编制的基本方法 (一)数量指数的编制(某商店资料) 举例:计算三种商品销售量的综合变动程度及由于销售量变动使销售额变动的绝对额。数量指数的编制原则在编制数量指数时,即计算数量指标综合变动程度时,需要加入质量指标作为同度量因素,而且把这个同度量因素固定下来,固定在基期。 返回(二)质量指数编制方法质量指数的编制原则在编制质量指数时,即计算质量指标综合变动程度时,需要加入数量指标作为同度量因素,而且把这个同度量因素固定下来,固定在报告期。 返回 二、综合指数的其它编制方法(一)拉氏公式 (二)派氏公式 (三)马艾公式 (四)费喧公式 (五)固定权数三、综合指数的应用 (一)成本计划完成指数某企业成本资料(二)价格区域指数甲乙两地某日几种农副产品市场资料第三节 平均式指数 一、基本编制方法(一)加权算术平均式指数(二)加权调和平均式指数二、应用(一)零售物价指数(二)农产品收购价格指数(三)工业生产指数 返回一、基本编制方法 (一)加权算术平均式指数举例 加权算术平均式指数的适用条件计算数量指数时,如果已知的是数量指标的个体指数和基期总额资料,用加权算术平均式指数计算数量指标的综合变动程度。 返回(一)加权调和平均式指数举例加权调和平均式指数的适用条件计算质量指数时,如果已知的是质量指标的个体指数和报告期总额资料,用加权调和平均式指数计算质量指标的综合变动程度。 返回 二、平均式指数的应用 (一)零售物价指数 (二)农产品收购价格指数 (三)工业生产指数第四节 平均指标指数这里的平均指标包括第四章所讲的加权算术平均数和与此相似的相对指标,如全员劳动生产率、人均国内生产总值。所以平均指标指数是反映两个不同时期同一经济内容这类指标的变动程度,即两个时期的加权算术平均数及与此相似的相对指标对比形成的指数。一、可变构成指数 第五节 指数体系及因素分析一、指数体系二、综合指数体系的因素分析(一)两因素综合指数体系的因素分析(二)多因素综合指数体系的因素分析三、平均式指数体系的因素分析四、平均指标指数体系的因素分析 返回一、指数体系(一)概念把经济上有联系,数量上保持一定关系的三个或三个以上的指数组成的整体称为指数体系。(二)种类 1、综合指数体系(1)两因素 总成本指数=产量指数×单位成本指数 (2)多因素 2、平均指标指数体系 3、两者结合的指数体系总成本指数=产量指数×单位成本指数 =产量指数×单位成本的固定构成指数 ×单位成本的结构影响指数 二、综合指数体系的因素分析 (一)两因素综合指数体系的因素分析 (二)多因素综合指数体系的因素分析 三、平均式指数体系的因素分析 四、平均指标指数体系的因素分析 97.62%=113.89%×85.71% 计算结果表明:从相对数说,所有工人的总平均工资下降了2.38%,是由于各组工人的平均工资上升了13.89%和结构的影响使平均工资下降了14.29%两个因素共同作用的结果。从绝对数说,总平均工资减少10元,是由于各组工人平均工资的上升使平均工资增加50元和结构的影响使平均工资减少了60元两个因素共同作用的结果。第七章 相关与回归分析相关与回归分析是研究现象之间依存关系的一种统计方法。重点掌握简单线性相关系数的计算与分析及一元线性回归方程的建立。第一节 相关与回归分析的基本问题第二节 简单线性相关分析第三节 一元线性回归分析 返回第一节 相关与回归分析的基本问题 一、相关的概念二、相关关系的种类三、相关与回归分析的的主要内容 返回 一、相关的概念 (一)相关分析从数量上分析现象之间相关关系的理论和方法。(二)函数关系(确定性关系)对于某一变量的每个数值都有另一变量的完全确定的值与之对应。(三)相关关系(非确定性关系)现象之间存在一定的依存关系,但不是一一对应的关系,即相随变动关系。 二、相关关系的种类 (一)按变量之间相关的程度 1、完全相关 2、完全不相关 3、不完全相关(二)按相关关系涉及变量的多少 1、单相关 2、复相关(三)按变量之间相关关系的表现形式 1、线性相关 2、非线性相关(四)对线性相关,按相关的方向 1、正相关 2、负相关 三、相关与回归分析的主要内容 (一)确定变量之间有无相关关系及呈现的形态用定性分析、相关表或相关图。(二)确定变量之间相关关系的密切程度用相关系数。(三)建立变量之间变动关系的方程式用最小平方法建立变量之间的回归方程。(四)测定因变量估计值的可靠性计算估计标准误差。 返回 第二节 简单线性相关分析一、相关表 (一)简单相关表 (二)单变量分组相关表 (三)双变量分组相关表二、相关图三、相关系数(一)基本公式(二)性质(三)其它计算公式(四)例题 返回 一、相关表(一)简单相关表 (二)单变量分组相关表 (三)双变量分组相关表二、相关图三、相关系数 (一)基本公式 1、基本公式 2、 的作用与不足 (1)说明相关的方向 (2)显示相关程度 y 3、 的作用与不足(1)作用:消除了变量值个数的影响。(2)不足:协方差数值受变量值大小和计量单位的影响。例: 4、 的作用 同协方差相比,相关系数有两个作用;(1)它是一个系数,不受变量值水平和计量单位的影响,可以在不同资料之间对相关程度进行对比。(2)相关系数的数值有一定范围即 (二)相关系数的性质 1、当 时,x与y为完全线性相关,即x 与y之间存在着函数关系。 2、当 时,表示x与y之间存在一定的线性相关。 的数值愈接近于1,表示x与y之间直线相关程度愈高;反之 的数值愈接近于0,表示x与y之间直线相关程度愈低。通常判断的标准是: 微弱相关 低度相关 显著相关 高度相关 3、当r﹥0时,为正相关,当r﹤0时,为负相关。 4、当 时,表示y的变化与x无关,即x与y完全没有直线相关。 (三)相关系数的其它计算公式 第三节 一元线性回归分析 一、相关分析与回归分析的关系(一)区别(二)联系二、一元线性回归方程的建立(一)回归方程的建立(二)r与b的关系三、估计标准误差(一)基本公式(二)计算公式(三) 与b的关系 返回 一、相关分析与回归分析的关系(一)区别 1、相关分析的任务是确定两个变量之间相关的方向和密切程度。回归分析的任务是寻找因变量对自变量依赖关系的数学表达式。 2、相关分析不必确定两变量中哪个是自变量,哪个是因变量,而回归分析中必须区分因变量与自变量。 3、相关分析中两变量是对等的改变两者的地位,并不影响相关系数的数值,只有一个相关系数。而在回归分析中,互为因果关系的两个变量可以编制两个独立的回归方程。 4、相关分析中两变量可以都是随机的,而回归分析中因变量是随机的,自变量不是随机的。 (二)联系 1、相关分析是回归分析的基础和前提。只有在相关分析确定了变量之间存在一定相关关系的基础上建立的回归方程才有意义。 2、回归分析是相关分析的继续和深化。只有建立了回归方程才能表明变量之间的依赖关系,并进一步进行预测。二、一元线性回归方程的建立(一)回归方程的建立 1、假设回归方程 2、计算a、b两个参数(最小平方法)从 出发,得到 前例(二)b与r的关系 例:三、估计标准误差(一)定义公式 (二)计算公式 (四) 与r的关系 y 第八章 抽样推断本章介绍在一定的概率保证程度下,从数量上用样本指标推断总体指标的统计方法。重点掌握简单随机抽样方式下,抽样平均误差计算、抽样单位数目确定和区间估计的方法。第一节 抽样推断的基本问题第二节 抽样误差第三节 抽样单位数目的确定第四节 抽样估计第五节 假设检验 返回 第一节 抽样推断的基本问题 一、抽样推断的概念二、抽样推断的特点三、抽样推断的适用范围四、抽样推断的有关概念五、抽样方法 返回 一、抽样推断的概念抽样推断是指从被研究现象的总体中按照随机原则抽取一部分单位进行调查,并依据调查结果对全部研究对象的数量特征作出具有一定可靠程度的估计,以达到对全部研究对象认识的一种统计方法。二、抽样推断的特点(一)按照随机原则从总体中抽取样本单位。(二)用样本单位的指标数值推断总体的指标数值。(三)抽样误差可以事先计算并加以控制。三、抽样推断的适用范围(需要掌握总体的具体数据)(一)不能进行全面调查(二)理论上可以进行全面调查实际上办不到(三)没有必要进行全面调查(四)可以验证和补充全面调查资料 四、抽样推断的有关概念(一)全及总体和抽样总体 1、全及总体(总体 N):所要认识对象的全体。(1)有限总体 (2)无限总体 2、抽样总体(样本 n):所抽取的一部分单位。(1)大样本(n≥30) (2)小样本(n≤30)(二)全及指标和抽样指标 1、全及指标:用来描述全及总体的指标 2、抽样指标:根据样本单位计算的指标 五、抽样方法 (一)按抽取样本单位的方法不同 1、重复抽样 2、不重复抽样(二)根据对样本的要求不同 1、考虑顺序的抽样 AB≠BA 2、不考虑顺序的抽样 AB=BA 返回(三)两种分类交叉 1、考虑顺序的不重复抽样 2、考虑顺序的重复抽样 3、不考虑顺序的不重复抽样 4、不考虑顺序的重复抽样第二节 抽样误差一、抽样平均误差(一)概念(二)计算 1、简单随机抽样 2、类型抽样 3、等距抽样 4、整群抽样 5、阶段抽样 (三)影响抽样平均误差的因素 二、抽样极限误差 三、抽样极限误差与抽样平均误差的关系 返回一、抽样平均误差(一)抽样平均误差的概念 1、登记汇总性误差 2、代表性误差(1)偏差 (二)抽样平均误差的计算 1、简单随机抽样(1)概念 :是对总体单位不作任何分类或排队,完全按随机原则逐个地抽取样本单位。(2)抽样平均误差的计算公式 ①平均数的抽样平均误差 ②成数的抽样平均误差 (3)例题 ①某冷库冻鸡平均每只重1200克,标准差70克,如果重复随机抽取100只和200只,分别计算抽样平均误差。 ②该冷库冻鸡合格率为97%,如果重复随机抽取100只和200只,分别计算抽样平均误差。 2、类型抽样(1)概念:类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。(2)样本单位数在各类型组中的分配方式 ①等额分配:在各类型组中分配同等单位数。 ②等比例分配:按各类型组在总体中所占比例分配样本单位数。即: ③最优分配:按各类型组的规模大小和差异程度,确定各类型组的样本单位数。(3)抽样平均误差的计算公式 ①平均数的抽样平均误差重复不重复且等比例 ②成数的抽样平均误差重复不重复且等比例(4)例题 ①有12块小麦地,每块1亩。6块处于丘陵地带,亩产量(斤)分别为:300 330 330 340 370 370 。 6块处于平原地带,亩产量(斤)分别为:420 420 450 460 490 520。抽查4块,测定12块地的平均亩产量,计算其抽样误差。 ②设亩产在350以上的为高产田,抽查4块,测定12块地高产田的比重,计算其抽样误差。 用类型抽样,每类抽2块计算各组方差 平均组内方差 抽样误差 3、等距抽样(1)概念:将总体各单位标志值按某一标志顺序排队,然而按一定的间隔抽取样本单位。(2)排对的方法 ①无关标志排队 ②有关标志排队(3)抽取样本单位的方法 ①按相等的距离取样 ②对称等距取样(4)抽取第一个样本单位的方法 ①随机抽取 ②居中抽取 (5)抽样平均误差的计算公式 ①按无关标志排队 :同不重复简单随机抽样 ②按有关标志排队 4、整群抽样 (1)概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数登记调查。 (2)抽样平均误差的计算公式 某水泥厂一昼夜的产量为14400袋,现每隔144分钟抽取1分钟的水泥(10袋)检查平均每袋重量和一级品率,样本资料如下: 计算抽样平均误差 5、阶段抽样(1)概念:抽样时,先抽总体中较大范围的单位,再从中选的较大范围的单位中抽取较小范围的单位,依此类推,最后得到样本的基本单位。(2)抽样平均误差的计算公式(以两阶段为例) 同理可以得出成数抽样平均误差的计算公式(3)例题:某地区有300户居民,分成10群,现从10群中抽6群,再从抽中的群中每群抽2户调查其平均收入,计算抽样平均误差。资料如下:群1:300 330(户收入) (三)影响抽样平均误差的因素 1、总体标准差的大小 2、样本单位数的多少 3、抽样方法的不同 4、抽样组织方式的差别 二、抽样极限误差 样本指标围绕总体指标左右两侧波动形成的一定范围。 三、抽样极限误差与抽样平均误差的关系(一)抽样分布据中心极限定理,当总体为正态或总体非正态但n≥30时,样本均值的分布趋近于正态分布;当n足够大时,样本成数的分布近似为正态分布。(二)关系 令 第三节 抽样单位数目的确定一、抽样单位数目的计算 (一)简单随机抽样 (二)类型抽样 (三)等距抽样 (四)整群抽样二、影响抽样单位数目的因素 返回 一、 抽样单位数目的计算(一)简单随机抽样 1、计算公式(1)平均数 (2)成数 2、例题(1)某类产品根据以往资料的估计,总体方差5.456千克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求可靠程度达到99.73%,误差范围不超过0.9千克,需要抽多少样本单位?按题意 (2)根据以往资料的估计,该类产品的一等品率为 90%,可靠程度仍为99.73%,误差范围不超过5%,推断该批产品的一等品率,需要抽多少样本单位?按题意 (二)类型抽样 1、计算公式 2、例题某工厂早、中、晚生产罐头10000瓶,根据以往资料的估计平均重量的类型平均方差为0.549克,合格率的类型平均方差为0.02787,要求可靠程度为何95%,平均重量的允许误差为0.11克,合格率的允许误差为0.025,用类型抽样推断10000瓶罐头的平均重量和合格率,需要抽多少样本单位?据题意 (三)等距抽样计算公式(1)按有关标志排队同类型重复抽样 (2)按无关标志排队同简单随机不重复抽样(四)整群抽样 1、计算公式 2、例题:某水泥厂对一昼夜所生产的14400袋(1440群)水泥抽样检查其质量,根据以往资料,水泥平均重量的群间方差为2.65,允许误差为1.5公斤;一级品率的群间方差为0.00048,允许误差为0.015,要求可靠程度为95.45%,需要抽多少样本群?据题意:二、影响抽样单位数目的因素(一)总体各单位的变异程度(二)抽样推断的准确程度△ (三)抽样推断的可靠程度t (四)抽样的组织形式(五)抽样的方法 返回第四节 抽样估计一、估计量的优良标准二、抽样估计的方法 (一)点估计(二)区间估计 1、平均数的区间估计 2、成数的区间估计 3、2个总体平均数之差的估计 一、估计量的优良标准 (一)无偏性 1、概念:如果样本统计量的期望值等于该统计量所估计的总体参数,这个估计量叫无偏估计量。 2、样本平均数是总体平均数的无偏估计量总体变量值有N个( ),样本容量为n个( )。(1)重复抽样 (2)不重复抽样 3、样本成数是总体成数的无偏估计量 4、样本方差是总体方差的无偏估计量(二)有效性:有两个无偏估计量( ),如果那个估计量与总体参数间的平均离差小,这个估计量更有效。 和 都是 的无偏估计量, 与 间的平均离差为 , 与 间的平均离差为 , 所以在估计 (P ) 时, ( p ) 更有效。(三)一致性:随着样本容量的增大,估计量与被估参数的偏差越来越小。 是 的一致估计量。有限总体时,n最大为N,这时 = ;无限总体时,当n ∞时, 与 间的偏差( )的极限为0。p( )是P( )的一致估计量。二、抽样估计的方法(一)点估计 (二)区间估计 1、平均数的区间估计 (1)样本取自总体方差已知的正态分布(大、小样本) 某制造厂质量管理部门希望估计本厂生产的5500包原材料的平均重量,抽出250包,测得平均重量65千克。总体标准差15千克。总体为正态分布,在置信水平为95%的条件下建立这种原材料的置信区间。 5500包原材料的平均重量在63.14~66.86之间。 (2) 正态总体总体方差未知且小样本因总体方差 未知,只能用 代替,而n很小 常常与 差异较大, 就不再是一个标准正态分布,而是一个t分布。例:为了估计一分钟广告的平均费用,抽出15个电视台组成样本,得样本均值10000元,标准差2000元。总体近似服从正态分布,在置信水平为95%的条件下建立广告平均费用的置信区间。 电视台一分钟广告的平均费用在8894~11106之间。 (3)正态总体总体方差未知且大样本 总体方差 未知,只能用 来代替,因n很大, 就是 的一个较好的估计量, 仍然是一个近似的标准正态分布。 (4)样本取自总体方差已知的非正态分布某职业介绍所从申请某一职业的1000名申请者中采用不重复抽样方式随机抽取了200名,以此来估计1000名的平均成绩。200名的平均分为78,由以往经验知总体方差90,不知总体服从何种分布。在置信水平为90%的条件下建立1000名申请者平均成绩的置信区间。 1000名申请者平均成绩在77~79之间。 (5)样本取自总体方差未知的非正态分布 例:某超市通过100位的样本研究每次购买额,均值和标准差分别为80元和20元,在置信水平为90%的条件下建立100位顾客购买额的置信区间。 所有顾客购买额在76.71和83.29之间。 2、成数的区间估计 例2 对一批灯泡抽取1%进行质量检验,结果为平均寿命1010小时,抽样平均误差5.6小时;合格率92%,抽样平均误差2.4%。要求在95%的可靠程度下,对该批灯泡的平均寿命和合格率进行区间估计。据题意 3、2个总体平均数之差的估计我们经常希望对来自2个不同总体的平均数进行比较( )。而往往无法直接得到其数据,只能用样本数据( )对其作出估计。(1)2个样本平均数之差的抽样分布如果有2个正态总体,其平均数分别为 和 ,方差分别为 和 ,那么从2个正态总体中抽取的容量分别为 和 的2个独立样本的平均数之差 也一定服从均值为 ,方差为 的正态分布。如果是从2个非正态总体中抽 取2个独立的样本,只要 ,根据中心极限定理,样本平均数之差的抽样分布就会逼近正态分布,(2)2个总体平均数之差的估计2个正态总体且方差已知例:某银行负责人想知道储户两家银行的钱数,随从每家各抽取25个储户。样本平均值为: , 。两个总体均服从方差分别为 和 的正态分布。在95%的置信水平下对总体平均数之差 进行区间估计。 有95%的把握认为总体平均数之差在1200.42和1299.58之间。两个正态总体方差未知但相等(小样本)首先求出共同方差 的估计值 ,用加权平均数,权数是它们的自用度。 这时,其统计量 服从自由度为 的t分布,标准差为: 总体平均数之差 的置信区间为: 例:某工厂中有两台生产金属棒的机器,分别抽取11根和21根。两个样本的数据为: 英寸, 英寸; , 。假定两个总体近似服从正态分布,且总体方差相等。在95%的置信水平下对总体平均数之差 进行区间估计。 两个正态总体方差未知且不等(小样本)其统计量 不服从自 由度为 的t分布,而服从自由度为 的t分布, 置信区间为: 例:上例中总体方差不等。两个非正态总体方差未知(大样本) 4、两个总体比例之差的估计在大样本且总体比例不太接近0或1时,两个独立样本的比例之差 的抽样分布近似服从正态分布,其平均值为 ,标准差为: 例:某企业有两个车间,对B车间的工人首先进行业务培训。3个月后,对两个车间的产品进行检验。从车间A抽取200件,从车间B抽取220件,废品率为 。在95%的把握程度下构造两车间废品率之差的置信区间。第五节 假设检验一、假设检验与参数估计的区别二、假设检验的程序三、双侧检验和单侧检验四、一个总体平均数的假设检验五、一个总体成数的假设检验 七、两个总体比例之差的假设检验一、假设检验与参数估计的区别参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度不同。参数估计是在总体参数未知的情况下用样本统计量估计总体参数。假设检验是先对总体参数提出一个假设,然后利用样本信息去检验这个假设是否成立,如果成立,就接受这个假设,否则就放弃。某企业生产了一批灯管,按规定每只灯管的使用寿命不得低于1000小时。现从中任意抽取100只,发现有6只的使用寿命低于1000小时,若规定不合格率达到5%时,灯管就不能出厂,问该批灯管能否出厂。从2002年的新生儿中随机抽取30个,测得其平均体重为此3210克,而2001年为3190克,问新生儿体重2002年比2001年有无显著差异。二、假设检验的程序第一,提出原假设和替换假设把需要通过样本去推断其正确与否的命题称为原假设,用 表示。上例 : 与原假设对立的假设是替换假设, : 第二,确定适当的检验统计量根据样本的大小、总体方差是否已知,选择适当的检验统计量。第三,规定显著性水平是当原假设为正确时人们却把它拒绝了的概率或风险。是由人们确定的,当 取0.05时,表明作出接受原假设的决定时,其正确的可能性(概率)为95%。第四,计算检验统计量的值第五,作出统计决策三、双侧检验和单侧检验 (一)双侧检验 : :只要 >3190 或 <3190 中有一个成立,就可以否定原假设。 (二)单侧检验 1、左单侧检验按规定灯泡的使用寿命平均低于1000小时,该批灯泡不能出厂。已知灯泡的使用寿命服从正态分布,标准差为20小时。在总体中随机抽取了100只,得知样本均值为960小时,该批灯泡能否出厂。 : : <1000 2、右单侧检验如前例:不合率不能高于5%。 : : >5% 四、一个正态总体的假设检验(一)总体为正态分布且方差已知例:我国出口凤尾鱼罐头,标准规格是每罐净重250克,据以往经验,标准差是3克。某食品厂生产一批供出口用的这种罐头,从中抽取100罐检验,其平均净重251克。假定罐头重量服从正态分布,按规定显著性水平 ,问这批罐头是否合乎出口标准? (1)提出假设 : 克, : 克(2)建立统计量 ~N(250, ) ~N(0,1 )(3)临界值 (4)计算统计量的值 (5)进行决策 拒绝 (二)总体为正态分布但方差未知且n<30 例:某汽车轮胎厂声称该厂生产的汽车轮胎平均行使里程大于25000公里。现对15个轮胎作了试验,得到平均行使里程为27000公里,标准差5000公里,假定轮胎的行驶里程数近似服从正态分布,我们能否得出结论,该厂的产品与该厂声称的标准相符?( ) : , : >2500 (三)总体为非正态分布 1、 总体的标准差已知 2、 总体的标准差未知某房产经纪人称邻近地区房屋的平均价值低于480000元。现抽查了40间房屋,平均价值450000元,标准差为120000元。在0.05的置信水平下,这些数据能否支持这位经纪人的说法? : , :µ <480000 五、一个总体比率的假设检验例:一项调查结果表明某市老年人口比重为14.7%,该市老年人口研究会为了检验该项调查是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法? :p=14.7% : 六、两个总体平均数之差的假设检验 (一)两个正态总体且方差已知 服从标准正态分布。例:有两种方法可用于制造两种以抗拉强度为重要特征的产品,经验表明,用这两种方法生产出来的产品的抗拉强度都近似服从正态分布。 千克, 千克。现分别抽取12和16,得到样本均值分别为40千克和34千克。想知道这两种方法所生产产品的抗拉强度是否相同。( ) : , :(二)两个正态总体方差未知(大样本)(三)两个正态总体方差未知但相等(小样本)(四)两个正态总体方差未知且不等(小样本) (六)两个非正态总体方差未知(大样本)例:一个样本由A居民区的100个家庭组成,另一个样本由B居民区的150个家庭组成。两个样本关于居住时间的信息为: 个月, ; 个月, 。能否说明A区平均居住时间比B区短?( ) : , : 七、两个总体比例之差的假设检验(一)检验两个总体比例之差是否为0 (二)检验两个总体比例之差为某一常数例:某厂检验员认为该厂A车间的产品一级品率比B车间的产品一级品率至少高5%,现从A车间抽取150,一级品113;从B车间抽取160,一级品104。检验员的观点对吗?( )第九章 综合复习一、 总论二、 统计调查 三、 统计资料整理四、 综合指标五、 动态数列分析六、 指数七、 相关与回归分析八、 抽样推断一、 总论(一)统计学基本问题 1、统计学的涵义 2、统计学的研究对象和性质 (二)统计学中的几个基本概念二、统计调查(一)统计调查的组织方式 1、普查 2、重点调查与典型调查的适用条件(二)统计调查方案 1、调查对象、调查单位 2、调查时间三、统计资料的整理(一)统计分组 1、单项式分组 2、组距式分组 3、组距式分组中的有关问题(二)次数分布的编制(三)统计表的结构和种类 四、综合指标(一)总量指标时期指标、时点指标的概念及特点(二)相对指标 1、结构、比例、比较、动态相对指标的涵义 2、强度相对指标的涵义及与平均指标的区别 3、计划任务数为相对数的计划完成相对指标的计算(三)平均指标 1、加权算术、加权调和、几何平均数的计算及适用条件。 2、各种平均数的优缺点(四)变异指标标准差、标准差系数的作用、计算、适用条件。五、动态数列分析(一)动态分析指标 1、增长量的计算及种类、增长1%的绝对值的计算 2、发展速度的计算、种类及与增长速度的关系 3、用几何平均法计算的平均发展速度和平均增长速度 4、根据时点数列和相对数数列计算的平均发展水平(二)动态趋势分析 1、动态数列发展变化的四种趋势 2、了解测定长期趋势的方法 3、了解测定季节变动的方法六、指数(一)综合指数的计算及两因素综合指数体系的因素分析 (二)平均式指数的计算及因素分析(三)平均指标指数的计算及因素分析七、相关与回归分析(一)相关与回归分析的主要内容 (二)相关系数的计算及性质(三)相关分析与回归分析的关系(四)回归方程的建立(五)b与r的关系(六)估计标准误差的计算及与r的关系八、抽样推断(一)抽样误差 1、概念 2、简单随机抽样下抽样平均误差的计算 3、抽样平均误差与极限误差的关系 4、影响抽样平均误差的因素(二)抽样单位数目的确定 1、简单随机抽样下抽样单位数目的计算 2、影响抽样单位数目的因素(三)抽样估计 1、估计量的优良标准 2、区间估计 3、假设检验第十章 习题解答第一节、课本习题解答 (一) 第25题 用两种方法计算工人的平均月工资 (二) 第27题 (三) 第28题 1车间实际产量200件,完成计划96%,2车间实际产量300件,完成计划100%,3车间实际产量150件,完成计划104%,则3个车间产量的平均计划完成程度为: 1车间产品单位成本为15元,2车间产品单位成本为25元,3车间产品单位成本为20元,则3个平均单位成本为: (四) 第29题甲、乙两农贸市场农产品资料 第二节、摸拟题及答案摸拟题(一)一、填空题(每空1分,共10分) 1、统计学是————性质的科学。(方法论) 2、统计研究总体是在——性、——性的基础上,研究其——性的。(同质、大量、差异) 3、变量按影响因素是否确定可分为——型变量和——型变量。(连续、离散) 4、反映现象在某一段时期内总量的指标是——指标。(时期) 5、总体的某一部分数值与总体的全部数值之比得到——相对指标。(结构) 6、主词不作任何分组所形成的统计表是——。(简单) 7、12个月的季节比率之和应该等于——。(1200%) 二、判断题(每小题2分,共20分) 1、某市对占该市钢铁产量三分之二的5个钢铁企业进行调查,以了解该市钢铁生产的基本情况,这种调查方式属于典型调查。(× 重点调查) 2、2002年我国人口出生数是一个时点指标。( × 时期) 3、2002年我国人均粮食产量是一个平均指标。( × 强度相对指标) 4、连续型变量只能用组距式分组。 5、当两个数列的平均水平相等时,可以用标准差对比其平均水平的代表性。 6、相邻两个累计增长量之比等于相应时期的逐期增长量。(× 之差) 7、加权算术平均式产量指数公式权数为 ( × ) 8、r的值越大,相关的程度越高。( × r的绝对值) 9、测定长期趋势的方法有时距扩大法、移动平均法、数学摸型法。 10、某企业本年计划增加值1000万元,实际为1100万元,则计划完成相对指标为110%。三、多项选择题(每小题2分,共10分) 1、属于平均指标的有( ) 某地区平均每人粮食产量 某企业工人平均工资 某地区平均每人钢产量产量 某企业人均增加值 某车间工人平均日产量 2、属于时期指标的有( )某年死亡人口数 月初物资库存量某年初耕地面积数 某校毕业学生数某学期初在校学生数 3、标准差与平均差( )都能反映现象的变异程度都能衡量平均数的代表性标准差比平均差准确消除离差正负号的方法不同适用条件相同 4、衡量估计值是否优良的标准有 无偏性 抽象性 差异性 一致性 有效性 5、测定季节变动的方法有 移动平均法 按月平均法 按季平均法 移动平均趋势剔除法 剩余法四、简答题(每小题5分,共10分) 1、简要说明参数估计和假设检验的异同(1)相同:都是利用样本资料对总体进行某种推断的方法,参数估计的置信区间所对应的就是假设检验的接受域。(2)不同:推断的角度不同。参数估计是在总体参数未知的情况下用样本统计量估计总体参数。假设检验是先对总体参数提出一个假设,然后利用样本信息去检验这个假设是否成立。 2、简要说明抽样的各种组织形式(1)简单随机抽样:对总体不进行任何分类排队。(2)类型抽样:先把总体分为若干类(3)等距抽样:排队后按相等的距离抽取(4)整群抽样:从总体群中抽取样本群(5)阶段抽样:分阶段抽取样本五、计算题(共50分) 1、某企业两个生产班组日产量资料如下表计算有关指标说明哪个班组的平均日产量的代表程度高。 3、已知某产品生产费用总额,2002年为12.9万元,比2001年多9000元,单位成本比2001年降低3%.计算生产费用总额指数、产量指数、由于成本降低而节约的生产费用、由于产量增加而增加的生产费用。 4、为调查农民生活水平,在某地区5000户中随机抽取400户进行调查,得知400户中有300户拥有彩电,以95%的把握程度估计该地区所有农户中拥有彩电的农户比例;若要求允许误差不超过0.02,至少应抽取多少户作为样本?(重复抽样 ) N=5000 n=400 5、某地居民2000——2002年有关资料如下表建立以销售额为因变量的直线回归方程,并估计人均收入为600元时,商品销售额为多少。 6、某企业资料 (1)计算第一季度平均月劳动生产率 (2)计算第二季度平均月劳动生产率 (3)计算上半年平均月劳动生产率 摸拟题(二)一、填空题(每空1分,共13分) 1、某企业计划规定增加值今年在去年的基础上提高5%,实际提高了6%,增加值计划完成程度为——。( ) 2、众数是——的那个变量值。(出现次数最多) 3、加权算术平均数大小受——和——两个因素的影响。(变量值、次数) 4、各标志值与算术平均数的离差之和为——。(0) 5、测定长期趋势的方法有时距扩大法、——和——。(移动平均法、数学模型法) 6、某厂报告期职工的总平均工资比基期提高3.2%,职工人数增加2%,工资总额提高____.(103.2%102%) 7、抽样极限误差是——指标与——指标之间最大可能的误差范围。 8、假设检验有——侧检验、——单侧检验、——单侧检验。 二、判断题(每小题2分,共20分) 1、相关系数 越大,估计标准误差就越大。(小) 2、在相关系数 的计算公式中,标准差 所起的主要作用是显示x、y之间相关的方向。( ) 3、无偏性是指样本统计量的平均值等于未知的总体指标。 4、对某企业的产品,每隔20小时抽取1小时的产品全部检验其质量,这种方式是等距抽样。(整群) 5、增长1%的绝对值等于基期水平比100。 6、某产品产量2002年是1999年的135%,2000——2002年的年平均发展速度为 。 ( ) 7、变异指标与平均数的代表性成正比关系。 8、是非标志的标准差是p(1-p)。( ) 9、三个车间的合格率分别为96%、99%、94%,则三个车间的平均合格率为 。 10、普查时必须确定一个标准时点。三、多项选择题(每小题2分,共10分) 1、测定离散程度的指标有( ) 全距 平均差 标准差 标准差系数 2、当现象完全相关时,相关系数为( )0 1 0.5 -1 -0.5 3、缩小抽样误差的途径有( )缩小总体方差 增加样本数 减少样本数 将重复抽样改为不重复抽样将不重复抽样改为重复抽样 4、影响动态数列发展变化的因素有( )长期趋势 季节变动 循环变动不规则变动 时期的长短 5、当 时,说明( )甲数列的变异程度大于乙数列甲数列的变异程度可能大于乙数列甲数列的变异程度可能小于乙数列甲数列的变异程度小于乙数列甲数列平均水平的代表性可能大于乙数列 四、简答题(每小题5分,共10分) 1、影响抽样单位数目因素有那些,并说明各种因素与抽样单位数目的关系。(1)总体各单位的变异程度,正比关系。(2)抽样推断的准确程度△,反比关系。(3)抽样推断的可靠程度t,正比关系。(4)抽样的组织形式。(5)抽样的方法。 2、说明相关分析与回归分析的区别与联系(1)区别 任务不同 两个变量是非对等两个变量是非都是随机的(2)联系相关分析是回归分析的基础和前提。回归分析是相关分析的继续和深化 五、计算题(共47分) 1、甲、乙两地同种商品的资料如下表,比较哪个地区的平均价格高并说明原因 2、确定表中所缺的与上年相比的各种动态分析指标 3、某企业生产三种产品有关资料如下表。从相对数和绝对数两方面对该企业总成本的变动进行因素分析。 4、用重复抽样的方法从10000个电子管中随机抽取4%进行耐用性能的检查,样本计算结果平均寿命为4500小时,样本寿命时数方差为15000,不合格率为3%,要求以95.45%的概率保证程度估计该批电子管的平均寿命和不合格率的范围.( ) 5、根据下列资料计算相关系数、建立回归方程 6、某企业人数资料 计算该企业第一季度平均人数
展开