1、统计学两大分支:
- 描述统计----(具体描述)
- 推断统计----(样本推断总体),包括:参数估计、假设检验
2、变量
- 定量变量----取值为数量(销售额、注册员工数,年龄)
- 定性变量----取值为类别,包括 分类变量(行业类别、性别) 顺序变量(教育水平)
3、数值型数据是对定量变量的观测结果,其取值表现为具体的数值。数值型数据可以进行加、减、乘或除等数学运算。
4、在社会经济领域,统计调查是获得数据的主要方法,也是获得一手数据的重要方式。
5、调查过程有两个重要特征:
- 调查是一种有计划、有方法、有程序的活动
- 调查的结果表现为搜集到的数据。
6、全面调查是对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查。例如,人口普查、经济普查。全面调查由于调查的单位多、组织工作量大,往往需要耗费大量的人力、财力。
7、普查是为某一特定目的而专门组织的一次性全面调查:掌握有关国情国力的基本统计数据:主要用于收集处于某一时点状态上的社会经济现象的基本全貌。
8、抽样调查是从调查对象的总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查。
9、典型调查是一种非全面调查,它是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。
10、重点调查是指从调查对象的全部单位中选择一部分重点单位进行调查。重点单位虽然只是全部单位中的一部分,但就调查的标志值来说在总体中占绝大比重。
11、经济普查10年两次,尾数3、8的年份,;人口普查逢0,每10年一次;农业普查逢6,每10年一次。
12、指导学习或监督学习是对目标需求的概念进行学习和建模,通过探索数据和建立模型来实现从观察变量到目标需求的有效解释。而无指导学习或无监督学习没有明确的标识变量来表达目标概念,主要任务是探索数据之间的内在联系和结构。
13、描述统计是研究数据收集、整理和描述的统计学方法。内容包括
(1)如何取得所需要的数据:
(2)如何用图表或数学方法対数据进行整理和显示:
(3)如何描述数据的一般性特征。
14、通过直接调查或测量而收集到的数据,称为观测数据。观测数据是在没有对事物施加任何人为控制因素的条件下得到的,几乎所有与社会经济现象有关的统计数据都是观测数据。
15、直接的调查和科学实验,对使用者来说,这是数据的直接来源,称为直接数据或一手数据。二是别人的调查和科学实验,对使用者来说,这是数据的间接来源,称为间接数据或二手数据。一手数据的来源主要有两个:是调查或观察,二是实验。在社会经济领域,统计调查是获得数据的主要方法,也是获得一手数据的重要方式。
16、在我国,常用的统计调查方式有统计报表、普查、抽样调查、重点调查和典型调查。按调查对象的范围不同统计调查可分为全面调查和非全面调查;按调查登记的时间是否连续,统计调查分为连续调查和不连续调查。
17、连续调查是为了观察总体现象在一定时期内(通常是一年内)数量变化,它要求随着调查对象的发展变化,连续地进行调查登记。如工厂的产品生产,原材料的投入、能源的消耗、人口的出生、死亡等。
18、抽样调查的特点包括:
①经济性——这是抽样调查的一个最显著优点。
②时效性强。与普查等全面调查相比,抽样调查可以频繁地进行,随着事物的发生和发展及时取得有关信息,以弥普查等全面调查的不足。
③适应面广。
④准确性高。
18、普查的特点:
- 通常是一次性的或周期性的
- 需要规定统一的标准调查时间
- 数据一般比较准确
- 普查的使用范围比较窄。
19、大数据的特征包括
- 大数据的起始计量单位是PB、EB、ZB
- 大数据类型繁多,包括网络日志、音频、视频、图片
- 大数据价值密度的高低与数据总量的大小成反比
- 大数据的智能化和实时性要求高
- 大数据的处理要符合“1秒定律”