统计学的问题

如题所述

第1个回答 2020-11-22

1. 变量之间关系可以分为两类：

函数关系：反映了事务之间某种确定性关系。

相关关系：两个变量之间存在某种依存关系，但二者并不是一一对应的；反映了事务间不完全确定关系；

2. 为什么要对相关系数进行显著性检验？

实际上完全没有关系的变量，在利用样本数据进行计算时也可能得到一个较大的相关系数值（尤其是时间序列数值）。
当样本数较少，相关系数就很大。当样本量从100减少到40后，相关系数大概率会上升，但上升到多少，这个就不能保证了；取决于你的剔除数据原则，还有这组数据真的可能不存在相关性；
改变两列数据的顺序，不会对相关系数，和散点图（拟合的函数曲线）造成影响；对两列数据进行归一化处理，标准化处理，不会影响相关系数；我们计算的相关系数是线性相关系数，只能反映两者是否具备线性关系。相关系数高是线性模型拟合程度高的前提；此外相关系数反映两个变量之间的相关性，多个变量之间的相关性可以通过复相关系数来衡量；

3. 增加变量个数，R2会增大；P值，F值只要满足条件即可，不必追求其值过小；

4. 多重共线性与统计假设检验傻傻分不清？

多重共线性与统计假设没有直接关联，但是对于解释多元回归的结果非常重要。相关系数反应两个变量之间的相关性；回归系数是假设其他变量不变，自变量变化一个单位，对因变量的影响，而存在多重共线性（变量之间相关系数很大），就会导致解释困难；比如y~x1+x2；x·1与x2存在多重共线性，当x1变化一个单位，x2不变，对y的影响；而x1与x2高度相关，就会解释没有意义。

一元回归不存在多重共线性的问题；而多元线性回归要摒弃多重共线性的影响；所以要先对所有的变量进行相关系数分析，初步判定是否满足前提多重共线性。

5. 时间序列数据会自发呈现完全共线性问题，所以我们用自回归分析方法；

6. 什么样的模型才是一个好模型？

在测试集表现与预测集相当，说明模型没有过度拟合：在训练集上表现完美，在测试集上一塌糊涂；原因：模型过于刚性：“极尽历史规律，考虑随机误差”；拟合精度不能作为衡量模型方法的标准；

一个好的模型：只描述规律性的东西（抓住事务的主要特征），存在随机误差是好事，在预测时，就有了“容错空间”，预测误差可能减小！

7. 假设检验显著性水平的两种理解：

显著性水平：通过小概率准则来理解，在假设检验时先确定一个小概率标准----显著性水平；用表示；凡出现概率小于显著性水平的事件称小概率事件；
通过两类错误理解：为拒绝域面积

8. 中心极限定律与大数定理：

大数定理正态分布的“左磅”，随着样本数的增加，样本的平均值可以估计总体平均值；

中心极限定理正态分布的“右臂”具有稳定性，大数定理说明大量重复实验的平均结果具有稳定解决了变量均值的收敛性问题中心极限定理说明随机变量之和逐渐服从某一分布，解决了分布收敛性问题。

相似回答

统计学题目答：解得x≈1.1671 所以，平均增长要大于0.1671，即16.71%。

统计学原理0907答案问题:答：17.一个完整的统计调查方案包括哪些主要内容?五、计算题18.甲.乙两班同时参加<统计学原理>课程的测试,甲班平均成绩为81分,标准差为9.5分;乙班的成绩分组资料如下:按成绩分组学生人数(人)60以下60—7070—8080—9090--10041025142计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性?解:乙班...

统计学的问题答：1. 变量之间关系可以分为两类：函数关系：反映了事务之间某种确定性关系。相关关系：两个变量之间存在某种依存关系，但二者并不是一一对应的；反映了事务间不完全确定关系；2. 为什么要对相关系数进行显著性检验？实际上完全没有关系的变量，在利用样本数据进行计算时也可能得到一个较大的相关系数值（尤其...

统计学题目?答：这是一个二项分布问题，样本容量为40，每个学生在食堂就餐的概率为0.65。要求至少有70%的学生在食堂就餐，可以通过计算概率的方式求解。我们可以使用二项分布的公式来计算概率：P(X≥k) = ∑(n choose i) * p^i * (1-p)^(n-i) , i=k, k+1, ..., n 其中，n为样本容量，p为每个...

一些关于统计学的问题,请大家帮忙解答(急需),谢谢:答：1、普查与全面统计报表有何区别？不知道 2、典型调查、重点调查、抽样调查的异同？（方式、目的的不同）不知道 3、简单分组和复合分组各有什么特点和作用？不知道 4、什么是频率和频数密度？不知道 5、组中值的作用？不知道 6、总体标志总量和总体单位总量二者有何联系？不知道 7、简单算术平均数和...

统计分析应该注意的几个问题答：关键的问题是，当增加样本的时候，是不是还会保持原来的结果。治疗1人可以治愈，治疗第二个人一定会治愈吗？如果不断增加样本，结果仍然不变，统计学就会认为这种建立在大样本基础上的结果是可靠的，而不是偶然的，就会给出一个小P值。如果小样本的结果发现有差异，统计学会认为基于小样本的差异不一定...

统计学问题答：统计学问题：是通过搜索、整理、分析、描述数据等手段，以达到推断所测对象的本质，甚至预测对象未来的一门综合性科学，通过数学方式解决问题。统计学用到了大量的数学及其它学科的专业知识，其应用范围几乎覆盖了社会科学和自然科学的各个领域。统计方法：统计学一共有四种测量的尺度或是四种测量的方式。这...

关于统计学的基本问题答：1.算术平均数在统计学上的优点就是它较中位数、众数更少受到随机因素影响，缺点是它更容易受到极端数影响。2.在数列中出现了极端变量值的情况下，用中位数作为代表值要比用算术平均数更好，因为中位数不受极端变量值的影响；如果研究目的就是为了反映中间水平，当然也应该用中位数。在统计数据的处理...

统计学专业的存在问题答：存在的问题可概括如下：(1)统计学一级学科体系的建设尚须完善。统计学被教育部专业新目录列为一级学科，这是统计学顺应历史潮流，与国际接轨的重要举措。但这方面的宣传力度不够，甚至仍有许多统计教师认为理科的统计学就是数学，仍然不肯放弃前苏联文科式的统计学，甚至有相当一部分教师认为应将统计学...

大家正在搜

统计学有哪些问题可以问统计学简答题题库及答案统计学可以提的一些问题统计学中遇到的问题统计学重点笔记统计学的问题案例五个专业的统计问题数据统计的常见问题统计学答辩问题及答案