如何从统计意义上判断两个数据集的相似度?

可以想象两组统计数据,不妨假设二维数据,即为平面上两个图形。要衡量这两个图形的相似度的话,不仅要求其中心重合,还要其外形轮廓也大体相似,那么应该用何种量化标准?数据的协方差矩阵可否?
请给出统计意义下的一个大体的量化标准

事实上用统计来说判断两个数据集的相似度的方法不是很好!
以下是我的几点猜想!
1:假设把整个数据化成条形统计图!长方形的形状和大小应相似有个前提,就是数据图要比较精确 否则,误差很大!
2:我们知道:条形图的长方形的面积是 频率 那么两个数据集的频率也因接近!
还有频数
貌似只有这些了,我必修三数学基本上没听过课,说一没办法继续帮助你!请见谅!
有什么问题可以请教《数学麦圈》呵呵!
温馨提示:答案为网友推荐,仅供参考
相似回答