数理统计
rf: 主要思路是通过抽样数据,来预测整体的分布(先假设分布(正态分布或者t分布),在做假设检验)。 一般:小于30个样本就用t分布;如果超过30个样本,根据大数定律,t分布就趋近于正态分布,就用正态分布了。 预测总体的分布后,应用: 1、假设的分布是对的(置信区间):预测其他数值 2、假设的分布是错的(置信区间):不是这个分布(这个分布函数不能描述这种场合),或者样本中有较多的异常数据(不是这种场合产生的数据) 上述的基础假设是:数据是独立的、同分布的。同分布的意思就是说:同样的场合下产生的数据应该具有同样的性质和特性,即同样的分布、同样的函数表达。