用jupyter读取csv,导入pandas,算了均值与标准差,如何删除偏差值大于三倍标准差的数据?
问题描述:
答
def f2(data,col):
m = data[col].mean()
v = data[col].var()
t1 = m - 3*v
t2 = m + 3*v
return data[(data[col]>t1)&(data[col]<t2)]
定义这样一个函数