统计中著名的佯谬与悖论
2006/10/05 晚
李晓煦
香港中文大学教育学院
lixiaoxu@
Paradox--佯谬 vs 悖论
佯谬:从常识上看是错的,实际上是对的;有时一个命题的对立面是佯谬,也被称为佯谬。
例:整体可以与部分一一对应,比如自然数集合与质数集合
{2,3,5,…} ={第k个质数| k=1,2,3,…}
{k;k=1,2,3,…}
悖论:因为隐含的条件未被揭示,一个命题竟然在形式上和它的对立面都是对的或者都是错的。
例:圓的弦大於内接正
三角形邊長的概率是1/2,
1/3或1/4
/~peterh/doc/
Simpson’s Paradox
加州大学伯克利分校研究生院被诉性别歧视,因为女生平均录取率显著低于男生。
Bickel, P. J., Hammel, E. A., and O'Connell, J. W. (1975). "Sex bias in Graduate admissions: data from Berkeley". Science 187: 398-404.
调查结果:基本上每个系女生录取率都高于或等于男生。
图解:只有两个系的简化情形(非真实数据)
假如只有数学和金融两个系,录取人数都是50人。
数学系男生录取率50%,女生录取率60%;
金融系男生录取率5%,女生录取率6%。
Jeon, J. W., Chung, H. Y., and Bae, J. S. (1987). Chances of Simpson’s Paradox. Journal of the Korean Statistical Society, 16, 117-125.
图解:更多系的情形(非真实数据)
箭头越往OFFER方向,录取率越高;
每个系女生(红)都比男生(蓝)录取率高;
总的录取率,男生大于女生
Simpson佯谬告诉我们什么
只要对照组和实验组的组成结构不同,效应就可能来自组成结构而不是实验处理。
从统计的显著到因果的结论,中间有关键的逻辑链条。绝大多数量化研究结果都会在这个环节受到隐含的质问。
Regression Towards the Mean
历史的误会:“回归”(Regression) 与趋中回归(Regression Towards the Mean)
F. Galton (1885
'98全国有线电视综合信息网学术研讨会论文集 (8) 来自淘豆网m.daumloan.com转载请标明出处.