偏差样本
偏差样本(Biased Sample)、不具代表性的样本(Unrepresentative Sample),系指根据缺乏代表性的样本推论出一般性的结论。相似地,偏差统计(biased statistics)则指根据不恰当的统计方法推论出一般性的结论。
常见样本缺乏代表性的原因,一是样本数太小,二是样本并非随机抽出,往往因某些因素导致偏差。
示例
编辑例1
然而,美国是美洲最富有的国家,不能代表美洲其他国家的情形,也不能代表整个美洲的情形。
例2那位学者出书声称父母教养方式和子女人格特质的相关性为零,所以父母的养育对子女无用。
一、这是一家之言,未必是学界共识,引用单一权威未达成共识的做法也涉及误用诉诸权威的谬误;二、父母教养对子女人格特质无影响不代表父母教养对子女全无影响。
例3
特定书籍或作者的言论,未必是学界共识,即使内容写得再有理也一样。
例4他是重点大学热门科系毕业的,结果还是长期失业、每天宅在家浪费时间打电玩,可见念好大学没有用。
然而有可能是这个人运气不好,或者自身性格真的有问题,或这人有其他的想法,因此就算念到好学校还是一样没有更好的就业前景,所以不能把他的状况类推到所有念重点大学热门科系的人身上。
例51936年美国总统选举前,《文学文摘》邮寄1,000万份问卷予其读者,回收230万份。他们预测共和党候选人阿尔夫·兰登会在531张选举人票中获得370张选票并胜过民主党候选人富兰克林·德拉诺·罗斯福。
该次总统大选,阿尔夫·兰登实际上只获得8张选举人票,而富兰克林·德拉诺·罗斯福则在大选中大胜。一个说法认为,《文学文摘》的读者相较于全美人口具有较高共和党人比例,故此他们更倾向于投票给阿尔夫·兰登。《文学文摘》的民调样本有明显的偏差。
例6某甲严词批判某乙的作为,还把事情闹得很大,而就我个人的经验来看,某乙是个好人,可见某甲只是无来由地厌恶某乙,或者妒忌某乙而已。某甲应该要放下自己的怒火,接纳某乙,甚至应该向某乙道歉。
然而有可能其实是某乙一直都在搞小动作,把某甲逼到抓狂,或者有其他的理由,所以才会发生这样的事情的。因此不能因为跟一个人一两次的交流经验,而对一个人的性格下评断,尤其不应该下负面的评断。
例7新闻常常在报性侵诬告、性骚扰诬告,可见性侵和性骚扰案一堆都是诬告,是女生跟男生上床后,企图对男生仙人跳而搞出来的。
然而性侵犯和性骚扰极度常见,研究也显示性侵犯和性骚扰的诬告率不高于其他犯罪,因此有可能是因为性侵犯和性骚扰被告上法院的案子非常多,所以诬告的总量也多,以致产生了性侵和性骚扰案件一堆诬告的错觉,甚至媒体的选择性报导也可能有影响,因此不能因为常常看见有性侵和性骚扰诬告的消息,就认定性侵和性骚扰的案子更有可能是诬告的。
偏差样本的形式
编辑常见偏差样本谬误的形式如下: