在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。当人们尝试探究两种变量是否具有相关性的时候,比如新生录取率与性别,报酬与性别等,会分别对之进行分组研究。辛普森悖论是在这种研究中,在某些前提下有时会产生的一种现象,即在分组比较中都占优势的一方,会在总评中反而是失势的一方。
分析:这个问题是求答案的,要求对“为什么会出现这种现象”给出答案。所有思考这个问题的人都是第一回答主体。
从优势变成失势有些莫名其妙,违反人们的常识(产生了违反认知的现象),且人们不知道原因(惑于原因不明),所以把这种现象当成了悖论。
我们拿甲、乙双方进行比较,说:甲比乙优。这是关系判断。“甲”是关系者前项,“比……优”是关系项,“乙”是关系者后项。双方的比较是以具体内容(比如数据)进行比较的,在分组比较中都占优势的一方虽然占优势,但没有使用能说明具体优势情况的数据,“优”之后的关系者后项及其量项存在缺失的问题(这样的问题不违反认知)。总评是把分组比较时的两个关系判断中的关系者前项、关系者后项及其量项分别合并,给出一个新的关系判断。此时所比较的双方的具体数据即关系者后项及其量项进行了合并,分组比较时占优势的关系者后项及其量项就可能会变成劣势的关系者后项及其量项,所以就不会再占优势了。例如甲乙两个学校男女比例数据:
理科的数据:
男生人数 女生人数 男:女
甲学校 54 9 6:1(大)
乙学校 100 50 2:1
文科的数据:
男生人数 女生人数 男:女
甲学校 50 200 0.25:1(大)
乙学校 9 90 0.1:1
学校整体数据(即前文提到两个专业人数之和):
男生人数 女生人数 男:女
甲学校 104 209 0.498:1
乙学校 109 140 0.779:1(大!)
甲学校理科中男女生的比例大于乙学校理科中男女生的比例,甲学校文科中男女生的比例大于乙学校文科中男女生的比例,但分别把两个学校的理科和文科学生数合并到一起,却是乙学校男女生的比例大于甲学校男女生的比例。
面对这个问题的回答主体知道上述原因后,即可消除“惑于原因不明”的问题,在判断中把能说明关系者前项与关系者后项之间具体情况的数据表述清楚,解决关系者后项及其量项缺失的问题,就不会再对答案感到违反认知,即可消解这个悖论。
分析:这个问题是求答案的,要求对“为什么会出现这种现象”给出答案。所有思考这个问题的人都是第一回答主体。
从优势变成失势有些莫名其妙,违反人们的常识(产生了违反认知的现象),且人们不知道原因(惑于原因不明),所以把这种现象当成了悖论。
我们拿甲、乙双方进行比较,说:甲比乙优。这是关系判断。“甲”是关系者前项,“比……优”是关系项,“乙”是关系者后项。双方的比较是以具体内容(比如数据)进行比较的,在分组比较中都占优势的一方虽然占优势,但没有使用能说明具体优势情况的数据,“优”之后的关系者后项及其量项存在缺失的问题(这样的问题不违反认知)。总评是把分组比较时的两个关系判断中的关系者前项、关系者后项及其量项分别合并,给出一个新的关系判断。此时所比较的双方的具体数据即关系者后项及其量项进行了合并,分组比较时占优势的关系者后项及其量项就可能会变成劣势的关系者后项及其量项,所以就不会再占优势了。例如甲乙两个学校男女比例数据:
理科的数据:
男生人数 女生人数 男:女
甲学校 54 9 6:1(大)
乙学校 100 50 2:1
文科的数据:
男生人数 女生人数 男:女
甲学校 50 200 0.25:1(大)
乙学校 9 90 0.1:1
学校整体数据(即前文提到两个专业人数之和):
男生人数 女生人数 男:女
甲学校 104 209 0.498:1
乙学校 109 140 0.779:1(大!)
甲学校理科中男女生的比例大于乙学校理科中男女生的比例,甲学校文科中男女生的比例大于乙学校文科中男女生的比例,但分别把两个学校的理科和文科学生数合并到一起,却是乙学校男女生的比例大于甲学校男女生的比例。
面对这个问题的回答主体知道上述原因后,即可消除“惑于原因不明”的问题,在判断中把能说明关系者前项与关系者后项之间具体情况的数据表述清楚,解决关系者后项及其量项缺失的问题,就不会再对答案感到违反认知,即可消解这个悖论。