逻辑吧 关注:115,724贴子:605,533

掷硬币游戏:规则是每次必须押注当前所有的现金猜掷硬币的正反面

只看楼主收藏回复

掷硬币游戏:规则是每次必须押注当前所有的现金猜掷硬币的正反面(概率都是1/2)。如果猜对获得本金2倍的奖励,如果猜错只能获得本金的1/100。如果可以玩无限多次,那么从期望值的角度来看,每次猜对收益是100%,猜错收益是-99%,总期望值为正,所以玩无限多次以后获得现金期望值应该是无限多的。而从大数定律角度来看,玩无限多次以后猜对与猜错的频率都会逐渐接近50%,最终获得的现金将会无限少。那么问题出在哪呢?


IP属地:辽宁来自Android客户端1楼2019-11-13 20:43回复
    期望收益计算
    记必须玩k把时,期望收益为q_k,有
    q_1=2*1/2+1/100*1/2-1=1/200
    q_k=2*1/2*q_(k-1)+1/100*1/2*q_(k-1)=201/200*q_(k-1)
    明显次数越多,期望收益越大。
    不理解,如何得到,从大数定律角度,最终获得现金会无限少?


    IP属地:湖北来自Android客户端2楼2019-11-14 01:29
    回复
      楼上期望收益计算错了
      q_k=2*1/2*(q_(k-1)+1)+1/100*1/2*(q_(k-1)+1)-1=201/200*q_(k-1)+1/200

      q_k=201/200^k-1
      不过楼上结论不变


      IP属地:湖北来自Android客户端3楼2019-11-14 01:56
      收起回复
        这个问题有意思。
        首先我认为肯定是血亏旳。
        相当于,赢了 总资产×2,输了 总资产×0.01。
        那么 当输、赢数量差不多的时候:
        最终金钱=总资产 ×2 ×0.01×2×0.01×2×0.01…… (顺序无所谓)
        ------------------
        至于【每次猜对收益是100%,猜错收益是-99%】,所以参加单次,收益期望为正数,这也没错。
        比如初始资金是100,猜对得100,猜错扣99,收益期望0.5元。
        但这个期望为正 的意思是,不停的重复用【100元初始资金】参加这个游戏(重复次数为K),总收益期望为0.5k
        这是建立在一种纵向的无穷思维上,而不是说这个游戏重复无穷步期望为正。
        第二段解释的可能不够好,先这样。


        IP属地:天津5楼2019-11-14 05:40
        收起回复
          我看懂2楼的意思了,他的意思是:
          对于任意有限回合而言,期望都是>1的。
          所以,当回合数趋于无穷时,期望还是>1。
          换句话说,对于任意有限回合而言,都有 【全部为正】的可能性。
          只不过随着 回合数趋于无穷,全部为正的可能性越来越小(趋近于0)。
          -------------------------------------------------------------------------
          而这种观点,也许与【大数定律】是相冲突的,大树定律本身,应该是否定【全部为正】的可能性。
          再进一步说,2楼认为【游戏会停】,停在哪个回合,期望都是>1的。
          而题目本身要求的是【游戏不会停(无限回合)】,这种奇怪的要求 配上大数定律,就可能会产生争论。


          IP属地:天津7楼2019-11-14 10:15
          回复
            再说的简单一点:
            2楼认为,无论局数n是多大的【有限数字】,期望都是>1的(都会有很小的概率,正面次数比反面次数多几倍)。
            而在奇怪的题目要求(游戏不能停、无限回合)下:
            大数定律认为:无论你取得n是多大的有限数字 从而出现【正面次数比反面次数多几倍】的情况,我都能在后面接上无穷局来抹平这个差值倍数。


            IP属地:天津8楼2019-11-14 10:27
            收起回复
              首先,钱不是无限可分的
              其次,我觉得你期望收益算错了。
              输1次变成0.001,需要连赢10次才能略超过输之前的钱(1.024)
              对比输1次的概率1/2和连赢10次的概率1/1024
              毫无疑问血亏……


              IP属地:北京10楼2019-11-14 10:45
              回复
                2楼的思维是在【纵向】上:老子实验【无穷次】,总会有【全正】或者【几乎全正】的情况出现,出现一次就翻盘。
                大数定律的思维是在【横向】上:老子没让你实验无穷次,这次实验就得重复【无穷回合】,总会抹平你的 【几乎全正】。


                IP属地:天津12楼2019-11-14 10:56
                回复
                  圣彼得堡悖论
                  有一硬币,记第一次抛的结果是正时共抛了n,此时你能获得2^n元。很明显你期望收入为
                  2*1/2+4*1/4+……+2^n*1/2^n+……=∞
                  那么你愿意花多少钱参与这个游戏呢?
                  按照数学家的说法,超过25、6元参与这个游戏都是不值得的。
                  具体分析有多种解释,有兴趣可以自行搜索“圣彼得堡悖论”


                  IP属地:湖北来自Android客户端13楼2019-11-14 11:12
                  收起回复
                    第一次抛的结果是正时共抛了n次。(n后面打掉了个次字)


                    IP属地:湖北来自Android客户端14楼2019-11-14 11:14
                    回复
                      大数定律不是那么用的


                      来自Android客户端16楼2019-11-14 14:08
                      回复
                        大数定律是说,对任意ξ>0,P(|m/n-0.5|<ξ)--->1 (n-->∞),其中n为抛硬币的次数,m为猜错的次数。
                        简单的来说,随着次数的增加,猜错的频率在0.5附近的概率趋于1。
                        用第一种方式来解答就是,随着次数的增加,现金越来越少(a)的概率p趋于1,越来越多(b)的概率q趋于0;
                        但 pa+qb 就是总期望 却越来越大。
                        简单的来说,就是 输的可能性很大,但输的少;赢钱的可能性很小,但赢的多。


                        17楼2019-11-14 14:27
                        回复
                          期望收益大于0,但实际收益会小于0,还有一个更直观点的悖论(不知道悖论具体名称)
                          甲和乙参与一个掷硬币游戏
                          规则a_1,甲期望收益大于0,乙期望收益小于0。
                          规则a_2,甲期望收益大于0,乙期望收益小于0。
                          ……
                          规则a_k,甲期望收益大于0,乙期望收益小于0。
                          那么k是有限数值时,同时接受所有规则,也应该是甲期望收益大于0,乙期望收益小于0吗?
                          k是趋于无限时,同时接受所有规则,也是甲期望收益大于0,乙期望收益小于0吗?
                          以上两问,相信所有人都认为甲期望收益大于0。那么悖论来了
                          甲和乙掷硬币,记硬币第一次是正面,共掷硬币n次。
                          规则a_1。当n=1时,甲给乙1元,当n=2时,乙给甲3元。n是其他数字,不赚不赔。(此时甲期望收益是-1*1/2+3*1/4=1/4)
                          规则a_2。当n=2时,甲给乙4元,当n=3时,乙给甲9元。n是其他数字,不赚不赔。(此时甲期望收益是-4*1/4+9*1/8=1/8)
                          ……
                          规则a_k,当n=k时,甲给乙3^(k-1)+1元,当n=k+1时,乙给甲3^k元。n是其他数字,不赚不赔。(此时甲期望收益是-(3^(k-1)+1)*1/2^k+3^k*1/2^(k+1)=(3^(k-1)-2)*1/2^(k+1),由于k≥2,所以甲期望收益大于0)
                          当k趋于无限,所有规则都接受时,
                          n=1,甲给乙1元
                          n=m,由规则a_(m-1),乙给甲3^m元,由规则a_m,甲给乙3^m+1元,综合,甲给乙1元。
                          即无论n是哪个具体数值,都是甲给乙1元。
                          也就是,存在期望收益大于0,但实际收益永远小于0的情况。
                          解释也有很多,不过由于这个悖论很直观,所以可以明显看出
                          当k是有限数值时,甲的期望收益大于0,且甲确实有概率实际收益大于0。而k趋于无限时就出现了悖论。
                          所以个人认为是,边际效用。在计算期望收益时,就算次数是无限次,我们依然可以计算,但趋于无限如果实际不可能做到,那么趋于无限的收益是不可兑现收益,那么实际运用中,对于趋于无限时能获得的期望收益可以不做考虑。
                          如楼主的问题,正翻倍,反1/100,假设掷硬币k次,那么计算期望收益时,实际是按掷了2^k轮(每轮掷k次),每轮每种情况平均分配来计算的,而掷k轮,总次数明显是成几何叠加的,其趋于无限的速度明显比k要快得多。而每轮时能收益的概率又是成几何缩小的。近似的可以认为,2^k个人依次参与,每人都掷k次,能收益的人在队列中排列靠后。也就是楼主的问题,在计算期望收益时,能获得收益的情况随掷的次数增加,就越大可能是趋于无限时的不可兑现收益。也就是边际效用,随着次数增加,边际效用变小。


                          IP属地:湖北来自Android客户端18楼2019-11-14 14:53
                          回复
                            我觉得就是期望算法错了,我之前做程序模拟测试的时候脑袋一抽还算错一次。
                            然后我把之前发的帖子删了……我重新发一遍。
                            @gf10025
                            我觉得有一个基本逻辑如下:
                            A事件有B结果,现在有公式C,如果导入A事件通过公式C得到的结果B1与实际结果B差异很小,可以认为公式C可是对A→B的模拟。
                            如果结果B1与实际结果B差距很大,不应该认为是“悖论”,而是因为公式C不是对A→B的模拟,简单来说就是,公式C错了。
                            我认为
                            单独算一场,期望算法是
                            q_1=2*1/2+1/100*1/2-1=1/200
                            连续玩,期望算法是
                            2^k/2*0.01^k/2=3.2E-9
                            我程序玩了50000场,100元平均收益0.0040846。与算法相同。
                            连续玩10场。用q_k=2^(k/2)*(1/100)^(k/2)算出来期望收益是3.2E-09
                            用程序玩10场,连续玩40960次,100元平均收益是-2.0378,至少不是正的。
                            与q_k=201/200^k-1=1.005^10-1=0.5114,100元收益51.14相差很远。
                            所以说明连续玩的期望收益不是q_k=201/200^k-1。
                            中间我曾经以为自己弄错了。
                            因为我连续玩10盘之后的结果忘了减去100了,那时候连续玩40960次(一共40万盘),100元的平均收益是40多。
                            所以,我觉得连续玩的期望公式错了。


                            IP属地:北京21楼2019-11-15 15:28
                            收起回复
                              当时打掉了括号,期望收益是(201/200)^k-1,不过貌似你也是这样认为我的结果。
                              单独一场,没疑问
                              假设是2场,2场有4种情况,正正,正反,反正,反反,则期望收益是1/2^2*(2^2+2*1/100+2*1/100+1/100^2)-1=1/2^2*(2+1/100)^2-1=(201/200)^2-1
                              而5楼说明了,正反顺序对结果无影响,然后我在5楼的楼中楼又按照游戏n次,正出现的次数为m次(m从0到n),这样的思路得到同样结果。
                              实际上期望收益为正是肯定的。玩n次,这n次都是正的概率为1/2^n,收入为2^n,仅此一种情况时,期望收益就是1/1^n*2^n-1=0。那么其他情况时的收入就是纯收益。所以整体期望收益必然大于0。
                              所以个人怀疑你的模拟有问题。


                              IP属地:湖北来自Android客户端22楼2019-11-15 19:57
                              收起回复