欧陆风云4吧 关注:340,450贴子:10,493,503

【并没有什么用的技术贴】基于维基的mtth解释

只看楼主收藏回复

吧里有个关于mtth维基翻译的精品帖,但是结论方面跟我看维基后的理解有些出入,所以讲一下自己的看法,不妥之处望涵。
对修过概率论这门课的吧友来说,可以一句话概括:mtth不变的情况下,只发生一次事件服从几何分布,可重复事件服从二项分布。
以下【】内是我的解释,其余是维基转述或翻译


IP属地:浙江1楼2017-04-04 03:36回复
    首先维基上第一段话解释了事件发生的机制,这点大家都清楚不再赘述。
    然后维基讲"mean time to happen"中的mean实际上并非真正意义上的mean(均值/数学期望)而是median(通译为中位数),就是说当mtth=120个月的时候,那么在满足条件后的120个月内事件触发的概率是50%。
    【注意这个描述"the amount of time during which there is a 50% chance of theevent occurring by that time"里的during和by,是120个月内发生而非第120个月发生的概率,120月内发生的概率意味着"第1个月发生概率+第2个月发生概率+....+第120个月发生概率"。下面有推导】


    IP属地:浙江2楼2017-04-04 03:36
    收起回复
      维基的第一个公式描述:
      引擎每EVENT_PROCESS_OFFSET天检测一次事件是否发生,EVENT_PROCESS_OFFSET默认设置为20【define文件里可改】。每次检测(事件是否发生的)概率为
      (1)
      其中tc是EVENT_PROCESS_OFFSET【20】,t1/2是中位数【也就是mtth的值,上文说过mtth实际就是中位数】
      【那么很明显,这里当mtth不变的时候,这个概率(记作小写p)是一个常量,也就是说同一事件每次检测时的概率是独立于时间的。(统计学上把这每一次检测称为一次伯努利试验。)所以mtth不变时每次检测时的触发概率是不变的,只有mtth受到factor影响时这个概率才会相应变化。】
      【可以检验一下,mtth=80的时候,每次检测事件发生的概率为1-2-20/80=0.159,那么
      恰好在第20天发生的概率为0.159
      第40天为(1-0.159)*0.159=0.134
      第60天为(1-0.159)2*0.159=0.112
      第80天为(1-0.159)3*0.159=0.095
      将其相加80天内发生事件的概率(记作大写P)0.159+0.134+0.112+0.095=0.5=50%
      完全符合上文所述。
      这这种概率分布就是统计学上所说的几何分布。】
      【解释一下为什么要*(1-0.159)n-1。第40天的概率为0.134并不是说发生第40天检测的时候触发概率为0.134(依然是0.159),而是说1)第40天能够发生检测2)第40天成功触发事件,这两件事同时发生的概率为0.134。而很明显如果第20天事件触发成功了,第40天根本不会再发生检测】
      【重复一遍结论:每一次检测单独看,mtth不变时触发概率是不变的;只有从整体来看这个概率才是累加的,这个累加只是因为检测次数多。举例讲,抛一次硬币得到正面的概率只有50%,但给你30次机会抛到正面的概率肯定大得多,但如果前29次都确定失败了,单独看第30次,正面概率依然是50%】
      【其实对于玩家来讲,知道每次检测时的触发概率跟时间无关这一点就足够了,下面是对维基后面部分的解释。】


      IP属地:浙江3楼2017-04-04 03:40
      回复
        忘了贴吧并不能正确显示上下标......


        IP属地:浙江4楼2017-04-04 03:43
        回复



          IP属地:浙江5楼2017-04-04 03:48
          回复


            IP属地:浙江6楼2017-04-04 03:50
            回复
              然后就是大家熟悉的这张图

              【这张图比文字靠谱,至少纵坐标注明了cumulative chance,也就是累加概率大写P。稍微吐槽,这张图表示的mtth=365天,也就是只经过18次检测,哪个位面的大数定律认为18次试验能收敛住…..维基作者自己也说mtth较大的时候接近效果才好,不过问题倒也不大就是了】


              IP属地:浙江7楼2017-04-04 03:51
              回复


                IP属地:浙江8楼2017-04-04 03:53
                回复
                  维基最后一句
                  对于可重复事件来说,事件发生数与检测次数的关系服从二项分布,当mtth很长时,可以用泊松分布来进行逼近。
                  【说得很对,然而维基并没有进一步算下去,大多数人也不知道这是什么鬼,有兴趣的自行百度泊松逼近】
                  本贴终~
                  我也知道没人想上数学课,但又实在找不到别的办法讲清楚…...半夜写那么个帖子我自己也感觉是脑抽了,偷偷发了吧~


                  IP属地:浙江9楼2017-04-04 03:54
                  回复
                    资次,不过wiki上遇到列等式的(一个是这个,一个是算贸易)我都是绕过的


                    IP属地:上海来自iPhone客户端10楼2017-04-04 05:38
                    收起回复
                      其实最重要的是这张图。


                      IP属地:广东来自Android客户端11楼2017-04-04 09:42
                      收起回复
                        资词技术贴


                        IP属地:江苏来自iPhone客户端12楼2017-04-04 09:52
                        收起回复
                          楼主好人


                          来自Android客户端13楼2017-04-04 09:54
                          回复
                            看上去其实更像是指数分布吧

                            可以把2看成四舍五入的自然常数。


                            IP属地:广东14楼2017-04-04 13:53
                            收起回复
                              既然被楼上看穿了那把电脑里剩下一段也贴上来
                              【公式(4)其实是指数分布的分布函数,而(2)与(4)等价,也可以视为一个分布函数。而分布函数的定义为F(x)=P(X《=x),其中X是随机变量,x是某个给定值,比如要计算前200天内事件发生的概率,则x=200。】
                              【可以看出维基作者的思路很清晰,就是使用指数分布逼近几何分布,这跟泊松逼近二项一样,都是统计中很常用的手法(不过看他那么执着地使用这两种逼近,八成是保险或质检行业相关)。而且依靠这个案例的特殊性和使用了一些反推,大幅简化了这个推导过程,当然一般性的推导也说不上太复杂,但一个幂级数展开多半是逃不掉的。】
                              【大家如果百度指数分布,第一条就会告诉你”指数函数的一个重要特征是无记忆性”,就是说每个单位时间内事件发生的概率是独立的,与时间t并无关联,这进一步佐证了我的结论。(这部分演算很容易搜到,我就不折腾了,多半也没人看)】


                              IP属地:浙江15楼2017-04-04 21:22
                              回复