先上图吧:
昨天看到的公告,总觉得数据在欺骗我们,于是今天仔细思考了一下天刀CH优化的目标函数和存在的问题。
(不要杠)首先,本帖假设公告给出的数据为真。但即便这样,目前的论剑就合理了吗?
我们不妨更进一步假设所有职业的论剑胜率均为50%左右,而让所有职业的论剑胜率均为50%左右也很可能就是CH的目标。假设每个职业的论剑胜率为Ri(i取1到7,表示7个职业),我们可以认为CH想要最小化的目标函数为:
乍一看这个目标好像没什么问题,但仔细一想却不是这样。举个例子,就拿我玩的幻神职业唐门来说,至少大家应该认可它的上限高,下限也低吧。这会造成什么后果呢?以打真武为例(dbq我不是针对真武),我列个表来表示:
注意,上面的列名表示“玩家所能达到的最高段位”,也就是说,假如我的实际操作水平就只有“白虹”水平,那么我从一段到白虹所有的场次数据均应该算到“白虹-造极”这一列中。行名的平均表示在给定的段位,对不同职业的胜率平均;列名的平均表示所有数据的平均,也是我们之前提到的Ri,也就是CH实际只关注并给出的数据。
大家懂我意思了吧?平均胜率是50%,但是不同段位的玩家胜率可能完全不同。同样地,我们“假设”真武是一个上限不高下限也不低比较无脑的职业,那么它的胜率很可能是下面的形式:
我相信,玩游戏的大多数还是娱乐党吧,毕竟做主播或者dd的还是少数吧。那么,娱乐党们,如果CH告诉了你这样的数据,你们会玩哪个职业,不用我说了吧。
当然,上面的数据全都是我伪造的,存在一定夸张的行为。但实际上,我只是想表达一个思想:CH们想要优化的目标函数是存在问题的。
那么,问题在哪呢?很显然,就是不同段位胜率的“波动率”。在统计学中,我们常用方差/标准差来衡量波动率。
这其实和我们在实际生活中的投资决策很像,懂金融的老哥一定知道Markowitz的资产配置理论,优化的是下面的目标函数:
其中w是不同资产的权重向量,R是资产收益率向量,大写的sigma是不同资产的协方差矩阵,表示风险,lambda是一个预设参数。当然这太过繁琐,大家可以理解为,我们在实际投资的时候不能只关注预期回报率,也要关注我们的投资风险。
基于这个思想,建议CH大大们也能沿着这个思路修改一下自己的目标函数,在考虑平均胜率的同时考虑风险。更进一步地,可以考虑更多的如下表的数据:
这一张表代表某一个职业对战其他全部职业的胜率,一共7个职业,所以一共可以列出7张这样的表格。当然,对战本职业的胜率一定都是50%,也就是说每张表都有一行是没有意义的。如上所述,目前CH们仅考虑了我在图中标出来的格子的数据,但实际上有更多的数据需要去考虑。
更多地,给CH们提个醒,从运筹学的角度,CH们可以考虑不同职业不同段位的玩家的氪金程度,在目标函数中赋予不同的权重,怎么样最大化自己的羊毛。至于怎么做,怎么优化,这是CH你们的事,这是你们数据分析师的事。
写在最后:我们常说,数据会说谎。然而,实际上,数据永远不会说谎,只是你自己用错了数据欺骗自己。
昨天看到的公告,总觉得数据在欺骗我们,于是今天仔细思考了一下天刀CH优化的目标函数和存在的问题。
(不要杠)首先,本帖假设公告给出的数据为真。但即便这样,目前的论剑就合理了吗?
我们不妨更进一步假设所有职业的论剑胜率均为50%左右,而让所有职业的论剑胜率均为50%左右也很可能就是CH的目标。假设每个职业的论剑胜率为Ri(i取1到7,表示7个职业),我们可以认为CH想要最小化的目标函数为:
乍一看这个目标好像没什么问题,但仔细一想却不是这样。举个例子,就拿我玩的幻神职业唐门来说,至少大家应该认可它的上限高,下限也低吧。这会造成什么后果呢?以打真武为例(dbq我不是针对真武),我列个表来表示:
注意,上面的列名表示“玩家所能达到的最高段位”,也就是说,假如我的实际操作水平就只有“白虹”水平,那么我从一段到白虹所有的场次数据均应该算到“白虹-造极”这一列中。行名的平均表示在给定的段位,对不同职业的胜率平均;列名的平均表示所有数据的平均,也是我们之前提到的Ri,也就是CH实际只关注并给出的数据。
大家懂我意思了吧?平均胜率是50%,但是不同段位的玩家胜率可能完全不同。同样地,我们“假设”真武是一个上限不高下限也不低比较无脑的职业,那么它的胜率很可能是下面的形式:
我相信,玩游戏的大多数还是娱乐党吧,毕竟做主播或者dd的还是少数吧。那么,娱乐党们,如果CH告诉了你这样的数据,你们会玩哪个职业,不用我说了吧。
当然,上面的数据全都是我伪造的,存在一定夸张的行为。但实际上,我只是想表达一个思想:CH们想要优化的目标函数是存在问题的。
那么,问题在哪呢?很显然,就是不同段位胜率的“波动率”。在统计学中,我们常用方差/标准差来衡量波动率。
这其实和我们在实际生活中的投资决策很像,懂金融的老哥一定知道Markowitz的资产配置理论,优化的是下面的目标函数:
其中w是不同资产的权重向量,R是资产收益率向量,大写的sigma是不同资产的协方差矩阵,表示风险,lambda是一个预设参数。当然这太过繁琐,大家可以理解为,我们在实际投资的时候不能只关注预期回报率,也要关注我们的投资风险。
基于这个思想,建议CH大大们也能沿着这个思路修改一下自己的目标函数,在考虑平均胜率的同时考虑风险。更进一步地,可以考虑更多的如下表的数据:
这一张表代表某一个职业对战其他全部职业的胜率,一共7个职业,所以一共可以列出7张这样的表格。当然,对战本职业的胜率一定都是50%,也就是说每张表都有一行是没有意义的。如上所述,目前CH们仅考虑了我在图中标出来的格子的数据,但实际上有更多的数据需要去考虑。
更多地,给CH们提个醒,从运筹学的角度,CH们可以考虑不同职业不同段位的玩家的氪金程度,在目标函数中赋予不同的权重,怎么样最大化自己的羊毛。至于怎么做,怎么优化,这是CH你们的事,这是你们数据分析师的事。
写在最后:我们常说,数据会说谎。然而,实际上,数据永远不会说谎,只是你自己用错了数据欺骗自己。