空中自体动力宣言吧 关注:4,966贴子:11,351
  • 2回复贴,共1

√。 |1207|研究|成为机器系统标示的特定族群之前。

只看楼主收藏回复



IP属地:中国台湾1楼2017-12-07 15:10回复
    史丹佛大学的 AI 辨识性取向研究中一个弱声明时常被忽略——在某些情况下,深度神经网络可以从交友网站异性恋用户的照片中辨认出同性恋用户的照片。我们确实不能说 AI 无法分辨同性恋,但是这样说也是不负责任的:该论文至少表明「 同性恋是可以识别的 」,以及这种技术可以被任何政府和组织轻松获取和使用。论文的高级研究员 Michael Kosinski 之前一篇引用量较多的论文——《 Private traits and attributes are predictable from digital records of human behavior 》,同样提示过这类问题。该论文至少对 Facebook 改变默认公开点赞记录的策略有部分贡献。 「 AI 辨识性取向 」研究除了受到学术界质疑,论文作者也被各种谩骂甚至收到威胁邮件。恐吓信寄件人认为作者是一个支持谋杀同性恋者的恐同**,期望有人出面杀了作者、或让他自行了断。
    Oberlin College 社会学教授 Greggor Mattson,就用一句话总结这篇论文引发的问题——AI无法判断你是不是 Gay,但它可以判断你是不是一个持有刻板印象的人。
    假如住在一个同性恋要被判处死刑的国家,网路用户必须面对这种可能性——你可能因为自己的社交媒体照片而受到额外的监控。假如你无法公开自己性取向,那更应该惊觉,机器学习推荐系统可能会将你标示为特定族群、并推荐适用于同性恋人群的商品。即便这项研究包含隐私风险的善意提醒,但仍然无法忽视:( 1 )模型的准确度存在疑虑( http://www.fast.ai/2017/09/13/kosinski/ )、( 2 )论文可能混淆了因果和关联性。( 3 )研究中试图把性取向结论导向「 产前激素理论( Prenatal Hormone Theory,PHT )」——即指,同性恋倾向来源于男性胎儿对决定性取向的雄性激素的暴露( Exposure )不足、或女性胎儿对雄性激素的暴露过度这样的论点。为了消除外界的质疑,论文作者亦对网上各种批评做出逐一回应:


    IP属地:中国台湾2楼2017-12-07 15:10
    回复
      一、
      该项目并非去创建一个侵犯隐私的工具,而是研究已被科技公司和政府部门广泛使用的现有技术,进而去判断它们是否存在侵犯 LGBTQ 人群个人隐私的风险( 研究结果表明这些技术确实存在这类隐私风险 )。
      二、
      研究中使用的( 35000 张同性恋以及异性恋的图片 )的材料多来自一个公开的数据集,且是经过用户自己标记的性取向而非研究方自行判断。研究中甚至还比对了 Facebook 上的个人资料图片独立进行测试,亦取得相近结果。( 贴文者提示:这部分引发另一个问题——所有社交网站上的公开信息是否就代表能被人随意启用? )。
      三、
      许多阅览者对论文反馈、表示这项研究是伪科学,因为——研究中的分类器使用的是固态( Fixed )和瞬态( Facial )面部特征。同性恋者和异性恋者不仅面孔形态不同,表情和修饰风格也不相同。但、研究结果显示,算法根据人脸来预测「 性取向 」确实会造成严重的隐私风险。
      四、
      在一些情况下、个人性取向被公开可能危及生命。LGBTQ 社区的成员仍然会受到来自政府、邻居、甚至家人身心上的虐待。许多国家将同性性行为定为犯罪行为,在某些地方,发生同性性行为的人甚至会被判处死刑。在铺天盖地能够获取脸部资讯的时代,控制什么时候、向谁透露个人性取向的能力,对于人类的安全也至关重要。提示决策者和 LGBTQ 社群意识到其所面临的风险,也是这项研究的目的之一。
      五、
      从科学角度来看,研究脸部特徵和性格之间的关联很有意思。这种关联识别能协助人们了解广泛的心理、生物和文化现象的起源与本质,所以把脸部特徵与其他现象进行连结,可以协助其他科学方法所进行的假设。诸如产前和产后激素水平、发育史、健康、环境因素和基因,这些难以测量的命题。
      六、
      分类器虽然不能指出哪个检测对象是同性恋,但是可以标记每个检测对象是同性恋的概率。虽然力求获得一个更加多样的样本,但是本研究的对象仅限于美国境内的白种人。虽然本研究并不能证明该结论同样适用于其他种族,但研究方发现、该结论有适用的可能性。相同的生物学、进化和文化因素促进了同性恋者和异性恋者之间差异的形成,这些因素也很可能会影响其他种族。
      七、
      研究使用的样本是公开性取向的约会网站会员,这是一个合理的限制因素,研究者已经在论文中围绕该因素进行了详细地讨论。从约会网站收集的图像数据存在一个问题:性取向信息特别明显。但研究方从 Facebook 上收集图像组成了一个外部样本,再用这个样本测试我们的分类器,结果准确度并不亚于用约会网站图像做样本时的准确度。#这表明Facebook个人档案图像与约会网站上的图像传达出的性取向信息一样明显( 这是把锅甩给 Facebook 的意思吗? 笑 )。
      八、
      研究中观察到的有关「 女人味 」和「 男人味 」的差异是很微妙的,并且这些差异存在于很多不同的脸部特征中;虽然人类难以察觉,但对灵敏一些的算法来说、那些差异已经算是显而易见。实验中还有一项争议,就是无法避免参与者在性取向上说谎。但 Michael Kosinski 认为———那些自愿在约会网站上发布资料寻找伙伴的人,几乎没有在性取向上撒谎的动机。


      IP属地:中国台湾3楼2017-12-07 15:11
      回复