网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
05月14日漏签0天
人工智能吧 关注:114,201贴子:505,626
  • 看贴

  • 图片

  • 吧主推荐

  • 视频

  • 游戏

  • 15回复贴,共1页
<<返回人工智能吧
>0< 加载中...

有没有讨论视觉信息反馈这方面的论文

  • 只看楼主
  • 收藏

  • 回复
  • 42Neptune
  • 贾维斯
    9
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
比如说要做一个CNN,用已经学习到的特征,通过反馈连接增强输入,这方面有没有已有的工作可以介绍一下?就像以前这篇讨论贴一样http://tieba.baidu.com/p/3720269491?share=9105&fr=share


  • 42Neptune
  • 贾维斯
    9
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
@click4i @ieBugH


2025-05-14 21:33:21
广告
  • ieBugH
  • 9S
    12
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
我来说一下自己对注意力的最新理解吧。大脑需要running as fast as it can,因此大多数时候需要处于非注意力集中状态,反馈只起预测加速前馈过程的作用。当输入存在复杂结构而有必要弄清其结构时,这时大脑才会提高警戒度,串行地逐个注意其中的重要元素,这样就能完成what 和where的绑定(具体见后续链接)。另一种角度,即使不考虑what和where绑定,这种串行访问也是必须的:在大多数时候大脑在做平均场近似,即多个元素的单独贡献的平均效果近似于多个元素的平均值的贡献,显然只有一个元素时,是完全正确的,当元素增多时,就可能偏差较大,有些重要的东西会被平均掉,此时逐个计算每个元素的贡献就变得有必要。可以认为这是元素与贡献的绑定,在大多数时候元素与贡献是不绑定的,多个元素共同前馈,我们不知道贡献具体是由谁产生的。
注意力集中在于选择某个线索,如what或者具体的贡献,通过top down的按内容访问,匹配加强符号的元素,并去读出符合what/具体贡献的某个元素,由于注意力集中,很多信息都不再是平均,而是该元素对应信息的精确描述。因此注意力的选择性,或者说是序列访问,是为了给信息一个瓶颈,使得信息的结构得到保留。这也是在弥补恒常性系统完成各种不变性带来的缺点,因为这种不变性使得其它信息丢失了。


  • ieBugH
  • 9S
    12
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
认知、神经方面的论文就不要看了,比较耗精力。已经有很多用注意力解决绑定问题的ANN例子:
Look and Think Twice: Capturing Top-Down Visual Attention With Feedback Convolutional Neural Networks
http://www.ics.uci.edu/~yyang8/research/feedback/feedback-iccv2015.pdf
ABC-CNN: An Attention Based Convolutional Neural Network for Visual Question Answering
https://arxiv.org/pdf/1511.05960v2.pdf
用在生成句子我认为注意力是相当必要的,不如根本无法理解各个物体的空间关系
MULTIPLE OBJECT RECOGNITION WITH VISUAL ATTENTION
https://arxiv.org/pdf/1412.7755v2.pdf
Attention to Scale: Scale-aware Semantic Image Segmentation
http://www.ics.uci.edu/~yyang8/research/attention-scale/attention-scale-cvpr2016.pdf


  • 42Neptune
  • 贾维斯
    9
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
多谢各位了


  • click4i
  • T800
    10
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
找工作不能太挑剔的啊。如果心里就净是要找完全像一楼提的那样的研究的话,那就太难了。一般来说如果找到的工作是用 CNN 做视觉也就可以算是对上了,即使研究思路完全不同。


  • click4i
  • T800
    10
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
这里有篇论文或许对你有用: Learning to Generate Chairs with Convolutional Neural Networks - https://www.robots.ox.ac.uk/~vgg/rg/papers/Dosovitskiy_Learning_to_Generate_2015_CVPR_paper.pdf
这个的做法是先训练一个标准型的CNN,然后另加一个倒反过来的CNN(upside-down CNN with unpooling) 就可以做物体影像的合成及分割。例如给予两种椅子的图像样本,这系统可以学会如何合成从未见过的椅子样式和视角的图像。
这种做法或许不能说是在模拟 IT皮层V4、V2、V1反馈连接(见http://tieba.baidu.com/p/3720269491?share=9105&fr=share), 不过显然是相当实际可行。照这个思路做延伸该可以做出不少有意思的东西出来。


  • Q企鹅474153381
  • 人脸辨识
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
我可以帮你先写一个提纲,也许你就有思路了的


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 15回复贴,共1页
<<返回人工智能吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示