Open Nav

参与和互动:视频理解的高阶对象交互

以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.仅供学习参考之用.
   帮助中心
资料介绍:

参与和互动:视频理解的高阶对象交互(中文6100字,英文PDF)
摘要
人类行为通常涉及场景中几个相互关联的对象之间的复杂交互。然而,现有的细粒度视频理解或视觉关系检测方法通常依赖于单个对象表示或成对对象关系。此外,在数百帧的视频中跨多个对象进行学习交互在计算上是不可行的,并且由于必须对大的组合空间进行建模,因此性能可能会受到影响。在本文中,我们建议有效地学习任意子组之间的高阶交互,以便细粒度的视频理解。我们证明建模对象交互显着提高了动作识别和视频字幕的准确性,同时比传统的成对关系节省了3倍以上的计算量。所提出的方法在两个大规模数据集上得到验证:Kinetics和ActivityNet Captions。即使视频以最大1 FPS采样,我们的SINet和SINet-Caption也能在两个数据集上实现最先进的性能。据我们所知,这是在开放域大规模视频数据集上建模对象交互的第一个工作,我们还模拟了高阶对象交互,以低计算成本提高性能。
  [资料来源:http://www.doc163.com]

参与和互动:视频理解的高阶对象交互

  [版权所有:http://DOC163.com]

  • 关于资料
    提供的资料属本站所有,真实可靠,确保下载的内容与网页资料介绍一致.
  • 如何下载
    提供下载链接或发送至您的邮箱,资料可重复发送,若未收到请联系客服.
  • 疑难帮助
    下载后提供一定的帮助,收到资料后若有疑难问题,可联系客服提供帮助.
  • 关于服务
    确保下载的资料和介绍一致,如核实与资料介绍不符,可申请售后.
  • 资料仅供参考和学习交流之用,请勿做其他非法用途,转载必究,如有侵犯您的权利或有损您的利益,请联系本站,经查实我们会立即进行修正! 版权所有,严禁转载
    doc163.com Copyright © 2012-2024 苏ICP备2021029856号-4