vive吧 关注:6,612贴子:6,830
  • 5回复贴,共1

眼部追踪技术迎来新突破,几十万成本的硬件设备将被手机取代

取消只看楼主收藏回复



IP属地:广东1楼2016-07-06 14:22回复
    关于此项技术的一篇论文在6月28日的计算机视觉和模式识别大会上发布,论文的作者之一Aditya Khosla表示,相比于之前同行的研究,他们的优势在于数据。


    IP属地:广东3楼2016-07-06 14:23
    回复
      Khosla 介绍,他们已经通过GazeCapture搜集了超过1500个手机用户的注视模型,而在此之前,最大的数据样本是大概也只有50个用户。
      为什么他们能搜集到如此多的数据?答案是“众包”模式。研究人员选择亚马逊的“土耳其机器人”(Amazon Mechanical Turk)众包平台,发布使用GazeCapture 任务,用户可以登录“土耳其机器人” 揽活。在下载这款App(目前只提供iOS版)之后,GazeCapture 会在屏幕上展示一个颤动的小点,并在小点里写上“L”或“R” (分别代表左右),以确保用户集中注意力。用户则通过点击屏幕左侧或右侧来作出响应,然后借助前置摄像头记录用户的目光。用户在完成每次任务之后,都可以获得一笔“小费”。
      通过以上方法,GazeCapture 帮助研究人员搜集了丰富注视模型数据。此前,大多数的研究机构都是召集人们来实验室采集数据,有50个数据样本就非常不错了。


      IP属地:广东4楼2016-07-06 14:23
      回复
        对于iTracker 软件,一款目前只能在苹果手机上运行的卷积神经网络系统App。iTracker 能识别出头部和眼球的位置与方向,确定用户的目光究竟看向屏幕的哪个位置。目前iTracker 误差范围缩小到了1.5厘米,比以往实验的精度提高了2倍。在论文提交之后,研究团队又加入了700个用户的数据,平均每个用户有1600张照片。在这一轮训练中,误差范围更是缩小至1厘米,研究人员预测如果用户达到1万人,那么精度会提高为0.5厘米。不过,这样的精度对于商业用途来说,已经十分足够了。


        IP属地:广东5楼2016-07-06 14:23
        回复
          对于iTracker来说,存在的最大问题是,神经网络是一个很大的系统,在手机端的运行效率会很低。不过,研究人员通过采用“Dark Knowledge”(并非黑科技的意思)的处理方法,能够将神经网络规模缩小到20%,使得iTracker 可以在手机端处理15帧/秒的画面,哪怕最短暂的眼神都可以清楚记录。


          IP属地:广东6楼2016-07-06 14:23
          回复
            对于眼球识别技术的重大突破,康奈尔大学教授 Noah Snavely 评论称:
            “在计算机视觉和人机交互领域,眼部追踪一直都是人们十分感兴趣的领域,但是它成本太贵了,让普通用户的手机就可以实现这一技术,非常令人惊叹。在我看来,他们达到的精度,似乎可以让这个领域的人群开始做些有趣的事了,这一项成果将会引发业内的一轮快速发展。”


            IP属地:广东7楼2016-07-06 14:23
            回复