眼动追踪技术的方法

本文首发在个人博客上（），此文章中所有链接均通过博客进行访问。

眼动追踪技术已成为心理学，神经营销学，神经认知，用户体验，基础研究及市场研究等多个领域视觉行为和人类行为的技术手段之一。该技术还可以用于医学分析和筛查。从眼动的历史发展进程来看，早期的眼动追踪系统是侵入性的且不能移动，受限非常严重，仅在有限的实验中使用，并且在现在社会受到伦理方面的考验。随着眼动追踪系统的发展，现代的眼动追踪系统利用红外光进行捕捉眼球运动，该系统是非侵入的且更加方便易用。在本文中，我将介绍眼动跟踪技术，并讨论大多数系统用于跟踪眼睛的方法。

眼动追踪技术原理

这部分内容可参考之前写过的文章

眼动追踪方法

• 早期尝试Early attempts (mechanical/optical) • 眼电Electrooculography (EOG) • 红外边缘反射IR limbus reflection (limbus tracking) • 搜索线圈Search coil • 基于视频的眼动追踪Video-based eye-tracking

眼动追踪方法经历了从早期观察到侵入式再到非侵入式的发展过程。

早期眼动追踪技术

早期眼动追踪技术主要分为观察法、机械记录法、眼电记录法和电磁感应法。

在早期眼动追踪中，通常是直接观察的，这种方式非常的粗略。在最初的自动化系统追踪中，使用的是一种与眼睛直接接触的搜索方法，通过将一个橡胶吸盘吸在眼球表面，发明了第一个可以记录数据的眼动仪，这种眼动仪非常的不方便，且不舒适。

还有一种是通过光学的方式进行，是利用照相的方式连续拍摄眼动轨迹。

在眼动追踪技术发展中，眼电电位的记录也能记录下眼动轨迹的过程。但是这种方式不是很准确，常用于脑电中记录眼动产生的电位信号来消除眼电伪迹。

最早的眼动追踪电子系统之一是电磁巩膜搜索线圈。它们被嵌入到专用的隐形眼镜中，并且将导线连接到记录设备。根据眼睛运动产生的感应电压来记录眼动轨迹，该系统具有很高的精度和速度，但是在进行实验时是侵入式的，且需要先麻醉人的眼睛，将实验用的设备吸附早眼球上，通常的实验环境是在法拉第笼中，该方法对参与者的眼睛影响较大，有一定的生理伤害。

后来的双眼浦肯（Purkinje）成像系统（DPI）等眼动追踪设备虽然没有物理接触到眼睛，但仍需要一个咬合棒来稳定头部，并且允许的视野很小（但分辨率和准确性很高）。

非侵入式的眼动追踪方法

从20世纪开始以来，随着摄像技术，红外技术和计算机技术的发展，科学家就尝试使用基于视频的眼动追踪方法，推动了基于红外高精度眼动仪的研发。

非侵入式眼动技术主要采用的追踪方法主要有巩膜一虹膜边缘法、瞳孔追踪方法、瞳孔一角膜反射法。

巩膜一虹膜边缘法

此方法首先利用红外光照射人眼，在眼睛附近安装的两只红外光敏管用来接收巩膜和虹膜边缘处两部分反射的红外光。接收到的红外光会随着眼睛的运动而变化，当眼球向一侧运动时，虹膜就转向这边，这一侧的光敏管所接受的红外线就会减少;而另一侧的巩膜反射部分增加，导致这边的光敏管所接受的红外线增加。利用这个差分信号就能无接触的测出眼动。这种方法的水平精度较高，垂直精度较低、干扰大、头部误差大。

基于视频的眼动追踪

在现在大多数基于视频的眼动跟踪系统都包括一个红外摄像机，红外光（IR）照明器以及用于瞳孔中心检测和伪影排除的眼动追踪算法，图像处理和数据收集由专用硬件处理或者由计算机（Host PC）或软件处理。基于红外的照明具有多个优点：参与者在很大程度上看不到照明，并且可以通过波长过滤来自人造光源的伪影。

1、瞳孔追踪方法

在现在眼动仪中常用的两种近红外眼动追踪技术：明瞳和暗瞳。它们的差异基于照明源相对于光学系统的位置。如果照明与光路同轴，则当光从视网膜反射时，眼睛将充当反射器，从而产生类似于红眼的明亮瞳孔效果。如果照明源偏离光路，则瞳孔会变暗，因为来自视网膜的回射被定向为远离相机。

——来自维基百科

2、瞳孔-角膜反射追踪方法

首先利用眼摄像机拍摄眼睛图像，接着通过图像处理得到瞳孔中心位置。然后把角膜反射点（黄色斑点）作为眼摄像机和眼球的相对位置的基点，根据图像处理得到的瞳孔中心即可以得到视线向量坐标，从而确定人眼注视点。

在找到较好的瞳孔-角膜反射点后，通过一些校准程序，找出瞳孔与角膜反射点间组成的向量与屏幕注视点之间的映射函数，然后通过检测瞳孔-角膜向量的变化量，实时跟踪出人在屏幕中所凝视的兴趣点。

校准和验证方法

由于人眼形状，大小，结构，存在个体差异，眼睛球面上的点在摄像机参照系中的投影点位置和眼睛转动角度之间存在非线性关系，并且视线估计方向与真实视线方向有模型误差，所以视线跟踪系统需要校准环节。

所以在进行眼动实验前，一般会进行眼动校准过程，这是一种算法，将眼睛的物理位置与受试者正在注视的空间点相关联。在此过程中，该算法将会测量受试者眼睛的特征（图像），包括角膜、瞳孔与反射信息等来计算眼动数据过程。在校准过程中，受试者需要观察刺激屏幕上特定位置出现的点，此点被称为校准点。在此期间，眼动仪会对采集到的几幅眼睛的图像进行分析。

校准点可以是一点，也可以是3点、5点、9点以及13点，校准点数依据实验任务的不同而不同，该算法在每个目标的眼睛位置（减去CR）和注视位置之间创建数学转换，然后创建一个矩阵来覆盖整个校准区域，并在每个点之间进行插值。使用的校准点越多，在整个视场中的精度就越高，越均匀。

在EyeLink系统中，除了校准过程外，还有一个过程是验证过程。因为在大多数时候校准是需要受试者一定的配合和能力的，因此在大多数情况下，需要进行验证校准过程产生的误差。比如：以下9点校准。

当进行完验证过程后，会在右下角报告当前追踪研究的误差值，当平均值小于1度，最大值小于1.5度时，会显示绿色，说明是GOOD；当平均值小于1.5度，最大值小于2度时，会显示灰色，说明是FAIR；当平均值大于1.5度，最大值大于2度时，会显示红色，说明是POOR，在大多数情况下，需要调整到GOOD情况下，才能被允许进行实验数据的收集，对于大多数实验来说，超过1度被认为是校准失败，需要再次校准。

方法的局限性

虽然现代的眼动仪发展的已经非常好了，软件界面也非常人性化了。但是不可避免的还是会存在一些功能上的限制。

1、瞳孔遮挡

在当前的眼动仪中，很明确的需要瞳孔无遮挡的视线，浓厚的眼睫毛有可能会被误认为瞳孔，从而使眼动追踪无法继续进行，当然，在绝大多数时候，即使瞳孔被部分遮挡，当前的眼动仪也可以根据算法确定中心，但是在某个点上，如果被遮挡足够多，眼动追踪也会无法继续进行。我们目前依然保持着较高的信心，这种情况发生的事件很小。

2、眼部化妆

简单来说，做眼动实验前，要求受试者不要化眼部妆，而且不要带美瞳，它会造成红外的照射不能完全捕捉瞳孔区域。

3、眼睛度数

一般建议是超过800度以上的或者是有严重的散光的被试，将会被排除在外。任何眼镜都会使拍摄的眼睛变形，有可能会减少一些反射的红外照明光源，在现代的眼动仪中，能追踪到低度数的眼动，这是可以的，但是也需要注意，在进行实验时，尽可能的不戴有黑色镜框的眼镜，它可能会遮挡或被误认为瞳孔区域进而眼动追踪无法继续。

更多的实验环境细节可参考文章《眼动追踪中获取高质量数据的5个最佳设置》