aoi学院

Aisaka's Blog, School of Aoi, Aisaka University

脑机接口与混合智能-脑机接口(BCI)常用的实验范式

脑机接口(Brain Computer Interface,BCI),或称大脑端口(Direct neural interface)、脑机融合感知(Brain-machine interface),是指在人或动物脑(或者脑细胞的培养物)与外部设备间建立的直接连接通路。在单向脑机接口的情况下,计算机接受脑传来的命令或者发送信号到脑,但不能同时发送和接收信号。而双向脑机接口允许脑和外部设备间的双向信息交换。

BCI 系统通过对脑电信号的分析和处理,提供用户与外界设备通信和控制的信道,是一种新的人机交互方式。BCI 系统涉及计算机通信与控制、生物医学工程和康复医学等领域,己经成为交叉学科的热点。而基于脑电信号(Electroencephalography,EEG)的脑机接口成为了目前非常实用、先进的脑机接口方式,以揭示和验证大脑神经生理机制,脑认知科学和神经信息等相关内容。

BCI 系统的信号处理过程包括信号获取、特征提取、分类判断等,其中特征提取和分类判断是 BCI 信号处理的关键环节。传统脑电信号的处理方法是对信号进行多次检测并进行均值滤波,再用统计学方法寻找 EEG 的变化规律。但是该方法信息传输率较低,不能满足实时控制的要求。目前普遍采用的是先对离线 EEG 信号进行处理和分析,再进行在线调试。

BCI 系统的信号处理过程

这里将介绍目前比较常用的脑机接口范式:运动想象BCI、SSVEP、AEP、P300


运动想象BCI(Motor Imagery,MI-BCI)

基于运动想象的系统主要是将运动想象激发大脑运动皮层脑电节律变化的脑电信号作为输入,通过信号处理部分判断运动想象种类,然后由计算机将运动想象种类翻译成控制命令,最终可以实现人脑与外部设备的通信及控制功能。主要关注的是用于优化被试表现的特征提取和分类技术。早期 BCI 原型是基于进行有意的肢体运动期间的 EEG 模式,比如左手、右手或者脚的运动。

为每名被试修改输入特征(如电极位置和频带),以优化分类正确率。后续的研究表明运动想象也能激活大脑主要感觉运动区域,在对侧大脑半球中产生“事件相关去同步”(event-related desynchronization,ERD),在同侧大脑半球中产生“事件相关同步”(event-related synchronization,ERS)。通过分类器探索感觉运动节律的左、右差异以此来区分运动想象。

图片来源于书籍《脑机接口导论》。a.运动想象期间,alpha频带的平均能量(此处指913Hz,称为运动区mu频带),EEG信号来自左侧(C3)和右侧感觉运动皮质(C4)。相对于基线(0.52.5秒)的正、负偏移分别表示频带能量的增加(ERS)和减少(ERD)。在3秒时出现提示并持续1.25秒的时间;b.根据实际的头模型计算出皮质表面在提示出现后625毫秒的ERD分布(改编自Pfurtscheller等人,2000)。


SSVEP(Steady-state visual evoked potentials:稳态视觉诱发电位)

稳态诱发电位由持续波动的刺激(重复频率大于 5Hz)产生。例如,考虑一个能够解码二选一问题的系统。可以用视觉刺激来表示这两个选项(如,屏幕上的按键或者发光二极管 LED),每个视觉刺激以不同的频率闪烁。被试需要关注他/她选择的那个按键(如,注视它)。这样可以在大脑的早期视觉区域(枕区)产生与刺激频率相同的 EEG 信号,这一信号称作稳态视觉诱发电位(SSVEP)。通过对 EEG 刺激进行频域分解(如使用FFT),BCI 能够检测出被试所注视的刺激的频率,从而识别出被试的选择。

举一个基于 SSVEP 的 BCI 例子。电话键盘的 12 个键分布在计算机屏幕上 3×4 的矩阵中。按键以不同频率闪烁,频率范围为 6~14Hz。另外一个闪烁的开、关键用来开启或停止其他键的闪烁。为了减少由 alpha 波引起的假阳性率,首先要进行闭眼状态下的筛选试验,当一些频率所对应的能量超过从 4Hz 至 35Hz 频带平均能量的 2 倍时,这些频率就会被排除在刺激频率之外。另外,所有的刺激频率都是频率分辨率的奇数倍,以防止某刺激频率是另一刺激频率的两倍。

图片来源于cheng等人(2002)的文章Design and implementation of a brain-computer interface with high transfer rates.


听觉诱发电位(Auditory evoked potentials,AEP)

研究人员对 P300 的 BCI 进行了改进,探索了将 oddball 范式应用于听觉刺激,以此为基础构建 BCI 系统。听觉刺激由不同频率、时长为 50 毫秒的方波产生的哔哔声构成,哔哔声产生于被试的左侧或右侧。这段哔哔声中包含两种声音,一种是会频繁响起的非目标哔哔声,另一种是偶尔才在被试任一耳朵中独立播放的目标哔哔声。被试的任务是注意(通过计数)在左耳或右耳中响起的目标刺激。BCI 需要检测被试正在留意的是哪个目标(左耳的目标或右耳的目标)。对多次试验中的 39 通道 EEG 信号进行平均,利用 ICA 进行分离,然后用线性 SVM 进行分类。

图片来源于Hill等人(2005)的文章An Auditory Paradigm for Brain–Computer Interfaces.


P300 BCI刺激范式

最经典的 P300 脑机接口刺激范式是在 1988 年由 Farwell 和 Donchin 提出的基于 P300 视觉刺激的字符输入系统。该实验范式将 36 个字符排列成一个 6×6 的字符矩阵,并按随机的次序闪烁矩阵中的某一行(或列)的 6 个字符。如下图所示:

图片来源于Donchin等人(2000)的文章The Mental Prosthesis: Assessing the Speed of a P300-Based Brain-Computer Interface.

为了拼写一个单词或者发出一个命令,被试必须将注意力集中在矩阵中的字母或命令上,以此来选择组成单词或命令的每个字母。当被试的注意力集中在字母或者命令上时,矩阵的行和列以随机顺序重复闪烁。行和列的每次闪烁(或明暗度增强)持续 100 毫秒,闪烁间隔固定为 500 毫秒或者 125 毫秒。只有当行或者列包含了被试选择的字母或者命令时,被试的大脑才产生明显的 P300。这一信号可以通过使用诸如 LDA 的分类器检测到。因此,通过持续追踪哪个闪烁的行和列引起了最明显的 P300,能够推断出被试选择的字母或者命令。为了有助于保持注意力,通常要求被试对所选择闪烁的次数进行计数。

基于 SSVEP 和 P300 的系统主要特点是无需训练,这类系统比较适合于多指令选择的离散控制型应用,如打字系统、操作界面等。由于其能够提供更多的指令,所以目前这类系统所能够达到的传输率和正确率都比基于自发脑电的系统更高。但是需要外界的诱发刺激来产生特征脑电模式,依赖于场景设计,且目前绝大部分系统都是同步控制的。


参考资料

https://blog.csdn.net/u011661076/article/details/121991020