ЭЭГ прогноз успешности выполнения психомоторного теста при снижении уровня бодрствования: описание эксперимента

Научный электронный журнал КубГАУ . № 04(6), 2004

ЭЭГ ПРОГНОЗ УСПЕШНОСТИ ВЫПОЛНЕНИЯ ПСИХОМОТОРНОГО ТЕСТА ПРИ СНИЖЕНИИ УРОВНЯ БОДРСТВОВАНИЯ: ОПИСАНИЕ ЭКСПЕРИМЕНТА

Щукин Т.Н., – аспирант

Институт психологии РАН, Москва

Дорохов В. Б., – к.биол.н.

Институт Высшей Нервной Деятельности и Нейрофизиологии РАН, Москва

Лебедев А.Н., – д.биол.н. профессор

Институт психологии РАН, Высшая Школа Экономики, Москва

Луценко Е.В., – д.э.н., к.т.н., профессор

Кубанский государственный аграрный университет, Краснодар

В статье приводятся условия проведения и результаты эксперимента, задачей которого было построение методики идентификации и прогноза успешности выполнения психомоторного теста с помощью применения классической и неклассической статистической модели к данным электроэнцефалограммы, предшествующей ответу. Эксперимент проводился в условиях, провоцирующих наступление дремоты и засыпания.

Нами был спланирован и проведен эксперимент [1], задачей которого было построение методики идентификации и прогноза успешности выполнения психомоторного теста с помощью применения классической и неклассической статистической модели к данным электроэнцефалограммы, предшествующей ответу. Эксперимент проводился в условиях, провоцирующих наступление дремоты и засыпания.

В исследовании принимали участие здоровые испытуемые (N=41) с амплитудой альфа ритма среднего и высокого индекса. Мужчин - 23, женщин - 18, возраст от 17 до 33 лет (средний возраст составил 25 лет) и один испытуемый в возрасте 55 лет.

Эксперименты в рамках многостороннего исследования проводили в вечернее время с 17 до 20 часов с регистрацией многоканальной (8 каналов) электроэнцефалограммы (ЭЭГ). Использовалось 4 пары отведений (по системе 10/20) относительно объединенных референтных мастоидных электродов А1, А2 (монополярный монтаж) и полиграфических данных (ЭКГ, ЭМГ, дыхание, показания пульсоксиметра). Использованные отведения: Fp1,Fp2, C3,C4, P3, P4, O1, O2;

Частота квантования ЭЭГ равнялась 200 Гц. Испытуемые находились в звукоизолированном помещении, в положении лежа в течение 2-3 часов. С испытуемыми поддерживалась видео - и аудио связь.

Звуковые стимулы, генерируемые компьютером, подавали бинаурально через наушники: интенсивностью 60 дб, длительностью 50 мс, частотой 1000 Гц. Стимулы подавались нерегулярно. Промежутки между стимулами варьировались в диапазоне 2.4 – 2.8 сек. Промежутки варьировались случайно. Промежутков в подаче стимулов не было. Всего каждый испытуемый произвел около тысячи нажатий на кнопки.

С помощью опросников контролировались: ситуативная и общая сонливость, функциональная ассиметрия. Опросники применялись до начала эксперимента с целью допустить до эксперимента только испытуемых, которые хорошо выспались, не принимали в течении последних суток лекарств, алкоголя и не пили напитков, содержащих кофеин или иные стимулирующие вещества.

Экспериментальная модель:

Исследования реальной деятельности человека при засыпании затруднительно по ряду причин, одной из которых является опасность появления ошибок, критических для жизни человека. Поэтому, для исследования механизмов возникновения состояния утомления/усталости, необходима разработка экспериментальных моделей нарушений деятельности при засыпании, в которых одновременно регистрируются физиологические, поведенческие и субъективные показатели деятельности.

В качестве экспериментальной модели использовался психомоторный непрерывно-дискретный тест, разработанный В.Б.Дороховым который через 5-15 минут вызывает дремотное состояние, а при углубление дремоты – «микросон».

Такое быстро снижение уровня бодрствования определяется несколькими причинами: во-первых монотонным характером теста, во-вторых, снижением афферентного притока как от внешней среды (закрывание глаз и выполнение теста в заглушенной камере), так и от интерорецепторов.

Монотонный характер теста достигался непрерывным повторением двух серий счета «про себя». В первой серии счет от 1 до 10 сопровождался одновременным нажатием кнопки большим и указательными пальцами. Во второй серии испытуемый считал от 1 до 5 без нажатий на кнопку. Выполнение теста с закрытыми глазами и минимумом двигательной активности позволяет безартефактно регистрировать электрофизиологические показатели, что особенно существенно при регистрации электрической активности мозга человека.

Инструкция испытуемым содержала описание задания: отвечать на стимулы одновременным нажатием кнопок на джойстиках, которые они держали в руках - на десять стимулов подряд отвечать нажатиями, следующие пять стимулов пропускать и т.д.

Ранее было показано, что такая экспериментальная модель способствует быстрому засыпанию.

Большинство испытуемых в процессе выполнения задания переживали состояние дремоты. Ошибки и отказы испытуемых были связаны с ЭЭГ активностью, характерной для засыпания.

В результате отбора годными были признаны данные 26 испытуемых. Остальные испытуемые были исключены из обработки по критериям, не имеющим отношения к тематике данной работы (ошибки регистрирующей программы и программы экспорта данных).

Методики обработки данных

Первый этап:

На первом этапе работы из сырых ЭЭГ данных был произведен отбор параметров. Расчет параметров проводился в 700 мс окне (140 моментальных значений сигнала при частоте квантования ЭЭГ = 200 ГЦ.).

Ранняя граница окна отстояла от момента стимула на 700 мсек. до стимула. Поздняя граница совпадала с моментом стимула. Также были проведены аналогичные расчеты с окном, середина которого совпадала с моментом стимула, но после завершения обработки было принято решение не использовать эти данные ввиду сложности интерпретации полученных результатов.

Всего для каждого нажатия было рассчитано 34 параметра ЭЭГ. Для каждого из 8 отведений ЭЭГ рассчитывались:

1. Средняя амплитуда сигнала

2. Моментальная амплитуда сигнала в момент стимула

3. Стандартное отклонение сигнала в окне расчета

4. корреляции сигнала в отдельном отведении с виртуальным (обобщенным) девятым отведением.

Два дополнительных параметра представляли собой обобщенное стандартное отклонение по всем каналам и обобщенную моментальную амплитуду сигнала в момент стимула.

Отбор параметров ЭЭГ, который производился на первом этапе работы, обоснован в целом ряде работ и базируется на психофизиологической модели восприятия и памяти, разрабатываемой в лаборатории когнитивной психофизиологии ИПРАН под руководством А.Н.Лебедева на протяжении нескольких десятков лет.

Постановка задачи:

С помощью двух методов – регрессионного анализа и использования системы «Эйдос» нами решалась задача предсказания по параметрам ЭЭГ двух видов переменных:

1. Время реакции

2. Правильность счета (выполнения инструкции)

В зависимости от времени реакции (латентности ответа) были сформированы десять классов:

1. Время реакции (ВР) Меньше -0.5 сек. (сильное опережение)

2. ВР между -0.5 и -0.3 сек. (опережение)

3. ВР между -0.3 и -0.1 сек. (опережение)

4. ВР между -0.1 и 0.1 сек. (совпадение)

5. ВР между 0.1 и 0.2 сек.

6. ВР между 0.2 и 0.3 сек.

7. ВР между 0.3 и 0.5 сек.

8. ВР между 0.5 и 0.75 сек.

9. ВР между 0.75 и 1 сек.

10. ВР более 1 сек. (сильное опоздание)

Среднее время реакции по всем испытуемым составило 230 мс.

Распределение ответов по ВР (на примере ЭЭГ). Распределение ответов по ВР (на распределении ВР).

Для различения опережений от поздних ответов были построены гистограммы распределения ответов для каждого испытуемого. Ответы на участке до второго минимума распределения относились нами к поздним нажатиям, ответы на участке после второго минимума распределения – к опережениям.

На следующей таблице можно увидеть пример диаграммы, модифицированной таким образом, что ответы, которые на диаграмме до модифицикации относились к текущему стимулу, на диаграмме после модификации были автоматически отнесены к опережениям следующего стимула.

В зависимости от правильности выполнения инструкции (На десять стимулов реагировать нажатием, на следующие 5 – не реагировать) данные были распределены по четырем ячейкам в соответствии с правильностью счета:

11. Нормальные пропуски. Правильные серии пропусков в ответ на стимулы - т.е. по пять пропусков.

12. Ошибочные пропуски. Ошибочные серии пропусков в ответ на стимулы - т.е. пропуски количеством меньше или больше пяти.

13. Нормальные нажатия. Правильные серии нажатий в ответ на стимулы - т.е. нажатия по десять раз.

14. Ошибочные нажатия. Ошибочные серии нажатий в ответ на стимулы - т.е. нажатия более или менее десяти раз.

Фактически, в ячейки были записаны моменты (точное время события) стимулов, реакции (или их отсутствие) в ответ на которые попадали в одну из четырех описанных выше групп. Ответы также попадали в одну из ранее описанных 10 групп латентностей. Пропуски же попадали в одну из двух групп (11ая или 12ая).

Таким образом, по каждому испытуемому был сформирован файл с 14 столбцами данных, в каждом из которых находилось время события-стимула, ответ на который относился к одному из 14 классов и 34 столбцами, в которых содержались параметры ЭЭГ, соответствующие каждому стимулу.

Пример файла с данными можно увидеть на таблице. Первый столбец таблицы представляет собой наименование события (время от начала записи). Столбцы с наименованиями Т01-Т14 – классы событий. Остальные столбцы – признаки электроэнцефалограммы.

В качестве проверки нами было проведено параллельное исследование с альтернативным набором параметров ЭЭГ.

В программе, с помощью которой осуществлялась регистрация полиграфических показателей (“Sagura”) были построены спектры в шести диапазонах (Дельта1-[0.5-2Гц.]; Дельта2-[2-4Гц.]; Тета-[4-8Гц.]; Альфа-[8-12Гц.]; Сигма-[12-18Гц.]; Бета-[18-70Гц.]). Спектры были посчитаны в десятисекундных окнах с помощью встроенного алгоритма быстрого преобразования Фурье, рассчитанного по стандартной формуле. Были получены абсолютные значения спектров для шести диапазонов.

Для тех же испытуемых нами была построена таблица, аналогичная приведенной выше, отличающаяся тем, что вместо 34 описанных выше использовались 48 показателей спектра – 6 спектральных диапазонов для 8 отведений. Обработка данных этой таблицы полностью соответствовала работе с ранее описанными данными.

Второй этап:

Была поставлена задача спрогнозировать на основе параметров ЭЭГ (амплитуда, среднее, корреляции, а также отдельно спектральные показатели) ожидаемое ВР и класс реакции.

Задача выявления ЭЭГ детерминант, определяющих развитие того или иного процесса деятельности, традиционно считается весьма сложной, и плохо поддающейся решению с помощью методов классического статистического анализа.

По этой причине нами были привлечены две разные, хорошо зарекомендовавшие дополняющие друг друга модели расчетов соответствия индексов параметрам деятельности.

Модель классической статистики – регрессионного анализа, зарекомендовавшей себя в исследованиях лаборатории А.Н.Лебедева, была дополнена неклассической математической моделью.

В качестве второй нами была привлечена универсальная аналитическая система «Эйдос».

Система объединяет преимущества искусственных нейронных сетей с возможностями интерпретации получаемых результатов, превосходящими аналогичные в методах многомерного шкалирования

Работа программы базируется на системной теории информации, и результаты обработки в данном исследовании представляют собой автоматически классифицированные примеры (параметры участков ЭЭГ) на основе информационных портретов классов нормальных и ошибочных действий (классов распознавания). Используемая в распознающей программе семантическая информационная модель является непараметрической, т.к. базируется на системной теории информации. Программная система использует робастные процедуры, обеспечивающие устойчивую работу модели на исходных данных, зашумленных артефактами, т.е. выпадающих из общих статистических закономерностей, которым подчиняется исследуемая выборка, что упрощает задачу контроля артефактов в данных.

Результаты:

Для обработки таблиц нами применялось два метода.

Первым использовался стандартный алгоритм множественного регрессионного анализа. В результате были получены уравнения с тремя наиболее значимыми параметрами. Менее значимые параметры были отброшены.

На основе таблиц с данными ЭЭГ было построено 233 регрессионных уравнения. Уравнения для каждого испытуемого были построены для 8 классов-событий (из 10 латентностей в обработку взяты были только 6 – те, для которых существовало минимальное количество примеров.)

В результате применения уравнения к исходным данным по каждому событию были получены три вида ответов. При попадании полученного с помощью уравнения числа в один из двух крайних диапазонов, принималось решение о принадлежности («да» - положительный ответ) или о не принадлежности («нет» - отрицательный ответ) события к классу событий, для прогноза которых было создано уравнение. При попадании полученного числа в интервал между зонами ответов «да» и «нет» событие описывалось как нераспознанное.

Результаты регрессионного уравнения были представлены в двух видах. Во-первых, в виде таблиц корреляций ряда предсказываемых значений с реальными значениями для каждого типа события каждого испытуемого индивидуально.

Для 91% предсказываемых параметров из 14 параметров для 26 испытуемых удалось построить уравнения, корреляции которых с динамикой описываемого признака являются значимыми на уровне 0.05. Уравнения для различных испытуемых имели существенно различные коэффициенты корреляции с динамикой предсказываемых признаков.

Также результаты применения регрессионного анализа были представлены в виде четырехполюсной таблицы. Из этой таблицы были получены четыре вида коэффициентов.

1. Точность ответов «да»: отношение количества случаев, когда система принимала решение «да» правильно к случаям, когда система принимала решение «да» ошибочно. (общее количество решений «да» деленное на верное количество решений «да» в процентах).

2. Точность ответов «нет»: отношение количества случаев, когда система принимала решение «нет» правильно к случаям, когда система принимала решение «нет» ошибочно. (общее количество решений «нет» деленное на верное количество решений «нет» в процентах).

3. Процент верных ответов «да» (валидность положительного решения): Процент правильных идентификаций реальных событий «да».

4. Процент верных ответов «нет» (валидность отрицательного решения): Процент правильных идентификаций отсутствия событий («нет»).

Все эти показатели посчитаны на той части выборки, которая относится либо к ответам «да», либо к ответам «нет». Ответам «нет» приписывалось значение «70», ответам «да» - значение «130». Если число, получаемое с помощью регрессионного уравнения, попадало в бин «не знаю», то эти результаты далее не учитывались. (См. рис. Т)

Средний процент обрабатываемой выборки для 234 уравнений составляет 54% и указан в следующей таблице наряду с четырьмя упомянутыми выше коэффициентами.

Также в результате обработки была построена аналогичная таблица для каждого типа

события в отдельности.

Из таблицы следует, что наибольшая валидность отрицательных ответов (процент правильных распознаваний отрицательных ответов, т.е. отсутствия события) наблюдается у класса Т3 (ВР между –0.3 и –0.1 сек.) У этого же класса наибольшая точность ответов «да» - более 99.9 %. Это означает, что когда система принимает решение о положительном ответе, то это почти всегда правильная идентификация.

Наибольшая валидность положительных ответов (процент правильных распознаваний положительных ответов, т.е. наличия события) наблюдается у класса Т13 (Верное количество нажатий) – 95%.

У класса Т11 (верное количество пропусков) наибольшая точность ответов «нет» - 97.4%. Это означает, что когда система принимает решение об отсутствии события, то почти всегда имеет место правильная идентификация.

В целом, точность ответов «да» и «нет» по всем испытуемым очень высока – если система осуществляет идентификацию события как имеющего место или не имеющего места, то вероятность ошибки крайне мала. Валидность распознавания событий (процент правильно опознанных событий, имевших место) также довольно высок и составляет более 77%. Валидность распознавания отсутствия событий (процент правильно распознанных отсутствий событий) еще более высока и составляет более 99.5%.

Все эти данные, тем не менее, относятся лишь к чуть более чем 54% всех данных. Во всех остальных случаях система затруднялась принять решение.

Не у всех испытуемых удавалось с помощью уравнений регрессии предсказать ВР и тип работы.

На следующей таблице видно, что удовлетворительная валидность (процент верных распознаваний выше 65%) сильно различается от класса к классу.

Из этих данных следует, что с помощью регрессионных уравнений

хуже всего удалось предсказывать наступление событий классов «ВР между -0.3 и -0.1 сек» и «ВР между 0.3 и 0.5 сек.».

Лучше всего удавалось предсказывать класс «ВР между 0.2 и 0.3 сек.» из видов латентностей ответов и классы 11 и 13 («верное количество пропусков» и «верное количество нажатий») среди разных видов счета. Аналогичная тенденция наблюдается на предыдущей таблице – в обобщенных валидностях по классам, без учета количества испытуемых, преодолевающих барьер в 65%. Необходимо сказать, что остальные характеристики (валидность «нет», точность «да», точность «нет») превышают барьер в 65% у всех без исключения испытуемых.

Те же данные без учета доверительного интервала – т.е. те данные, которые попали в сектор «не знаю» посчитаны как не идентифицированные, отражены на следующей таблице.

Если из уравнения следовало, что время реакции может иметь два-три возможных значения, то выбиралось то значение, регрессионное уравнение класса события которого имело больший коэффициент корреляции с реальными данными.

Прогноз успешности выполнения психомоторного теста с применением регрессионного анализа, использованный в данном исследовании, обладает всеми традиционными недостатками регрессионного анализа, а именно:

При проведении регрессионного анализа предполагается, что связь между переменными является линейной. Процедуры множественного регрессионного анализы в незначительной степени подвержены воздействию малых отклонений от этого предположения. Тем не менее, это предположение в наших данных не подтверждено. Также в множественной регрессии предполагается нормальность распределения – т.е. предполагается, что остатки (предсказанные значения минус наблюдаемые) распределены нормально (т.е. подчиняются закону нормального распределения). Это предположение также не подтверждено в нашем случае.

Наиболее важным фактом, определяющим выбор альтернативного метода прогноза успешности выполнения психомоторного теста, является основное концептуальное ограничение всех методов регрессионного анализа, состоящее в том, что они позволяют обнаружить только числовые зависимости, а не лежащие в их основе причинные связи.

Проблема мультиколлинеарности (наличия среди признаков двух и более дублирующих друг друга (т.е. сильно связанных)) является общей для многих методов корреляционного анализа, в том числе для регрессионного анализа.

Последним, но не наименее важным является необходимость анализа остатков при проведении регрессионного анализа. Выбросы (т.е. экстремальные наблюдения) могут вызвать серьезное смещение оценок, "сдвигая" линию регрессии в определенном направлении и тем самым, вызывая смещение регрессионных коэффициентов. Часто исключение всего одного экстремального наблюдения приводит к совершенно другому результату.

Для компенсации всех перечисленных недостатков в качестве второго метода для решения задачи прогноза на основе параметров ЭЭГ ожидаемого ВР и класса реакции использовалась универсальная аналитическая система «Эйдос».

На основе таблицы с данными каждого испытуемого формировалась обучающая выборка, включающая в себя половину строк таблицы, отобранных по принципу «четные строки – обучающая выборка, нечетные строки – распознаваемая выборка».

На основе обучающей выборки система обучалась, формируя обобщенные образы классов распознавания (правила, на основе которых система относит участок ЭЭГ к тому или иному классу).

На основе обобщенных образов классов распознавания, сформированных на первой половине выборки, проводилось распознавание второй половины выборки.

Объект считался отнесенным к классу, с которым у него наибольшее сходство. Образы классов, по которым процент верных распознаваний был ниже 65%, считались не сформированными. Нами рассматривались модели, построенные не менее, чем на 20 примерах. Количество моделей, число примеров в которых превышало 20, обозначено в первых столбцах следующих двух таблиц.

Аналогичным образом были обработаны данные по параметрам спектральных характеристик ЭЭГ, сопровождающих действия человека.

Были получены следующие результаты:

Таблица успешности предсказания по амплитудно-корреляционным параметрам фоновой ЭЭГ.

На этой таблице приведены результаты распознавания по фоновой ЭЭГ с помощью системы «Эйдос». Следует заметить, что данные приведены для всех классов всех испытуемых, по которым количество примеров превышало 20. В том числе рассматривались данные испытуемых, по данным которых вообще не удалось произвести успешного прогноза ни по одному классу распознавания.

Следующая таблица во всем подобна предыдущей, за исключением того, что на ней приведены данные об успешности распознавания по спектральным характеристикам ЭЭГ.

Таблица успешности предсказания по спектральным параметрам ЭЭГ. Данная таблица во всем аналогична предыдущей за исключением того, что в качестве исходных данных использовались данные о спектральных признаках ЭЭГ, а не набор из амплитудных и корреляционных признаков, как в прошлой диаграмме.

По таблицам видна закономерность, заключающаяся в том, что спектральные показатели позволяют лучше предсказывать правильность счета (правильность выполнения инструкции), а другие показатели ЭЭГ позволяют лучше предсказывать латентность ответа. Это выражается в том, что для спектральных показателей больше количество предсказаний с высоким уровнем прогноза (более 65%), а также выше средний процент верных распознаваний правильности счета. Для фоновых показателей выше аналогичные показатели для латентности ответа.

Эта закономерность проиллюстрирована на следующей таблице. Красным цветом отмечены большие проценты (по сравнению с другим основанием распознавания).

Таблица сравнения эффективности распознавания по двум наборам параметров (скорректированная по количеству испытуемых).

Те же данные изображены в виде графика.

Причины разной эффективности расчетов на основе разных данных в задачах предсказания правильности счета могут быть объяснены. Участки спектров, используемые в расчете, построены на основе 10 секундных окон электроэнцефалограммы, в то время, как расчеты по фону производились на основе данных, полученных на 700 мс. окне. Полученные результаты говорят о том, что классы правильности счета различаются между собой спектральными параметрами ЭЭГ, посчитанными на больших окнах в большей степени, чем амплитудно-корреляционными параметрами, посчитанными на окнах длительностью менее одной секунды.

Признаки, определяющие время реакции испытуемого на стимул, напротив, заключены в динамике амплитудно-корреляционных параметров ЭЭГ и несколько хуже отражены в спектральных параметрах, посчитанных на больших отрезках ЭЭГ.

Средняя степень распознавания у испытуемых различна. Есть испытуемые, количество хорошо (более 65%) распознанных классов у которых доходит до шести. Одновременно, существуют испытуемые, у которых хорошо не распознается ни один класс. Этот факт говорит о том, что в ЭЭГ испытуемых, для которых не удалось построить модель удовлетворительного прогноза, представляет собой в значительной степени случайный сигнал, и в ней не содержатся устойчивые комбинации признаков. Причиной этого может быть как низкое качество записи сигнала, так и характер самой электроэнцефалограммы. Прояснение этого вопроса требует дальнейших исследований.

При этом у некоторых испытуемых для некоторых классов результаты распознавания настолько высоки, что позволяют использовать методику для прямой идентификации наступающего события по ЭЭГ. По признакам ЭЭГ, предшествующей стимулу, достаточно хорошо предсказываются в среднем два класса из (в среднем) восьми, по которым существовало более двадцати примеров электроэнцефалограммы. Аналогична успешность распознавания по спектрам.

Это говорит о том, что при наличии достаточного количества примеров, хорошо предсказываются более четверти классов распознавания. Классы, представленные недостаточным количеством примеров (менее 20), как правило, предсказываются еще лучше (до 100 % правильных распознаваний).

Сравнивая результативность метода регрессионного анализа и метода, реализованного в системе «Эйдос», можно увидеть, что их эффективность вполне сопоставима, когда в результатах, полученных с помощью регрессионного анализа, не учитывается доверительный интервал.

Если же мы посмотрим на результаты, полученные на данных вне доверительного интервала, то мы увидим, что точность ответов «да» и ответов «нет» очень высока. Это означает, что этот метод предпочтительнее использовать в задачах с высокой ценой ошибки – «ложной тревоги».

Литература

1. Щукин Т.Н., Дорохов В. Б., Лебедев А.Н., Луценко Е.В. ЭЭГ прогноз успешности выполнения психомоторного теста при снижении уровня бодрствования: постановка задачи. // Научный журнал КубГАУ. – 2004.– №4(6). – 9 с. http://ej.kubagro.ru.

Научный электронный журнал КубГАУ . № 04(6), 2004