
Управление силой мысли
Теория и практика использования нейрокомпьютерных интерфейсов
Идея управлять техникой с помощью регистрации мозговой активности возникла еще в середине прошлого века, но осуществить ее до появления микропроцессоров было технически невозможно. Инженерам, физиологам и нейрохирургам оставалось лишь мечтать о создании воспетых в научной фантастике технологически усовершенствованных людей.
От прототипов — к серийным устройствам
Постепенно мечты становились реальностью. В восьмидесятых годах появились переносные (а позже — носимые) компьютеры с достаточной производительностью и стали разрабатываться нейрокомпьютерные интерфейсы — НКИ. Строго говоря, к НКИ относятся только модели, основанные на регистрации электрической активности мозга. Остальные схожие по назначению устройства попадают в более обширную группу интерфейсов «мозг — компьютер» (BCI, brain-computer interface), так как непосредственно активность нейронов ими не регистрируется. Они могут оценивать кровоток, изменения магнитных полей и прочие косвенные признаки мозговой деятельности. Однако в популярной литературе и пресс-релизах технологических стартапов принципиальной разницы между ними уже не делают, а термин НКИ часто используют как синоним BCI.
За последние 10–15 лет НКИ перестали быть уделом лабораторий и сейчас адаптируются для повседневных практических задач — развлекательных и деловых. Речь уже не только о медицине. Например, год назад Флоридский университет представил BCI, позволяющий управлять дроном «силой мысли».
Сейчас компания Visyon планирует развить эту идею и управлять дроном через гарнитуру виртуальной реальности с НКИ. Ожидается, что это избавит от необходимости удерживать с ним визуальный контакт и увеличит дальность полета.
Выглядит такая связка футуристично, но «мысленное управление» — всего лишь маркетинговый слоган. Ни один прибор сегодня не может показать, о чем именно вы думаете. Вместо этого анализаторы НКИ распознают отдельные шаблоны мозговой деятельности, преобразуя известные паттерны в управляющие сигналы методом их заранее заданного сопоставления. Основная проблема в том, что делают они это очень грубо. Электрическая активность мозга характеризуется очень слабыми импульсами на уровне десятков микровольт, поэтому для обработки в НКИ ее приходится многократно усиливать. Вместе с полезным сигналом усиливаются и различные шумы, которые создает носимое и бытовое оборудование, смартфон в сумке, микроволновка в соседней комнате, трамвай за окном и ЛЭП через дорогу.
Варианта решения этой проблемы два: использовать интракортикальную регистрацию нервных импульсов (то есть просверлить череп и имплантировать электроды) либо использовать непрямые измерения от накожных датчиков и улучшать соотношение сигнал/шум программными методами.
На сегодня нейроимпланты нашли ограниченное применение в реабилитационной медицине и не используются у здоровых людей по соображениям безопасности. Исключение составляют разработки DARPA, поскольку Министерство обороны США давно вынашивает идею использовать прямые нейроинтерфейсы для управления военной техникой.
Все коммерчески доступные НКИ относятся к неинвазивным (то есть не требующим нейрохирургических операций) и развиваются по второму пути — за счет улучшения алгоритмов фильтрации сигнала и коррекции ошибок. Они представляют собой упрощенные модели энцефалографов и других анализаторов активности мозга. В них уменьшено количество одновременно регистрируемых сигналов и используются более дешевые компоненты.
Никто не станет устанавливать в серийно выпускаемые BCI сверхпроводниковые квантовые интерферометры, предлагать в комплекте томограф или заставлять пользователя полдня подключать массив из 256 электродов, смазывая каждый токопроводящим гелем.
Нейроинтерфейсы без нейроимплантов
Теоретически среди неинвазивных типов НКИ выделяют четыре разновидности: использующие магнитоэнцефалографию (МЭГ), функциональную магнитно-резонансную томографию (фМРТ), электроэнцефалографию или вызванные потенциалы (ЭЭГ, ВП) и ближнюю инфракрасную спектроскопию (БИС).
На практике как МЭГ, так и фМРТ относятся к лабораторным методам. Они требуют громоздкого и дорогостоящего оборудования, а также условий, близких к идеальным. Поэтому для повседневного использования сейчас подходят только НКИ на базе ЭЭГ и БИС, причем у последней методики пока есть только единичные применения. Например, BrainCo, компания из штата Массачусетс, использует нейроинтерфейсы на базе БИС для контроля внимания студентов во время лекций. По принципу действия прибор похож на пульсоксиметр, только надевается не на палец, а на голову. Он выполняет оценку распределения окисленных форм гемоглобина в сосудах паутинной оболочки, что позволяет косвенно судить об активности разных зон коры головного мозга. По ней система Focus EDU оценивает степень внимания каждого слушателя. Если студент перестает понимать преподавателя (например, если тот часто использует незнакомые термины или из-за отвлекающих факторов), то его мозговая активность приобретает совершенно другой вид.
Благодаря разработкам BrainCo, лекторам в буквально смысле становится легче «настроиться на одну волну» с аудиторией и контролировать ее внимание. Это перспективный метод повышения эффективности обучения, проведения корпоративных совещаний и бизнес-тренингов.
В остальных сферах применения среди интерфейсов «мозг — компьютер» сейчас доминируют устройства на базе ЭЭГ и ВП. Число каналов у них обычно невелико (от 2 до 32), а вместо постоянной регистрации электрической активности мозга в широком диапазоне (0,5–1000 Гц) они фиксируют отдельные сигналы в узких частотных полосах — те, которые (по мнению разработчиков) больше подходят на роль управляющих команд.
Такой упрощенный прибор дает более высокий процент ошибок, зато его можно просто надеть, как шлем, и снять в любое время. Например, на Consumer Electronics Show (CES) 2018 компания Nissan продемонстрировала свою технологию Brain-to-vehicle, помогающую бортовому компьютеру автомобиля лучше чувствовать состояние водителя и предсказывать его дальнейшие действия в интервале до 300 мс. Brain-to-vehicle разбудит водителя, если он засыпает, и остановит машину, если он все-таки заснул.
Виды BCI и их особенности
Наш мозг генерирует множество сигналов, а каждый конкретный BCI анализирует только какие-то определенные их типы. При всей внешней схожести, шлемы с НКИ на базе ЭЭГ могут использовать три основных вида сигналов: вызванные потенциалы (EP), медленные корковые потенциалы (SCP) и сенсомоторные ритмы.
Вызванный потенциал — это изменение активности мозга в ответ на стимул. В НКИ используется преимущественно их разновидность под названием P300. Это импульс длительностью около 300 мс, возникающий после того, как пользователь фокусирует взгляд на цели (управляющем символе или картинке). В это время у него повышается активность отделов коры, отвечающих за узнавание образов (главным образом — теменной доли). НКИ постоянно отслеживает амплитуду этого сигнала и при ее увеличении выше заданного порога выполняет заранее запрограммированную команду.
НКИ на базе регистрации P300 был одним из вариантов набора текста для Стивена Хокинга. Из-за частых ошибок распознавания ему приходилось повторно вводить некоторые символы, но для обездвиженного человека это был прогрессивный способ коммуникации. Современные НКИ такого типа демонстрируют точность на уровне 65–71% (De Vos M, Gandras K, Debener S (2014) Towards a truly mobile auditory brain–computer interface: Exploring the p300 to take away. International Journal of Psychophysiology 91(1):46–53).
Другой часто используемый вариант EP — устойчивый зрительно-вызванный потенциал (SSVEP). Суть его в том, что, если смотреть на объект (например, светодиод), мигающий с определенной частотой, то эта же частота будет регистрироваться на ЭЭГ. Сопоставив разным частотам свои управляющие сигналы, можно сделать пульт «мысленного» управления. В Южнокорейском университете показали, как управлять экзоскелетом, просто глядя на мигающие лампочки.
Плюс методики в том, что управление на базе EP не требует долгого обучения. На привыкание достаточно нескольких минут. Минусы EP — необходимость все время сохранять активное внимание, а при зрительной стимуляции — еще и удерживать объект в центральном поле зрения. Из-за этого быстро наступает утомляемость, и эффективность такого НКИ падает, вынуждая часто делать перерывы. Частота ошибок здесь тоже высокая, поэтому для управления сложными механизмами (например, промышленным манипулятором с десятком степеней свободы) НКИ такого рода не подходят.
Другая большая группа НКИ — созданные на базе SCP. Они регистрируют устойчивые сдвиги напряжения в ЭЭГ. Отрицательные SCP соответствуют повышению активности мозга, а положительные указывают на ее снижение. После длительной тренировки это можно использовать как команды «вверх/вниз» или «вправо/влево». Обучение здесь происходит гораздо дольше — до нескольких недель. Скорость передачи данных всегда низкая. Ее достаточно для управления курсором, но не квадрокоптером.
Также стоит отметить, что люди с нестабильным эмоциональным фоном часто отдают взаимоисключающие указания (например, одновременно повернуть налево и направо), а некоторые оказываются принципиально не способны овладеть таким мысленным управлением. В основном SCP используется для психоэмоционального тренинга по типу обратной связи. Пользователь учится расслабляться и концентрировать внимание, пытаясь выполнить игровое задание.
Еще один популярный тип НКИ — отслеживающие сенсомоторные ритмы, то есть шаблоны двигательной активности. Когда человек реально или только мысленно совершает движение, у него происходит активация определенных зон коры, отвечающих за управление произвольной мускулатурой. В это время на ЭЭГ меняется амплитуда волн в частотных диапазонах μ и β. После обучения в течение одной-двух недель люди могут использовать такие НКИ, чтобы генерировать нужные мысленные команды для управления роботом, экзоскелетом и простейшими внешними манипуляторами. Вот как выглядит типичное управление роботизированным манипулятором с помощью BCI от Brainsense.
К сожалению, количество ошибок прямо пропорционально числу используемых команд. При переходе от двух мысленных движений хотя бы к четырем частота ошибок интерпретации повышается в среднем с 5–10 до 25–35%. Интеграция BCI с AR и VR В последние годы НКИ все чаще используют совместно с системами виртуальной и дополненной реальности. Например, основанная в 2015 году в Кембридже компания Neurable объединила усилия с Visyon и интегрировала НКИ на базе ЭЭГ в AR/VR-гарнитуры (Oculus Rift, Microsoft HoloLens и HTC Vive).
Главное отличие этой разработки от подобных интерфейсов «мозг — компьютер» состоит в том, что платформа Neurable использует машинное обучение для классификации сигналов ЭЭГ в режиме реального времени. Поэтому уровень точности управления с Neurable намного превосходит показатели традиционных НКИ на базе ЭЭГ. Компания планирует использовать в будущем фирменные BCI-шлемы для управления любой техникой — от игрушечных дронов до автомобилей.
Заключение
По данным Grand View Research, в ближайшие пять лет мировой рынок BCI будет ежегодно расти как минимум на 10%. В абсолютных цифрах это составит более 1,7 млрд долларов США к 2022 году.
Сегодня BCI только начинают использовать для решения практических задач. Основная апробация происходит в индустрии развлечений, а точность распознавания команд стараются повысить при помощи методик машинного обучения и других алгоритмов «умной» фильтрации.
Среди коммерчески доступных интерфейсов «мозг — компьютер» разработчики делают ставку на неинвазивные устройства. Они выполняются в виде шлема и часто сочетаются с гарнитурами дополненной или виртуальной реальности. Такие устройства уже вышли за рамки чисто медицинских применений, но еще мало пригодны в качестве самодостаточного варианта управления техникой.
Пройдет еще несколько лет, прежде чем мы сможем водить автомобиль «силой мысли» или управлять с помощью НКИ промышленными манипуляторами. На эффективность интерфейса «мозг — компьютер» сильно влияют психические особенности человека. Поэтому одновременно с компьютерами нам придется эволюционировать самим.