Kitobni o'qish: «Современные представления о механизмах зрительного внимания»
Введение
Зрительная система является для человека важнейшим источником информации о внешнем мире. Небольшая область в центре сетчатки глаза (фовеа), на которую проецируются около двух градусов поля зрения, имеет высокую плотность рецепторов; за ее пределами плотность рецепторов и острота восприятия элементов формы и цвета падает по экспоненциальному закону от центра поля зрения к периферии (Шахнович, 1974; Ярбус, 1965). Для получения необходимой зрительной информации в мозге активируются процессы внимания, связанные с выбором наиболее значимых объектов как в центре, так и на периферии поля зрения. Согласно известным данным (Шахнович, 1974; Ярбус, 1965; Martinez-Conde, Macknik, 2008, 2015; Rolfs, 2015; Shepherd et al., 1986), процессы выбора включают механизмы явного (overt), сопровождающегося быстрыми высокоамплитудными движениями глаз (более одного градуса) – саккадами – и скрытого (covert) зрительного внимания, которые отражаются, в основном, в длительности фиксаций взгляда и микросаккадах – движениях глаз с амплитудой менее одного градуса – (Hafed, Clark, 2002). Взаимосвязь механизмов внимания и движений глаз достаточно сложна. В частности, иногда направление взгляда однозначно связано с тем, какая информация будет воспринята в фокусе внимания, в других случаях информация, находящаяся в окрестностях текущей фиксации взгляда, не осознается человеком – происходит так называемый эффект ослепления по невниманию (Inattentional Blindness) в отношении нерелевантной информации (Rock, Gutman, 1981; Simons, Chabris, 1999; Most at al., 2001). Кроме того, скрытое внимание иногда предваряет переход фокуса внимания, сопряженный с движением глаз, в определенное место поля зрения (Laubrock at al., 2010). По-видимому, увеличение количества анализируемых параметров движений глаз и синхронная регистрация моментов принятия того или иного решения человеком позволят установить иерархию отношений между различными типами глазных движений и процессами зрительного внимания.
Исследование механизмов зрительного внимания прошло ряд этапов. Каждому этапу были присущи свои методы исследования и представления о механизмах зрительного внимания, часть из которых сохраняется до настоящего времени.
Одна из групп факторов, регулирующих зрительное внимание, – физические свойства изображений, например, локальные скопления перепадов яркости, цвета или других характеристик изображения, или же как-то отличающиеся от окружения области. Они провоцируют привлечение внимания в большинстве случаев в начальные периоды решения зрительной задачи, такое внимание называется восходящим (bottom-up). При наличии задачи, ожидания или какой-либо другой предустановки влияние этой формы внимания ослабевает, и внимание с большей вероятностью направляется туда, где есть искомые свойства, или же семантически значимые для человека объекты. Такая форма внимания основана на работе иерархически более высоких структур мозга и называется нисходящей (top-down). Необходимо отметить, что эти формы внимания не эквивалентны фокальному и пространственному вниманию, несмотря на то что следствия их функционирования могут быть похожими, и отчасти доминирование восходящей или нисходящей форм внимания может быть обусловлено доминированием пространственного или фокального внимания соответственно. Очевидно, взаимоотношения между этими формами внимания еще предстоит выяснить. В равной мере это относится и к временной динамике вклада механизмов фокального и пространственного внимания. В частности, в ряде работ обосновывается доминирование сначала пространственной, а затем фокальной формы внимания; в других работах представлены данные, указывающие на то, что оба этих механизма участвуют на всех этапах решения зрительной задачи, постоянно сменяя друг друга (Staub et al., 2010; Stigchel et al., 2009). Как подчеркивается в ряде работ (Pastuchov et al., 2009; Stigchel et al., 2009), критерии, позволяющие определить или предсказать моменты перехода от одной формы внимания к другой, не описаны в известной литературе.
Следует отметить, что данные, касающиеся нисходящей и восходящей формы внимания, получены в основном при использовании простых стимулов (наборы локальных линейных сегментов с различной ориентацией, стрелок с различным направлением, букв и т. д.) при решении задач их поиска и распознавания. В свою очередь данные, касающиеся функционирования фокального и пространственного внимания, получены в основном в экспериментах со сложными изображениями в качестве зрительных стимулов – сцен, художественных произведений, динамически изменяющейся виртуальной реальности, искусственно синтезированных интерьеров и т. д. Задачи, формулируемые в этих экспериментах, – в случае, если изучается не просто свободный осмотр, – также обращаются к поиску, распознаванию и моторной реакции на стимулы, но часто они формулируются более сложным образом и требуют обращения к зрительной памяти, сравнения разных стимулов, самопроверки и участия других высших когнитивных функций.
Другая особенность большинства исследований с регистрацией движений глаз (Torralba et al., 2006; Williams et al., 2007; Underwood et al., 2008 и многие другие) состоит в том, что длительность теста устанавливается экспериментатором, а не определяется испытуемым самостоятельно (self-termined paradigm). Первая парадигма не позволяет наблюдать полностью завершенный акт решения зрительной задачи при использовании сложных изображений в качестве стимула. При этом индивидуальные особенности (Schiefele, Krapp, 1996) в темпе психической деятельности и восприятия делают невозможным выбор длительности теста, универсальной для всех испытуемых. Вполне вероятно, что некоторые испытуемые могут завершить осмотр раньше окончания теста, и последующие движения глаз будут совершаться при возрастающей активности незрительных видов внимания, что позволит неучтенным факторам влиять на параметры движений глаз. Кроме того, осмотр изображения или сцены – не неизменное статичное состояние. У него есть своя динамика, периоды развития и окончания, смены другими процессами. Периоды начала осмотра описаны в работах Unema et al. (2005) и Velichkovsky et al. (2000), однако сведения о характерных изменениях движений глаз на этапе завершения текущей зрительной задачи незначительны (Podladchikova et al., 2009).
Новый этап (Active Vision Era) исследований механизмов зрительного внимания, оцениваемых по параметрам глазных движений (Wade, Tatler, 2005; Tatler et al., 2009), начался после выхода монографии Альфреда Ярбуса (1965, 1967), в которой описаны типичные параметры произвольных и непроизвольных движений глаз, а также экспериментально обосновано влияние зрительной задачи и мотивации испытуемого на траекторию осмотра и положение точек фиксации взгляда. После издания переведенной монографии Альфреда Ярбуса количество исследований в этой области многократно возросло (рис. 1). Отмечается (Wade, Tatler, 2005; Tatler et al., 2009), что на этом этапе разработан ряд новых методов проведения экспериментов и анализа данных. Кроме того, совершенствование и уменьшение стоимости айтрекеров расширило круг применения методов регистрации глазных движений для решения практических задач.
Таким образом, несмотря на большое количество исследований движений глаз на современном этапе невозможно однозначно определить степень связи положения взгляда с фокусом внимания (Белопольский, 1989, 2007; Smith, Ratcliff, 2009; Belopolsky, 2015). Сложность решения этой задачи обусловлена в первую очередь одновременным участием механизмов разного уровня (от первичных сенсорных до когнитивных), взаимодействующих между собой и находящихся под воздействием многих факторов. По-видимому, один из подходов к решению ключевых проблем в этой области состоит в разработке новых методических приемов проведения эксперимента и анализа данных, которые дадут возможность количественно оценить вклад различных механизмов зрительного внимания (Ярбус, 1965; Подладчикова и др., 2011; Carrasco, 2011; Graupner et al., 2007; Henderson, Pierce, 2008; Lavie, 2006; Reingold E. M., Stampe, 2002).
Рис. 1. Динамика цитирования книги А. Ярбуса Eye Movements and Vision на момент выхода статьи (Fig. 14 из статьи Tatler et al. 2010)
Одним из методов, который может применяться для провокации смены типа зрительного внимания, является использование неожиданных кратковременных стимулов – дистракторов. До настоящего времени механизмы дистрактор-эффекта остаются предметом дискуссий (Corneil, Munoz, 1996; Foley, Schwarz, 1998; Graupner et al., 2007; 2011; Hodsoll et al., 20011; Miles et al., 2009; Tandonnet et al., 2012). В частности, некоторые авторы указывают на фазическую природу эффекта дистрактора, тогда как другие указывают на зависимость длительности дистрактор-эффекта от характеристик стимулов. Если длительность дистрактор-эффекта не изменяется, это может говорить о его независимости от процессов, происходящих во время осмотра, а задержка фиксации может объясняться только временем, которое необходимо для оценки новой информации и генерации саккады. Если же длительность эффекта зависит от параметров зрительных стимулов, то это дает возможность количественного измерения влияния тех факторов, которые не влияют напрямую на длительность фиксаций, но отражают особенности протекания процессов внимания.
Другим методом, позволяющим направленно воздействовать на внимание, является использование разных уровней перцептивной нагрузки. Исследования в этом направлении проведены в основном с помощью метода изменения количества простых стимулов разного типа в поле зрения. Они позволили объяснить, почему в разных случаях информация о нерелевантных стимулах может обрабатываться на ранних или поздних этапах восприятия. Было показано, что эффективность и скорость обработки зрительной информации о целевых стимулах может зависеть от количества одинаковых нецелевых стимулов, предъявляемых одновременно, а также что их меньшее количество более вероятно вызовет смещение внимания от решения задачи, связанной с целевым стимулом (Lavie, Fox, 2000; Lavie, 1995, 2006; Wei, Zhou, 2006; Cartwright-Finch, 2007; Di Stasi et al., 2010). Однако в этих работах не оценивалось воздействие зрительной нагрузки при усложнении стимулов, а также ее влияние на характеристики движений глаз.
Исследование динамики зрительного внимания не только важно для поиска механизмов, лежащих в основе системы позиционирования и перевода взгляда, но и представляет интерес в прикладном отношении. В частности, разработка эффективных средств контроля зрительного внимания человека-оператора остается актуальной задачей, поскольку до настоящего времени отсутствуют широко внедренные в практику тесты, не препятствующие основной деятельности (Бурдин и др., 2013; Кирой и др., 2014; Ahlstroma., Friedman-Bergb, 2006; Mathan et al., 2010) и использующие параметры глазных движений. Известны лишь единичные примеры такого рода, такие как Index of Cognitive Workload (http://www.eyetracking.com) и Index of Cognitive Efficacy, основанных на оценке динамики диаметра зрачка и временных параметрах морганий и отчасти – ЭЭГ активности.
Таким образом, выбор областей интереса для переключения внимания и фиксации взгляда при осмотре изображений и сцен зависит от множества факторов и определяется перцептуальными и когнитивными механизмами, взаимодействующими между собой (Ярбус, 1965; Unema et al., 2005; Podladchikova et al., 2009; Velichkovsky et al., 2005 и многие другие). Несмотря на значительный прогресс в изучении механизмов зрительного внимания, достигнутый за последние 25 лет, многие аспекты этой проблемы далеки от полного понимания до настоящего времени (Carrasco, 2011). Неполнота имеющихся данных и в ряде случаев их противоречивость (Pastukhov et al., 2009), а также отсутствие стандартизации экспериментальных условий затрудняют возможность обобщения и формализации результатов, полученных в различных психофизических исследованиях. В силу этого математические модели, имитирующие нейробиологические феномены, рассматриваются как важный инструмент при исследовании механизмов зрительного внимания (Ho-Phuoc, 2012; Tandonnet et al., 2011; Tatler et al., 2011; Wang et al., 2011; Judd et al., 2010; Henderson et al., 2007; Li, Gilbert, 2002; Lowe, 2004; Navalpakkam, Itti, 2005; Podladchikova et al., 2009; Priviterra, Stark, 2005; Rao et al., 1997–2008; Rybak et al., 1998–2005; Samarin et al., 2015; Saykol et al., 2004; Simion et al., 2001; Wolfe, 1997–2005; Trappenberg et al., 2001; Brockmann, Geisel, 2000). Подчеркивается (Nuthmann et al., 2010; Walther, Koch, 2007), что создание реалистичной модели зрительного внимания позволит анализировать вклад факторов различного типа и механизмов разного уровня при формировании траектории осмотра и формулировать предположения, доступные экспериментальной проверке.
В настоящее время складывается понимание необходимости пересмотра подходов к моделированию управления глазными движениями (Tatler et al., 2011). В частности, большинство известных моделей формирования траекторий осмотра изображений, вслед за работой Koch, Ullman (1985), основано на обработке первичных признаков изображений, получении карт выделенности (saliency maps) и анализе пространственного распределения точек фиксации взгляда при осмотре изображений человеком. Имеются лишь единичные работы, в которых рассматриваются возможные подходы к моделированию длительности фиксаций (Nuthmann et al., 2010; Sutcliffe, Namoune, 2008) и когнитивных механизмов (Judd et al., 2009; Wang et al., 2011), основанные на эвристических алгоритмах.
В свою очередь для разработки реалистических моделей осмотра изображений необходимо получение детальных количественных оценок вклада различных факторов в экспериментальные исследования. На получение такого рода оценок и направлены наши психофизические исследования. Результаты этих исследований, полученные в последние годы с помощью разработанных специальных методов проведения эксперимента и анализа данных, представлены в соответствующих разделах монографии.
Bepul matn qismi tugad.