Когнитивные механизмы невербальной коммуникации

В. А. Барабанщиков, 2017

На примере восприятия выражений лица проводится экспериментально-психологический анализ механизмов невербальной коммуникации. Раскрывается система детерминант, обеспечивающих регуляцию межличностного взаимодействия. Описываются закономерности порождения и функционирования представлений человека о внутреннем мире (эмоциональных состояниях, чертах и структуре характера) коммуниканта по проявлениям его внешности. Коллективный труд знакомит с оригинальными методиками, новейшими данными и концепциями межличностного восприятия. Адресуется специалистам в области общей, социальной и прикладной психологии, работникам сферы массовых коммуникаций, служб визуального контроля, а также тем, кто интересуется закономерностями невербального общения и современными течениями в экспериментальной психологии. В формате a4.pdf сохранен издательский макет.

Оглавление

* * *

Приведённый ознакомительный фрагмент книги Когнитивные механизмы невербальной коммуникации предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Глава 2. Зависимость восприятия лицевых экспрессий от пространственно-временной структуры экспозиции

2.1. Динамика выражений лица как источник информации о модальности эмоции

Хотя эмоции человека всегда развернуты во времени, т. е. имеют начало, кульминацию и конец, их восприятие сторонним наблюдателем традиционно изучается на материале дискретных экспозиций, фиксирующих состояния людей в определенный момент времени (фотографий, портретов, рисунков). Изображенные позы, жесты, выражения лица действительно характеризуют модальность и интенсивность переживаний личности, но вне динамики являются скорее символами соответствующих эмоций. Подобный подход оправдывается скоротечностью экспрессий и категориальностью самого восприятия (Ананьева, Барабанщиков, Демидов, 2015; Барабанщиков, Демидов, Дивеев, 2012; Барабанщиков, Жегалло, Королькова, 2016; Calder, Rhodes, Johnson, Haxby, 2011; Ekman, Rosenberg, 2005).

Немногочисленные работы по восприятию динамики выражений лица опираются на идеи экологической оптики (Gibson, 1966; McArthur, Baron, 1983) и вытекающие из них исследования восприятия биологического движения (Johansson, 1973). Ключевой факт состоит в том, что в отсутствие структурированных поверхностей кинематические паттерны, сопровождающие любое естественное поведение, способны нести уникальную информацию о содержании (но прежде всего о форме) воспринимаемого объекта. В частности, в темноте движение 10–12 светящихся точек, установленных на основных сочленениях тела натурщика, вызывает впечатление локомоций определенного человека, позволяет определить их тип (прогулка, бег, прыжки) и гендерную стилистику. При остановке движения перцептивный эффект исчезает, а с началом движения — проявляется через 100 мс (Cutting, Kozlowski, 1977; Runeson, Frykholm, 1983). Использование метода световых точек при изучении восприятия выражений лица показало, что во время их движения наблюдатели точно оценивают модальность экспрессии невидимого натурщика, но идентифицировать статичный набор точек в качестве лица человека и/или его эмоции не в состоянии (Bassili, 1978). При перемещении световых точек существует высокая вероятность опознавания лиц известных наблюдателю людей и определения их пола (Bruce, Valentine, 1988). Важность информации о динамике лица была продемонстрирована в экспериментах другого типа. Например, Б. Найт и Х. Джонстон нашли, что известные лица лучше идентифицируются на фотонегативах, если последние экспонируются не статично, а в движении (Knight, Johnston, 1997).

Использование методов компьютерной анимации, получивших распространение в последние годы, подтвердило влияние динамики лица на точность распознавания эмоциональных экспрессий (Wallraven, Breidt, Cunningham, Bülthoff, 2008; Wehrle, Kaiser, Schmidt, Scherer, 2000), особенно в условиях ограничения статичной информации — при исключении из экспозиции текстуры и контура лица, его схематизации и т. п. Так, при постепенном уменьшении информации о текстуре или строении лица точность оценок статических экспрессий резко снижается, тогда как при значительной потере информации и «смазывании» изображений лица динамические экспрессии распознаются эффективно (Wallraven et al., 2008). Снижая уровень детализации (количество опорных точек) либо уменьшая размер изображений анимированных экспрессий, можно добиться большего эффекта динамики по сравнению со статикой, независимо от наличия текстуры (Cunningham, Wallraven, 2009a, 2009b).

С усилением экологической валидности условий восприятия, в том числе при экспозиции естественных изображений лица, эффект движения уменьшается либо не проявляется вовсе (Cunningham, Wallraven, 2009a; Fiorentini, Viviani, 2011; Fiorentini, Schmidt, Viviani, 2012; Katsyri, Sams, 2008). Экспонируя динамические последовательности, полученные путем покадрового компьютерного морфинга пар видеофрагментов «нейтральное лицо — сильно выраженная экспрессия», К. Фиорентини и П. Вивиани не выявили систематических различий при категоризации статических либо динамических переходных экспрессий (Fiorentini, Viviani, 2011). Уменьшение угловых размеров видеоизображений экспрессий вплоть до 2° также не приводит к сильному ухудшению их различения (Cunningham et al., 2004). При сопоставлении результатов распознавания базовых динамических экспрессий по их видеоизображениям на лице натурщика и компьютерным реконструкциям высокой степени детализации и реалистичности (в частности, 3D — и 4D-сканирование лица) наблюдаются сходные уровни точности идентификации (Cunningham et al., 2004; Wallraven et al., 2008). Однако при сравнении динамических экспрессий, выраженных натурщиком, и компьютерной 3D-анимации более низкого качества, которая не полностью передает детали реального лица и затрудняет распознавание статических экспрессий, динамика обеспечивает более высокую эффективность восприятия (Katsyri, Sams, 2008).

Важными для понимания эффекта движения лица представляются следующие обстоятельства.

Во-первых, динамика мимических проявлений несет функционально иной тип информации по сравнению со статичными признаками эмоции. Во всяком случае, ее влияние нельзя полностью объяснить множественным суммированием статичных образов. В частности, в условиях динамической экспозиции слабовыраженные экспрессии распознаются более точно, чем дискретные «срезы» этих же экспрессий, разделенные масками, исключающими появление кажущегося (стробоскопического) движения и порождающими эффект «слепоты к изменению» (Ambadar, Schooler, Cohn, 2005). Преимущество динамических экспозиций не исчезает и при пространственной инверсии лица, расшатывающей его конфигурационные связи, по крайней мере, для части экспрессий (Ambadar, Schooler, Cohn, 2005; Bould, Morris, Wink, 2008).

Во-вторых, эффект движения лица зависит от интенсивности экспрессий. Чем слабее выражена эмоция, тем больший вклад в ее распознавание вносит динамическая составляющая (Bould, Morris, 2008; Bould, Morris, Wink, 2008). При сильных мимических проявлениях информация, достаточная для точной идентификации модальности эмоций, содержится уже в статичных экспозициях лица, а эффект динамики (более слабый) наблюдается только для экспрессий гнева, отвращения, радости и удивления.

В-третьих, влияние непрерывных мимических изменений на восприятие выражения лица вызвано не самим фактом движения, а его временной структурой. При ее разрушении или инверсии точность распознавания модальности слабых динамических экспрессий падает (Cunningham, Wallraven, 2009a). Изменение характерной скорости проявления слабо выраженных экспрессий ведет к ухудшению их распознавания (Bould, Morris, Wink, 2008). Установление механизмов, чувствительных к временной структуре экспрессий, составляет одну из наиболее важных перспектив исследования восприятия естественных выражений лица в экологически валидных условиях.

Впечатление непрерывного изменения лица может быть получено не только в результате реальной динамики мимических мышц, но и иным путем. Например, быстрой сменой экспозиций статичных «срезов» экспрессивной динамики. Именно на этом принципе построен кинематограф. Сохранятся ли тенденции, описанные выше, при восприятии кажущегося движения лица?

Под кажущимся (стробоскопическим) движением мы будем понимать последовательность статичных изображений экспрессий, вызывающую впечатление непрерывного изменения эмоционального состояния натурщика. Целесообразность обращения к ситуации кажущегося движения при изучении восприятия экспрессий лица состоит в том, что здесь реализуется простейшая временная структура динамической экспозиции и моделируется преобразование одного статичного состояния в другое, подобное линейному пространственному морфингу лица (Барабанщиков, Жегалло, Королькова, 2016; Куракова, 2013; Жегалло, 2007; Calder et al., 1996; De Gelder, Teunisse, Benson, 1997). В рамках проблемы восприятия выражений лица возникают следующие вопросы. Влияет ли стробоскопическая экспозиция экспрессий на точность их распознавания? Если влияет, то как? Какие ошибки совершают наблюдатели? Зависит ли результат распознавания от модальности и продолжительности экспрессий? К сожалению, прямые исследования восприятия стробоскопической экспозиции выражений лица отсутствуют. Существуют данные, подчеркивающие сходство восприятия кажущегося и реального движения и их зависимость от одних и тех же детерминант (Марр, 1987; Ульман, 1983; Bruce, Green, 1993; Clatworthy, Frisby, 1973; Kolers, 1972), среди которых особый интерес представляет эффект повышения различительной чувствительности отрезков прямых при их периодичной стробоскопической экспозиции, вызывающей впечатление кажущегося движения (Джафаров, Аллик, Линде, 1983; Линде, Соколов, 1986; Соколов, 1986).

Отвечая на поставленные вопросы, мы провели ряд экспериментов, в которых исследовалась зависимость распознавания базовых эмоциональных экспрессий от условий их экспозиции. Точность восприятия эмоций оценивалась в ситуациях (1) стробоскопического движения, (2) прямой и обратной зрительной маскировки и (3) статической экспозиции фотоизображений лицевых экспрессий на пустом экране. В условиях стробоскопического движения на короткое время экспонировалась статическая экспрессия, до и после которой в этой же позиции предъявлялись изображения спокойного лица. В условиях зрительной маскировки спокойное лицо заменялось «маской», созданной путем случайного перемешивания частей спокойного лица; возникновение эффекта движения в этом случае не ожидалось. Наконец, в контрольной серии фотографии эмоционального лица предъявлялись сами по себе без каких-либо дополнительных изображений.

Согласно гипотезе, при быстром предъявлении наблюдателям последовательности статичных изображений «нейтральное лицо-экспрессия — нейтральное лицо» возникает впечатление динамической микроэкспрессии, длящейся доли секунды. По сравнению со статичными «срезами» лица и/или с изображениями, подверженными маскировке, распознавание эмоций в условиях кажущегося движения может быть более эффективным.

Стимульный материал и процедура исследования

Стимульным материалом служили цветные фотографии лиц натурщиков (трех мужчин и трех женщин) анфас, выражающих шесть базовых эмоциональных экспрессий (радость, удивление, страх, печаль, отвращение, гнев) и спокойное состояние (нейтральное лицо). Изображения отобраны из валидизированной базы RaFD (Langner et al., 2010). Их размер и угол поворота лица были скорректированы так, чтобы глаза натурщиков на всех изображениях располагались на одном уровне, расстояние между зрачками было одинаковым, а изображения лица на каждой фотографии занимали равную площадь. Изображения кадрировались до размера 450×564 пикселей (рисунок 2.1).

При маскировке использовались «рандомизированные лица», которые получали следующим образом. Изображения лиц, выражающих спокойное состояние, разрезали на 13 частей по вертикали и 15 частей по горизонтали; полученные прямоугольники (размером 35×38 пикселей) в случайном порядке меняли местами. Благодаря этой процедуре распределения цветов и яркости на изображениях сохранялись, но целостная структура лица разрушалась.

Рис. 2.1. Примеры фотоизображений экспрессий лица из базы RaFD (Langner et al., 2010): а — спокойное (нейтральное), б — радость, в — отвращение, г — удивление

Стимульные изображения предъявлялись на экране ЭЛТ-монитора (ViewSonic G90f, частота 100 Гц), подключенного к ПК, в условиях нормальной освещенности. Испытуемые располагались на расстоянии около 60 см от экрана и смотрели на изображения бинокулярно. Угловые размеры изображений составляли около 16°×20°.

В эксперименте 1 участвовали 53 человека (37 женщин, 16 мужчин; возраст 17–53 года, медиана — 19 лет) с нормальным или скорректированным до нормального зрением. Каждый испытуемый выполнил все три серии. Порядок выполнения серий варьировался.

Исследование включало три экспериментальные серии, отличавшиеся друг от друга содержанием контекста — изображениями, которые предшествовали тестовому и следовали за ним. В серии 1.1 в качестве контекста использовались изображения нейтрального лица того же натурщика, экспрессия которого демонстрировалась в данной пробе. В серии 1.2 контекстом служили рандомизированные лица, в серии 1.3 — светло-серый фон пустого экрана.

На рисунке 2.2 представлена схема предъявления стимульного материала и время экспозиции каждого изображения. В каждой пробе в центре экрана на светло-сером фоне последовательно экспонировались: 1) черный фиксационный крест (угловые размеры 1,4°×1,4°); 2) пустой экран; 3) первое контекстное изображение; 4) пустой экран; 5) тестовое изображение лица; 6) второе контекстное изображение, аналогичное первому; 7) пустой экран; 8) вопрос «Какие эмоции присутствовали на изображении?» с вариантами ответа «радость», «гнев», «страх», «удивление», «отвращение», «печаль», «спокойное лицо». Участнику предлагалось выбрать из предъявленного списка название той эмоции, которая бы максимально соответствовала увиденной экспрессии. Ответ, выбранный в каждой пробе, а также время ответа регистрировались путем нажатия клавиши «пробел», которое позволяло перейти к следующей пробе. Для сохранения эффекта движения в пробах, где в качестве тестового предъявлялось спокойное лицо, оно смещалось на 5 пикселей вверх.

Временная организация стимульного материала подбиралась опытным путем на основе данных, полученных в других исследованиях (Джафаров и др., 1981; Линде, Соколов, 1986; Braddick, 1980; Claworthy, Frigby, 1973; Kolers, 1972; Michaels, Turvey, 1979; Turvey, 1973). Тестовые изображения предъявлялись на время, равное 50, 100 либо 200 мс. Длительность первого контекстного изображения составляла 300 мс, второго — 100 мс.

В течение одной серии каждая из семи экспрессий, выраженная каждым из шести натурщиков, предъявлялась по 7 раз. Таким образом, серия включала: 3 времени экспозиции × 7 экспрессий × 6 натурщиков × 7 повторов = 882 пробы. Все пробы были разбиты на 4 блока, между которыми испытуемые могли делать паузы. Порядок предъявления стимульного материала в каждом блоке был случайным.

Рис. 2.2. Структура стимульной ситуации

Перед началом основного эксперимента проводилась тренировочная серия. Она состояла из 7 проб, в каждой из которых экспонировалась одна из 7 экспрессий, выраженная одним из 6 натурщиков. Длительность тестового изображения составляла 300 мс. Экспонируемые экспрессии в тренировочных пробах не повторялись.

Статистическая обработка данных проводилась при помощи пакета R 3.0.3. Анализировалось влияние изучаемых факторов на точность распознавания экспрессий. Верными ответами считали совпадение выбранной в каждой пробе категории эмоции с тем состоянием, которое изображал натурщик. Методом дисперсионного анализа с внутригрупповыми факторами Время предъявления (3 градации), Содержание контекста (3 градации), Экспрессия натурщика (7 градаций) рассчитывались отношения F Фишера для каждого из факторов и их взаимодействий. Значимость критерия оценивалась с помощью рандомизационного теста, эффективного даже при нарушении условий использования дисперсионного анализа. Рандомизация проводилась для каждого испытуемого в отдельности, количество итераций — 1000.

С помощью точного теста Фишера частоты верных ответов в трех сериях сопоставлялись попарно: а) средние по всем экспрессиям и всем временам предъявления; б) средние по всем временам предъявления для каждой экспрессии; в) средние по всем экспрессиям для каждого времени предъявления; г) для каждой экспрессии и каждого времени предъявления в отдельности.

Частоты выборов семи категорий — названий базовых эмоций — сопоставлялись при помощи χ2 Пирсона для каждой экспрессии: сравнивались распределения частот в трех сериях (кажущееся движение; маскировка; изолированное лицо) и при разном времени экспозиции (50, 100, 200 мс). Уровни значимости во всех случаях рассчитывались методом Монте-Карло (количество итераций — 2000) с коррекцией Беньямини — Хохберга на множественные сравнения.

Оценка эмоций в условиях кажущегося движения

Феноменология восприятия. Несмотря на близость временной организации стимульных паттернов в трех сериях, их восприятие зависит от содержания контекста, в который включалось тестовое фотоизображение. Если оно просто демонстрируется на светло-сером фоне экрана, наблюдатели воспринимают неподвижное экспрессивное лицо само по себе. Если фотографии экспрессии лица предшествует и следует за ней изображение этого же натурщика в спокойном состоянии, воспринимается кажущееся движение — быстрое непрерывное изменение выражения лица, нередко сопровождаемое движением головы. Наконец, в тех случаях, когда появление тест-объекта ограничивается рандомизированными изображениями, наблюдатель видит статичное изображение экспрессии с наложенными на него шумовыми масками. Три содержательно различные стимульные ситуации, реализованные в соответствующих экспериментальных сериях, обозначим как «кажущееся движение» (серия 1.1), «маскировка» (серия 1.2) и «изолированное лицо» (серия 1.3).

Точность распознавания экспрессий. В ходе анализа мы пытались установить, зависит ли относительная частота проб, в которых выбранная испытуемым эмоция совпадала с экспрессией, выраженной натурщиком («верные ответы»), от условий восприятия и модальности экспрессии. Ответы, не совпадающие с экспрессией натурщика, считались «ошибочными». Согласно полученным данным, все варьируемые факторы: Время, Экспрессия, Контекст, а также их взаимодействия оказались значимыми (p = 0,001). Средние значения эффективности распознавания в зависимости от времени экспозиции, модальности экспрессии и содержания контекста приведены на рисунке 2.3 и в таблицах 2.1 и 2.2.

Рис. 2.3. Точность распознавания экспрессий (доля «верных» ответов) в зависимости от модальности эмоции, времени экспозиции (мс) и содержания контекста

Вероятность правильных ответов в подавляющем большинстве случаев выше случайной (средняя точность распознавания по всем условиям 0,76). Лучше всего распознаются «радость» (0,95), «удивление» (0,90) и спокойное лицо (0,90), хуже всего — «гнев» (0,53) и «страх» (0,56). Средние по всем экспрессиям и временам экспозиции частоты верных ответов в сериях 1.1 и 1.2 значимо не различаются (доля «верных» ответов в обеих сериях составляет 0,74; скорректированный уровень значимости точного теста Фишера при сопоставлении частот ответов в этих двух сериях p = 0,423). Ответы в серии 1.3 (изолированное предъявление лица, точность распознавания 0,81) значимо отличны от соответствующих ответов в сериях 1 и 2 (кажущееся движение и маскировка) (p<0,001). Отдельно по каждой экспрессии все различия между сериями значимы (p<0,008) за исключением «удивления» (p = 0,489) и нейтрального лица (p = 0,481), для которых результаты оценки в условиях кажущегося движения и изолированного лица не отличаются. Средняя по всем экспрессиям точность ответов в разных сериях значимо различается в зависимости от времени экспозиции, кроме серий с кажущимся движением и маскировкой при 100 мс (p = 0, 374).

Таблица 2.1. Точность распознавания в зависимости от содержания контекста, времени экспозиции и модальности экспрессий

Таблица 2.2. Точность распознавания экспрессии в каждом из экспериментальных условий

Сопоставление различий отдельно по каждой экспрессии и каждому времени экспозиции дает следующие результаты. Для экспрессий гнева и печали все различия между сериями значимы (p<0,021), для «страха» и «отвращения» различия значимы (p<0,008) за исключением серий с кажущимся движением и маскировкой, предъявленных на 200 мс (для «страха» p = 0,877; для «отвращения» p = 0,068). Для экспрессии удивления отсутствуют различия между всеми условиями при экспозиции на 200 мс (p>0,115) и между кажущимся движением и изолированным лицом, экспонируемым на 100 мс (p = 0,897). Для «радости» значимы все различия при 50 мс (p<0,028) и между кажущимся движением и изолированным лицом — при 100 мс (p = 0,017). Нейтральное лицо, экспонируемое на 50 и 100 мс в качестве тест-объекта, распознается наименее эффективно в условиях маскировки (p<0,002).

Профили оценок. Влияние независимых переменных распространяется не только на адекватные, но и на неадекватные оценки, ошибочность которых весьма условна (Барабанщиков, 2009, 2012). Выполненные оценки разделяются на три группы: 1) «верные» ответы, совпадающие с демонстрируемой эмоцией; 2) редкие (случайные) ответы, не совпадающие с демонстрируемой эмоцией; 3) «ошибочные» ответы выше случайного уровня (рисунок 2.4). Последние могут быть как регулярными, т. е. присутствовать при всех условиях эксперимента (восприятие «гнева» при экспозиции «отвращения», «печали» — при экспозиции «гнева»), так и врéменными — наблюдаться в условиях маскировки и кажущегося движения (восприятие «удивления» при экспозиции «страха» на 50 и 100 мс; спокойного состояния — при экспозиции «гнева» или «печали» на 50 мс). За исключением экспрессии гнева (50 мс, ситуация кажущегося движения) «верные» оценки преобладают над «ошибочными». В ситуациях кажущегося движения и маскировки «ошибки» восприятия зависят от времени экспозиции для всех экспрессий (p<0,001) кроме нейтрального лица при кажущемся движении (p = 0,6932). В ситуации изолированного лица различия значимы так же только для нейтрального лица (p = 0,0102). При 50 и 100 мс все различия между условиями значимы (p<0,034), при 200 мс — значимы только для экспрессий страха, отвращения, гнева и печали (p<0,001). Существует тенденция реципрокности в отношении «верных» и «ошибочных» ответов: снижение долей «верных» оценок ведет к избирательному повышению долей неверных распознаваний этих же экспрессий, особенно на самых коротких экспозициях.

Рис. 2.4. Профили оценок экспрессий в зависимости от их модальности, времени экспозиции и содержания контекста. По оси абсцисс — время экспозиции (50, 100, 200 мс) и содержание контекста (1 — кажущееся движение; 2 — маскировка; 3 — изолированное лицо). Горизонтальной пунктирной линией отмечен случайный уровень

Динамика распознавания микроэкспрессий лица в условиях кажущегося движения и зрительной маскировки

Анализ показывает, что все три экспериментальных условия и их сочетания значимо влияют на оценку экспрессий лица. Организация стимульной информации, модальность экспрессии и продолжительность ее экспозиции действительно определяют распознавание мимических выражений; влияние каждой из детерминант носит сложный, взаимоопосредованный характер.

Базовый уровень эффективности распознавания экспрессий в микроинтервалах времени зафиксирован при экспозиции изолированного лица и зависит от модальности эмоции. Точнее всего распознается экспрессия радости (0,97), а также спокойное (0,92) и удивленное (0,91) лицо, менее точно — печаль (0,88), сравнительно плохо — экспрессии отвращения (0,75), страха (0,65) и гнева (0,61). Разная степень аттрактивности базовых экспрессий согласуется с ранее полученными данными в условиях затрудненного восприятия эмоциональных выражений: при их зашумлении, повороте относительно наблюдателя или ограничении времени экспозиции (Барабанщиков, 2012). С введением содержательного контекста перцептогенез растягивается во времени, требуя более продолжительных экспозиций в 100 мс («радость», «удивление», «отвращение») и 200 мс («печаль», «страх», «гнев»); экспозиции в 50 мс соответствуют лишь начальные стадии перцептогенеза. Влияние стробоскопической экспозиции на точность распознавания эмоций носит избирательный характер, охватывая преимущественно экспрессии, имеющие низкую аттрактивность («гнев», «страх», «печаль»).

В отсутствие содержательного контекста длительность экспозиции (50, 100 или 200 мс) лица на эффективность распознавания не влияет (0,81). Наиболее точно оцениваются «радость» (0,97), «удивление» (0,91) и спокойное состояние (0,87), наименее точно — «страх» (0,65) и «гнев» (0,61). При маскировке и кажущемся движении лица с уменьшением времени экспозиции общий уровень распознавания снижается до 0,74. Влияние контекста зависит от «броскости» (аттрактивности) экспрессий: точность оценок «страха» падает до 0,49, «гнева» — до 0,48. Уровни оценок «удивления», «радости» и спокойного состояния в этих условиях совпадают с уровнем оценок изолированного лица.

Сказанное означает, что для завершения перцептогенеза базовых экспрессий в контрольной серии экспозиция в 50 мс вполне достаточна. Ранее сходный результат получен на экспрессиях большого числа натурщиков из базы KDEF (Calvo, Lundqvist, 2008). Ограничение времени экспозиции в данном исследовании также вело к снижению точности распознавания базовых эмоций, однако при экспозиции выражений радости и спокойного состояния эти различия были незначительны (при длительности экспозиции 50 мс «радость» распознается на максимально высоком уровне).

Результаты анализа «ошибочных» ответов позволяют описать обнаруженные феномены в терминах категориальных полей экспрессий (Барабанщиков, 2002, 2009) — систематических идентификаций той или иной экспрессии с рядом других эмоций, проявляющихся в данных условиях. Каждое категориальное поле включает ядро (наиболее частые «верные» ответы), периферию, представленную регулярными «ошибками», и фон (случайные ответы). Соотношение между компонентами динамично и зависит от модальности экспрессии, ее длительности и содержания контекста. Так, с уменьшением времени экспозиции использование кажущегося движения либо маскировки экспрессий значимо меняет структуру категориальных полей, причем в разных контекстах по-разному. Экспрессия страха чаще воспринимается как «удивление», «печаль» и «гнев» — как спокойное лицо. Роль мимических признаков экспрессий в формировании целостного образа эмоционального лица меняется. По существу, условия маскировки и кажущегося движения моделируют тот этап перцептогенеза, на котором признаки экспрессий лишь начинают дифференцироваться, создавая предпосылки конкретизации актуализируемого прототипа выражения лица.

Основной результат выполненного исследования заключается в том, что по сравнению со статичной экспозицией кажущееся движение не приводит к увеличению точности распознавания эмоций. Как и в случае реального движения, статичное изображение сильных экспрессий содержит всю информацию, достаточную для эффективной оценки выраженной эмоции. Влияние контекста на эффективность восприятия экспрессий зависит от их модальности. Для «печали», «гнева» и «страха» кажущаяся динамика лица снижает точность распознавания в большей степени, чем рандомизированное лицо, особенно при минимальном времени экспозиции. Негативное влияние маскировки ярче проявляется при экспозиции «удивления», «отвращения» и спокойного выражения лица. В итоге средние оценки экспрессий в условиях кажущегося движения и маскировки практически совпадают, указывая на функциональное сходство стимульных ситуаций. Это означает, что кажущееся движение лица включает момент маскировки, а прямая и обратная зрительная маскировка — возможность кажущихся изменений. С увеличением длительности экспозиции экспрессии до 200 мс негативное влияние и маскировки, и кажущегося изменения лица снимается.

2.2. Вербализация экспрессий, экспонируемых в разных контекстах

Пытаясь разобраться в механизме влияния стробоскопической стимуляции на восприятие эмоциональных выражений лица, мы провели еще один эксперимент на группе экспертов в области науки о лице. Нас интересовали способы ориентировки подготовленного наблюдателя в рассмотренных ситуациях и характер его ответов. Основной метод исследования — вербальные описания видимых сцен.

Метод свободных описаний

Исследование проводилось на том же оборудовании и с тем же стимульным материалом, которые использовались в первом эксперименте. Участники эксперимента: 7 человек (5 женщин, 2 мужчины; возраст — 27–54 года, медиана — 47 лет) с нормальным или скорректированным до нормального зрением, специалисты, изучающие восприятие лица.

Эксперимент 2 включал три серии с тем же содержанием контекста, что и в эксперименте 1. В отличие от процедуры первого эксперимента, тестовые изображения всегда предъявлялись на 50 мс; каждая из семи экспрессий, выраженная каждым из шести натурщиков, предъявлялась по одному разу (всего 42 пробы); порядок предъявления — случайный. Варианты ответов не предлагались. От наблюдателей требовалось в каждой отдельной пробе словами описать выражение лица натурщика, а также любые другие замеченные особенности изображения. Ответы записывались на диктофон. Тренировочная сессия не проводилась.

Полученные аудиозаписи расшифровывались и соотносились с каждым из экспериментальных условий. В вербальных описаниях, данных участниками исследования, выделялись следующие классы дескрипторов: 1) называние конкретной эмоции (например: «гнев», «горе» и др.) или общая оценка модальности («негативная эмоция»); 2) описание мимики в отдельных зонах лица — лба/бровей, глаз, носа, рта (например: «нахмуренные брови», «открытые глаза», «наморщенный нос», «растянутый рот»); 3) указания на движения головы (например: «кивок», «поворот головы слева направо»); 4) недифференцированное восприятие движения/изменения изображения в целом («мимолетное движение», «сдвиг изображения», «что-то изменилось»); 5) значительные затруднения в определении эмоции, приводящие к отказу давать ответ («непонятно, какая эмоция»). Помимо основных дескрипторов часто отмечался пол натурщика и особенности его внешности (например: «девушка, блондинка»).

Точность распознавания экспрессий оценивалась на основании содержания дескрипторов, указывающих на модальность эмоции. Верными считались те описания, в которых эмоция была названа однозначно и совпадала с состоянием, которое изображал натурщик. К этой же категории относились и синонимичные описания; так, для экспрессии гнева адекватными считались описания «гнев», «злость» и однокоренные слова; для «страха» — «страх» и «испуг»; для «радости» — «радость» и «улыбка»; для нейтрального лица — «нейтральное», «спокойное», «без эмоции»; для «печали» — «печаль», «грусть» и «горе»; для «удивления» и «отвращения» синонимы в категорию верных ответов не включались. Частично верными ответами считались неоднозначные описания, включавшие верный дескриптор, например: «либо гнев, либо горе» для экспрессии «гнева». «Ошибочными» ответами считались все иные описания эмоциональных состояний, а «отказами» — ответы, в которых называние эмоции отсутствовало.

Доминантность мимических признаков оценивалась по предпочтениям, отдаваемым в описаниях верхней (брови — лоб), средней (глаза — веки — основание носа) и нижней (рот — подбородок) частей лица либо его отдельных элементов. Примеры подобных высказываний: «поднятые брови», «наморщенный лоб», «увеличились глаза», «широко открытый рот», «напряжение вокруг носа».

Влияние кажущегося движения головы устанавливалось путем соотнесения предметных описаний воспринятого изменения расположения лица с точностью распознавания экспрессий либо с их доминантными признаками («наклон головы вперед, кажется, это был гнев»; «движение назад небольшое, изменение в области рта, даже зубы видел, вероятно, это отвращение»). В подобном ключе рассматривались описания изменений изображения при невозможности (затруднениях) раскрыть его содержание («было движение, непонятно какое; эмоции не было вообще»).

Анализ результатов включал сопоставление долей соответствующих дескрипторов в зависимости от модальности экспрессии и содержания контекста. Статистическая оценка значимости различий анализируемых параметров ввиду небольшого объема выборки не проводилась.

Вербализация экспрессий, предъявляемых в контекстах

Точность распознавания экспрессий. Полученные данные показали, что доля верных ответов зависит как от модальности экспрессии, так и от содержания контекста, в котором она экспонировалась (рисунок 2.5). Наибольшая доля адекватных описаний выявлена в контрольной серии — экспозиции лица на фоне чистого экрана (0,78). С введением маскировки точность распознавания снижается (0,59), а при использовании стробоскопической стимуляции становится предельно низкой (0,45). Уменьшение доли верных ответов происходит за счет увеличения количества отказов от описания эмоции (от их практического отсутствия в контрольной серии до 0,10 и 0,30 в условиях рандомизированной маски и кажущегося движения соответственно). Доли ошибочных и частично верных ответов в трех экспериментальных сериях находятся на одном уровне.

Наибольшая средняя точность распознавания получена при экспозиции «радости» (0,80), нейтрального лица (0,77) и «удивления» (0,68). Для экспрессий страха (0,48), печали (0,48) и гнева (0,40) она снижается на фоне увеличения доли ошибочных ответов. Соотношение уровней точности распознавания тестируемых эмоций в каждой из трех серий в целом сохраняется. Доли отказов и частично верных ответов с модальностью эмоции систематически не связаны. Соотношение верных, частично верных, ошибочных ответов и отказов при распознавании эмоций на лицах разных натурщиков практически не менялось.

Рис. 2.5. Точность распознаваний экспрессий в зависимости от их модальности и содержания контекста: серия 2.1 — кажущееся движение; серия 2.2 — маскировка; серия 2.3 — изолированное лицо

При анализе «ошибочных» и частично верных ответов выявлены следующие особенности. Экспрессия радости (0,09) и нейтральное лицо (0,10) в отдельных случаях смешиваются с «гневом», «отвращением» или «страхом». Экспрессия удивления ошибочно распознавалась как «страх», независимо от содержания контекста (0,13). Экспрессия отвращения при любом содержании контекста смешивается, прежде всего, с «гневом» (0,18). Для экспрессии гнева структура «ошибок» трансформируется: если при кажущемся движении или изолированном лице «гнев» воспринимается как «печаль» (0,11) либо «отвращение» (0,09), то при маскировке рандомизированным паттерном он смешивается с нейтральным лицом (0,24) и «отвращением» (0,12). «Страх», экспонируемый при кажущемся движении либо на изолированном лице, смешивается с «удивлением» (0,17), реже — с «гневом» (0,08) и «отвращением» (0,06); при введении маскировки среди «ошибочных» ответов доминируют «печаль» (0,14) и «удивление» (0,12). «Печаль» отождествляется с нейтральным лицом (0,19), причем при маскировке доля смешений возрастает до 0,36. Таким образом, при экспозиции лица на фоне чистого экрана и кажущегося движения структура «ошибочных» идентификаций экспрессий гнева, страха, печали сохраняется, в то время как маскировка лица ведет к ее трансформации.

Описания признаков экспрессий и движений головы. В процессе распознавания эмоциональных экспрессий наблюдатели указывали на отдельные доминантные особенности лица, характерные для демонстрируемой эмоции. Чаще всего описывалась зона губ и зубы (0,23). Различия в частоте упоминания рта зависели от модальности эмоции и содержания контекста. Например, для «радости» и «удивления» в условиях кажущегося движения область рта упоминалась с частотой 0,6; в условиях изолированного лица — 0,45 и 0,38 соответственно; при маскировке частота упоминаний рта снижалась до 0,19 и 0,17. При распознавании «страха» и «отвращения» рот натурщика описывался как в условиях кажущегося движения (0,14 и 0,40 соответственно), так и изолированного лица (0,33 и 0,21); для «гнева» и «печали» рот упоминался только в условиях изолированного лица (0,29 и 0,17).

Реже описывалась зона глаз. Для «удивления» и «страха» в условиях кажущегося движения — 0,12 для обеих экспрессий; в отсутствие контекста — 0,26 и 0,31 соответственно. Для «радости» и «отвращения» область глаз упоминалась только при экспозиции изолированного лица (0,12). При распознавании «гнева» и «печали» глаза не упоминались; при демонстрации изолированного лица внимание наблюдателей направлялось в область лба/бровей (0,21 и 0,14, соответственно), смещаясь в условиях кажущегося движения на движения головы натурщика. Мимические признаки в области носа систематически упоминались только при экспозиции «отвращения» в отсутствие контекста (0,21).

«Лицевые жесты», или видимые смещения лица, сопровождаемые движениями головы, описывались только в условиях стробоскопической стимуляции и только для экспрессий гнева (0,48 — для «жестов», 0,14 — для движения), страха (0,12 для обоих классов дескрипторов) и печали (0,36 и 0,14, соответственно). Для «гнева» характерным жестом было «движение головы вперед», «наклон вперед» или «кивок». Для «страха» — «движение назад», «напряжение в шее». При экспозиции «печали» наблюдатели описывали «поворот головы», «движение назад» или «кивок вперед».

При экспозиции спокойного лица мимика не описывалась. Сдвиг изображения, используемый во время стробоскопической экспозиции, замечался (0,43).

Трудности категоризации, приводившие к отказу от описания эмоции, наблюдались в сериях с маскировкой и кажущимся движением. При маскировке рандомизированным паттерном отказ не сопровождался описанием мимических признаков, за исключением отдельных упоминаний области рта для экспрессий «удивления», «радости», «гнева». При экспозиции лица в условиях кажущегося движения, прежде всего, давались описания изменений в области рта: для «удивления» это «открытый рот», для «радости» и «отвращения» — «оскал», «показал зубы», «что-то сказал», для «страха» — «открытый рот», «что-то сказал». Глаза описывались только при экспозиции «гнева» («моргнул», «подмигнул»), «страха» и «удивления» («выпученные глаза»). Остальные зоны лица практически не описывались. Описания движений головы сопровождали большинство отказов от распознавания экспрессий гнева («кивок головой») и печали («кивок», «поворот головы»).

Таким образом, в зависимости от содержания контекста описания признаков экспрессий меняются. При изолированной экспозиции лица внимание больше обращается на область рта, а для отдельных экспрессий — дополнительно на зоны глаз («отвращение», «страх», «радость», «удивление»), лба/бровей («гнев», «печаль», «удивление») или носа («отвращение»). В условиях стробоскопической стимуляции описание движений головы сопровождается снижением упоминаний о мимических изменениях (экспрессии гнева, страха, печали). Так, при оценке экспрессий, которые характеризуются закрытым ртом («гнев», «печаль»), мимические признаки перестают замечаться вообще, а при оценке «страха» обе ключевые зоны (рот и глаза) упоминаются в два раза реже. Хотя для «отвращения», «радости» и «удивления» описания смещений головы не характерны, внимание наблюдателя концентрируется в области рта; частота описания других зон: глаз — для всех трех экспрессий, носа — для «отвращения» и лба/бровей — для «удивления», снижается. В условиях маскировки ни движение лица в целом, ни его мимические изменения не упоминаются, за исключением состояния рта при экспозиции «радости» и «удивления».

Кажущееся движение и маскировка: механизмы влияния

Результаты второго эксперимента подтверждают выводы, сделанные выше. В условиях короткой экспозиции наиболее точно распознаются экспрессии изолированного лица. При экспозиции в 50 мс перцептогенез эмоциональной экспрессии либо реализуется полностью, либо завершается на относительно поздних стадиях. Как и в эксперименте 1, лучше всего распознаются «радость» (1,0 — полное отсутствие ошибок), «удивление» (0,88) и спокойное состояние (0,81), тогда как эмоции отвращения (0,75), печали (0,74), страха (0,64) и гнева (0,60) оцениваются менее точно. Структура систематических «ошибок» распознавания, составляющих категориальное поле эмоций, также сохраняется: экспрессия отвращения воспринимается как гнев, «гнев» — как спокойствие и печаль, «страх» — как удивление, а «печаль» — как нейтральное лицо. Таким образом, способы оценки эмоционального состояния человека — альтернативный выбор из предзаданных категорий или свободное описание выражения эмоции — приводят к близким результатам. Опыт наблюдателей, связанный с необходимостью вербализаций выражений лица, обеспечивает сохранение среднего уровня точности ответов по всем базовым экспрессиям, независимо от характера поставленной задачи.

Введение содержательного контекста и во втором эксперименте снижает точность опознания всех эмоций, однако влияния маскировки и кажущегося движения выступают здесь более выпукло. У опытных наблюдателей стробоскопическая экспозиция приводит к более выраженному падению точности распознавания экспрессий, а число отказов назвать эмоцию по сравнению с прямой и обратной маскировкой увеличивается в три раза. Ключевые признаки эмоций лаконично упоминаются в контрольных пробах — при демонстрации изолированного лица. В условиях стробоскопической экспозиции число подобных высказываний сокращается, уступая место сообщениям о «жестах» головы, тесно связанных с проявлениями гнева, страха и печали, т. е. с экспрессиями, оценки которых в эксперименте 1 внесли решающий вклад в величину негативного влияния кажущегося движения. В условиях маскировки особенности локальной мимики замечаются редко, а о движениях головы ничего не говорится. Неслучайно структуры категориальных полей демонстрируемых эмоций в первой (1.1) и третьей (1.3) сериях обоих экспериментов совпадают, а во вторых (1.2) сериях (при прямой и обратной зрительной маскировке) принимают иной характер.

Полученные данные позволяют заключить, что при определенном сходстве временной структуры влияние стробоскопической экспозиции и рандомизированных масок на точность опознания экспрессии имеет разную природу. Если в условиях маскировки основным фактором неадекватного восприятия является прерывание естественного хода перцептогенеза, то в условиях кажущегося движения падение точности распознавания вызвано усложнением информационного содержания тест-объекта: появлением дополнительного качества, выраженного в наблюдаемых смещениях элементов лица и головы. Распознавание эмоционального состояния натурщика опосредуется «лицевым жестом» (кивком, поворотом, наклоном и т. д.), переключающим внимание наблюдателя. Структура и продолжительность перцептогенеза выражения лица в этих условиях меняются.

Совсем недавно влияние длительности экспозиции тест-объекта в условиях обратной маскировки, а также типа маски на эффективность распознавания экспрессий радости, гнева и спокойного лица были описаны в работе Л. Агуадо (Aguado et al., 2014). В отсутствие маски средняя точность идентификации эмоций достигает максимального уровня (близкого к 100 %) при экспозиции тест-объекта всего в 17 мс. Рандомизированная маска снижает эффективность только на этом времени, а начиная с 34 мс — не ухудшает распознавание эмоций. Если же в качестве маски используется изображение спокойного лица, то с уменьшением времени предъявления целевой экспрессии эффективность ее различения монотонно снижается (до 60-процентной эффективности распознавания при 17 мс, что также намного превышает случайный уровень). При предъявлении тест-объекта на 85 и 119 мс тип маскировки не влияет на точность распознавания, которая во всех трех условиях близка к 100 %. С уменьшением пространственного разрешения маскирующего изображения нейтрального лица эффект маскировки постепенно снижается. По существу маскирующий эффект имеет место на самых ранних этапах перцептогенеза и возрастает с увеличением информации о лице-маске (рандомизированная маска < изображение лица с низким пространственным разрешением < изображение лица с высоким разрешением). Учитывая близость стимульных ситуаций маскировки и кажущегося движения, сконструированных в нашем исследовании, можно полагать, что в условиях стробоскопической экспозиции выражений лица описанные тенденции не только сохранятся, но и усилятся.

Проведенные исследования позволяют частично ответить на вопросы, поставленные в начале главы. Стробоскопическая экспозиция действительно влияет на эффективность распознавания экспрессий лица, но не так, как ожидалось. При экспозиции экспрессии в течение 200 мс (время, близкое к средней зрительной фиксации) точность распознавания мимических паттернов в условиях кажущегося движения не превышает точности распознавания отдельных неподвижных изображений, а при более коротких экспозициях — 100 мс и особенно 50 мс — значимо снижена. В коротком диапазоне длительностей стробоскопическая стимуляция сдерживает развитие перцептогенеза и, по существу, маскирует эмоциональные экспрессии.

Несмотря на то, что средние значения точности восприятия в условиях кажущегося движения и маскировки рандомизированными паттернами совпадают, на уровне отдельных экспрессий их различия, как правило, значимы и носят разнонаправленный характер. Как и реальное, кажущееся движение обладает особым качеством, порождаемым собственной пространственно-временной структурой.

Экспозиция экспрессий в контексте стробоскопической стимуляции моделирует начальный этап перцептогенеза, когда образ лица плохо дифференцирован, нестабилен и легко подвержен разрушению. Проявляясь на ранних фазах этого процесса, жесты головы, сдвиги изображения либо смещения элементов лица становятся предметом внимания, «загораживая» признаки экспрессии (гнева, печали, страха). В отсутствие этих движений доминантные признаки, особенно в области рта, распознаются более эффективно. В отличие от стробоскопической экспозиции прямая и обратная зрительная маскировка прерывает перцептогенез выражения лица: оно воспринимается в обобщенной форме, а выделение частных мимических признаков затруднено. При изолированной экспозиции лица естественный ход перцептогенеза не меняется; он совершается оптимальным путем, позволяя наблюдателю мгновенно ориентироваться как на общее впечатление об экспрессии, так и на изменения мимики в отдельных зонах лица; точность распознавания эмоционального выражения достигает апогея.

Полученные результаты подтвердили факт достаточности для эффективного восприятия статической информации о сильных мимических проявлениях, распространив его на микроэкспрессии лица. Это позволяет надеяться, что в условиях ограничения статической информации (слабой экспрессии, отсутствии деталей или контура лица, нечеткости его изображения, повороте и т. п.) конструктивное влияние стробоскопического движения на точность распознавания эмоциональных состояний будет заметно.

2.3. Влияние микропаузы на распознавание базовых экспрессий

Выявление роли временнóй структуры экспозиции эмоциональных экспрессий в восприятии естественных выражений лица входит в число наиболее перспективных задач исследования межличностной коммуникации (Барабанщиков, Жегалло, Королькова, 2016). Нетрудно предположить, что это касается не только реального, но и кажущегося изменения экспрессии.

Напомним, что временная структура стимульной ситуации, использованной в экспериментах 1 и 2, включала «паузу» — короткий (20 мс) интервал, разделяющий экспозиции первого контекстного изображения (рандомизированное либо спокойное лицо) и тест-объекта (эмоциональные экспрессии, а также спокойное лицо). «Пауза» носила технический характер и по предположению исследователей должна была усилить эффект кажущегося движения спокойного лица, когда оно экспонировалось в роли тест-объекта; сам же эффект вызывался резким смещением изображения по вертикали. Влияние «паузы», или дополнительного межстимульного интервала (ДМИ), на оценку экспрессий и в условиях кажущегося движения, и в условиях маскировки оставалось неясным. Учитывая тот факт, что качество и параметры зрительных феноменов в микроинтервалах времени тесно связаны со структурой стимульной ситуации (Барабанщиков, 2002; Джафаров, Аллик, Линде, 1983; Ульман, 1983; Bruce, Green, 1993; Kolers, 1972; Palmer, 2003), мы провели специальное исследование — эксперимент 3, в котором сопоставлялась точность восприятия экспрессий в условиях кажущегося движения либо зрительной маскировки при наличии ДМИ и при его отсутствии.

Метод исследования

В исследовании участвовали 137 человек с нормальным или скорректированным до нормального зрением. Из них 35 человек (20 женщин и 15 мужчин, возраст 21–53, медиана возраста 32 года) приняли участие в серии со стробоскопическим движением и ДМИ (серия 3.1); 39 человек (28 женщин и 11 мужчин, возраст 17–20, медиана возраста 18 лет) — в серии с прямой и обратной маскировкой и ДМИ (серия 3.2); 34 человека (29 женщин и 5 мужчин, возраст 17–61, медиана возраста 29 лет) — в серии 3.3 со стробоскопическим движением без ДМИ; 29 человек (27 женщин и 2 мужчины, возраст 20–34, медиана возраста 22 года) — в серии 3.4 с прямой и обратной маскировкой без ДМИ. Чтобы исключить влияние переноса между экспериментальными сериями, каждый испытуемый участвовал только в одной из них.

Исследование проводилось по межгрупповому плану. Экспериментальные серии отличались друг от друга содержанием контекста и наличием либо отсутствием ДМИ — паузы (20 мс) между первым контекстным изображением и экспрессией, во время которой демонстрировался серый экран.

Перед началом каждой серии испытуемому предлагалось внимательно рассмотреть тестовые изображения лица и выбрать из предъявленного списка название той эмоции, которая максимально соответствует увиденной экспрессии. Во время тренировочной сессии в центре экрана на светло-сером фоне последовательно экспонировались:

• черный фиксационный крест (2000 мс, угловые размеры 1,4°×1,4°);

• «пустой» экран (длительность варьировалась псевдослучайно от 300 мс до 1300 мс, среднее время — 800 мс);

• первое контекстное изображение (300 мс);

• «пустой» экран (20 мс, только в сериях 3.1 и 3.2);

• тестовое изображение лица (300 мс);

• второе контекстное изображение (100 мс);

• «пустой» экран (500 мс);

• вопрос «Какие эмоции присутствовали на изображении?» с вариантами ответа «радость», «гнев», «страх», «удивление», «отвращение», «печаль», «спокойное лицо».

Ответ, выбранный в каждой пробе, а также время ответа регистрировались путем нажатия клавиши «пробел», которое позволяло перейти к следующей пробе. Всего проводилось 7 тренировочных проб, в каждой из которых тестовое изображение представляло одну из 7 экспрессий, выраженную одним из 6 натурщиков. Экспонируемые экспрессии в тестовых пробах не повторялись. Порядок проб был случайным. Для сохранения эффекта движения в пробах, где в качестве тестового предъявлялось спокойное выражение, изображение лица смещалось на 5 пикселей вверх.

После тренировки участники исследования переходили к выполнению основного задания. Пробы основной сессии были аналогичны тренировочным, за исключением следующих особенностей: тестовые изображения предъявлялись на время, равное 50, 100 либо 200 мс; каждая из семи экспрессий была выражена каждым из шести натурщиков (всего 42 фотоизображения); каждое сочетание натурщик/экспрессия предъявлялось по 4 раза. Таким образом, основное задание включало 504 пробы. Все пробы были разбиты на 2 блока, между которыми испытуемые могли прерываться на отдых. Порядок предъявления стимульного материала в каждом блоке был случайным.

Данные анализировались в среде статистического анализа R 3.3.0 (R Core Team, 2016). Зависимой переменной служили пропорции верных оценок экспрессий в различных экспериментальных ситуациях. Верным ответом считалось совпадение выбранной эмоциональной категории с тем состоянием, которое демонстрировал натурщик. Предварительная оценка показала, что распределение данных точности решения не соответствует нормальному, а дисперсии в разных условиях существенно различаются, что делает некорректным использование дисперсионного анализа. В связи с этим применялся метод логистической регрессии со смешанными эффектами, реализованный в пакете lme4 1.1–12 (Bates, Maechler, Bolker, Walker, 2015). Этот метод является предпочтительным для анализа данных, которые не удовлетворяют требованиям дисперсионного анализа (Jaeger, 2008). Он позволяет учесть не только влияние факторов, целенаправленно варьируемых в эксперименте, но и случайно распределенные вариации между отдельными испытуемыми.

Оценивалось влияние внутригрупповых факторов: Время экспозиции (3 градации) и Экспрессия натурщика (7 градаций), межгрупповых факторов: Содержание контекста (2 градации) и Временная структура стимульной ситуации (2 градации), а также их взаимодействий. В качестве случайного эффекта учитывался фактор испытуемого — индивидуальные вариации базового уровня точности ответа, а также случайные вариации для каждого испытуемого в зависимости от содержания контекста и модальности экспрессии. Далее при помощи линейных контрастов для каждой экспрессии, времени предъявления и содержания контекста проводились сравнения частот верных ответов при различной временнóй структуре стимульной ситуации (наличие либо отсутствие «паузы» — ДМИ после прямой маски). Аналогично сравнивались частоты верных ответов в сериях с одной и той же временной организацией стимульной ситуации, но с различным содержанием контекста (спокойное лицо либо маскировка рандомизированным паттерном). Вводилась поправка Беньямини — Хохберга на множественные сравнения.

Оценки эмоциональных экспрессий

Точность распознавания экспрессий лица. По результатам анализа значимыми оказались факторы: содержание контекста (К), время экспозиции (В) и модальность экспрессии (Э), а также взаимодействия К × В; К × Э; С × Э; В × Э; К × С × В; К × С × Э; С × В × Э; К × В × Э; К × С × В × Э (р<0,05). Фактор временнóй структуры стимульной ситуации (С) сам по себе не влиял на точность распознавания. Полученная модель объясняет 46 % дисперсии (для модели, включающей только фиксированные факторы: R2m = 0,34; для полной модели с фиксированными и случайными факторами: R2c = 0,46). Учет вариативности оценок между испытуемыми существенно повышает точность регрессионной модели.

Средняя точность распознавания экспрессий в сериях 1 и 2 с наличием ДМИ (0,72) незначительно превышает среднюю точность ответов в сериях 3 и 4, в которых дополнительный межстимульный интервал отсутствует (0,69). В условиях прямой и обратной маскировки получены чуть более высокие доли верных ответов (в серии с ДМИ: 0,73/в серии без ДМИ: 0,71), чем при кажущемся движении (0,7/0,67). Сопоставление экспериментальных ситуаций с наличием либо отсутствием ДМИ при помощи линейных контрастов показало, что за исключением экспрессии радости, различия между сравниваемыми сериями незначимы, тогда как для ряда экспрессий — радости, спокойствия, удивления, отвращения и печали — условия маскировки могут приводить к изменению точности ответа по сравнению с экспозицией кажущегося движения. Средние значения точности распознавания экспрессий в различных экспериментальных условиях приведены в таблице 2.3. Результаты сравнения точности ответов при различной временной структуре экспозиции приведены в таблице 2.4, при различном содержании контекста — в таблице 2.5.

При стробоскопической экспозиции экспрессии в течение 100 либо 200 мс включение ДМИ значимо повышало точность распознавания «радости» (на 100 мс она составляла 0,95 при наличии паузы, 0,86 — при ее отсутствии; на 200 мс: 0,97/0,92, соответственно). Для остальных экспрессий включение короткой паузы после первого контекстного изображения не вело к значимым изменениям точности ответов (таблица 2.3). По отношению к большинству базовых эмоций, при достаточном объеме выборки и большом количестве проведенных экспериментальных проб, наши данные с высокой достоверностью позволяют принять нулевую гипотезу: оценки экспрессий лица стабильны и не меняются при изменении временнóй структуры экспозиции.

Таблица 2.3. Средние значения точности распознавания экспрессий в зависимости от условий эксперимента

Таблица 2.4. Влияние содержания контекста на точность распознавания экспрессии при различной временной структуре экспозиции

Примечание. Приведены значения линейных контрастов серия 3.1 > серии 3.3 и серия 3.2 > серии 3.4. Положительные значения z-оценок свидетельствуют о большей точности распознавания при наличии дополнительного межстимульного интервала, отрицательные — при его отсутствии. Уровни значимости (двусторонние) приведены с поправкой Беньямини — Хохберга: * — р<0,05; ** — р<0,01; *** — р<0,001. Жирным выделены значимые различия.

Таблица 2.5. Влияние ДМИ на точность распознавания экспрессий при различном содержании контекста

Примечание. Приведены значения линейных контрастов серия 3.1 > серии 3.2 и серия 3.3 > серии 3.4. Положительные значения z-оценок свидетельствуют о большей точности распознавания в условиях стробоскопического движения, отрицательные — в условиях маскировки. Обозначения те же, что в таблице 2.4.

По сравнению со стробоскопической экспозицией прямая и обратная маскировка экспрессий незначительно повышает точность оценок (таблица 2.6). Тенденция проявляется при восприятии эмоций радости (на 50 мс — как при наличии, так и при отсутствии ДМИ; на 100 и 200 мс — только при его отсутствии), удивления (на 200 мс без ДМИ), отвращения (при любом времени экспозиции с включением ДМИ, а при 100 и 200 мс — в его отсутствие) и печали (на 50 мс при наличии ДМИ). Для экспрессий страха и гнева значимых влияний контекста не выявлено. В случае спокойного лица точность оценок при стробоскопическом движении оказывается выше (на 50 и 100 мс с ДМИ и на 50 мс — без ДМИ), что связано с неизменностью экспозиции спокойного лица, которое демонстрировалось с небольшим сдвигом относительно контекстных изображений. В условиях кажущегося движения сдвиг воспринимался более отчетливо, чем в условиях маскировки. Аналогичный эффект наблюдался и в описанных ранее исследованиях (Барабанщиков, Королькова, Лободинская, 2014, 2015).

Факторы времени экспозиции и модальности экспрессии также оказывали влияние на точность оценок наблюдателей. Так, с увеличением продолжительности экспозиции от 50 до 100 и 200 мс частота верных ответов в сериях со стробоскопическим движением и маскировкой монотонно повышается (таблица 2.3; рисунок 2.6) независимо от наличия или отсутствия ДМИ. В серии 3.1 (кажущееся движение с ДМИ) при 50 мс средняя точность составляет 0,6; при 100 мс — 0,72; при 200 мс — 0,77. В серии 3.3 (кажущееся движение без ДМИ) при 50 мс средняя точность составляет 0,59; при 100 мс — 0,68; при 200 мс — 0,75. В серии 3.2 (маскировка с ДМИ) при 50 мс средняя точность составляет 0,65; при 100 мс — 0,76; при 200 мс — 0,79; а в серии 3.4 (маскировка без ДМИ) при 50 мс средняя точность составляет 0,6; при 100 мс — 0,75; при 200 мс — 0,79.

Эффективность распознавания эмоции зависит и от ее модальности: при любом времени экспозиции и любом контексте экспрессии радости (средняя точность оценки при наличии паузы составляет 0,94, без паузы — 0,89), спокойствия (0,91/0,89) и удивления (0,9/0,85) распознаются наиболее точно. Эффективность восприятия низкоаттрактивных эмоций — печали (0,75/0,73), отвращения (0,57/0,58), страха (0,49/0,45) и гнева (0,45/0,45) — существенно ниже (таблица 2.4). Общие закономерности, выявленные для времени экспозиции, временной структуры и содержания контекста, сохраняются для каждой из экспрессий.

Рис. 2.6. Точность распознавания экспрессий при различных условиях экспозиции

Инвариантность восприятия экспрессий

Роль временнóй организации материала. Основной результат выполненного исследования состоит в том, что наличие или отсутствие паузы в 20 мс, разделяющей первое контекстное и тестовое изображения базовой эмоции (ДМИ), само по себе ни в условиях стробоскопического движения, ни в условиях зрительной маскировки практически не влияет на восприятие экспрессий. Наибольший вклад в точность распознавания базовых эмоций вносят их модальность, длительность экспозиции и взаимодействия модальности с содержанием контекста. Слабое влияние ДМИ на эффективность восприятия опосредовано его взаимодействием с другими контролируемыми переменными: модальностью эмоции, контекстом и длительностью тестовых изображений.

Конец ознакомительного фрагмента.

Оглавление

* * *

Приведённый ознакомительный фрагмент книги Когнитивные механизмы невербальной коммуникации предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Смотрите также

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я