Визуальная салиентность: почему нейросети пока несовершенны

Термин «салиентность» звучит странно и непонятно. Однако он не просто расширяет наш дизайн-лексикон, но и объясняет работу искусственного интеллекта, его плюсов и минусов. А использование салиентности в работе позволит грамотно экономить на дизайн-исследованиях и несколькими штрихами радикально менять проект. Так что же это такое?


Обратимся к «Википедии». Салиентность (англ. salience, saliency, от salient – «выделяющийся, важный, заметный») – термин, близкий по смыслу русским словам «значимость», «важность», «заметность». Если говорить еще проще, салиентность – свойство объекта быть более заметным, нежели чем окружающие его объекты.

Однако технологии дошли до того, что видеть теперь могут не только люди, но еще и компьютеры. Наверняка вы сталкивались с выражением «компьютерное зрение». Так вот, салиентность это – его основа. Все модные нынешние нейросети (Midjourney и прочие) используют во многом именно эту технологию.

В литературе о компьютерном зрении говорится, что салиентность – это свойство объектов – отдельных пикселей, частей изображения – быть более заметными на статичной картинке или на видеокадре, чем окружающие его на этом изображении объекты. «Ад перфекциониста» лучший тому пример (когда один объект немного отличается от остальных).

Визуальная салиентность: почему нейросети пока несовершенны
Фото предоставлено автором

Именно благодаря визуальной салиентности получили свое развитие беспилотные автомобили, системы распознавания лиц и номеров машин. Салиентность лежит в основе программ по работе с биометрическими данными о человеке, которые стали использоваться повсеместно для доступа к защищенной информации. В настоящий момент в России РФИ Минприроды ведется даже оцифровка животного мира и окружающей среды! И это ради сохранения и воспроизведения природного и биологического богатства нашей страны.

Маркетинговые программы на основе салиентности: плюсы и минусы

Почему же салиентность важна для дизайнера? Дело в том, что на рынке появились программы, которые имитируют человеческое визуальное внимание и соответственно принятие зрителем решений, например «Нейровижн», Fastuna AI.

С помощью подобных программ дизайнер может очень оперативно и недорого протестировать выполненную работу на предмет, по-простому говоря, качества дизайна. А чем определяется «качество» дизайна? Возможностью продавать. Программный способ практически полностью исключает использование дорогих в проведении фокус-групп для исследования визуальной продукции.

Однако есть нюанс. На крупных и ответственных рекламных кампаниях все же проводят «живое тестирование». Почему? Программы порой некорректно могут распознавать смыслы объекта, но живой человек делает это на автоматическом уровне и тратит больше времени на просмотр изображения. Чаще всего компьютерное зрение ошибается при оценке рисунков. Человеку достаточно несколько линий для понимания того, что изображено, но компьютер в настоящий момент не обладает столь эффективным считыванием визуальных «намеков», так как старается выделить самое главное, т.е. основывается на салиентности.

Визуальная салиентность: почему нейросети пока несовершенны
jov.arvojournals.org

Посмотрите на три варианта картинки. Для человеческого взгляда на всех изображениях находятся одни и те же объекты, для компьютерного зрения это, чаще всего, объекты разных категорий.

Визуальная салиентность: почему нейросети пока несовершенны
Фото предоставлено автором

Вот еще пример того, как компьютер оценивает области, которые наиболее важны на изображении.

Салиентность и бизнес

Как используется знание о салиентности для достижения финансовых показателей? Для понимания достаточно вспомнить пример из кино и музыкальной индустрии. Большинство успешных актеров и актрис можно описать следующим образом: человек, похожий на своих зрителей, при этом обладающий запоминающимся нюансом. Яркий пример этому – Мерлин Монро. Блондинка, похожая на тысячи других блондинок, но при этом отличающаяся запоминающейся родинкой. Или вот пример из музыкальной индустрии: чтобы выделиться среди тысяч других исполнителей, артисты используют вычурный макияж (KISS, Motley Crew и пр.), рисуют татуировки на лице (6ix9ine), облачаются в неистовые вызывающие наряды (Элтон Джон). Все это призвано привлечь визуальное внимание. Добиться визуальной салиентности и концентрации на объекте.

Грамотный режиссер сцены и постановщик танцевальных номеров всегда просит солиста надеть что-то отличающее его от остальных танцоров для обозначения доминанты.

Правим дизайн

Полезное упражнение для практикующих дизайнеров. Возьмите свой старый макет и измените в нем всего лишь одну характеристику для второстепенного объекта (форму, цвет или размер). Отследите, насколько сильно поменялся «баланс сил» в макете и какой объект теперь забирает на себя львиную долю внимания. Попросите своих знакомых взглянуть на макет и при возможности отправьте на оценку искусственному интеллекту. Думаю, вы увидите сильное смещение зоны внимания.

Дмитрий Щербаков

Ст. преподаватель Кафедры промышленного дизайна РГУ им. Косыгина, член Союза дизайнеров России. Основатель дизайн-студии полного цикла «Щербаков-студио» и фотоагентства «Фотодело».

Комментариев пока нет

оставьте ответ

Ваш электронный адрес не будет опубликован.

Онлайн о моде России

© 2016-2022

Эл № ФC77-71034 от 13.09.2017

По всем вопросам сотрудничества:
[email protected]
+7(926)836-09-76