Видно невооруженным взглядом, что генеративный искусственный интеллект (ИИ) меняет опыт пользователя (UX). Нас в Онтограф особенно интересует его влияние на информационную архитектуру, то есть на то, как структурируется контент, чтобы люди могли находить и понимать то, что они ищут. Некоторые мысли Хорхе Аранго о том, как ИИ может трансформировать информационную архитектуру в том виде, в котором мы ее воспринимаем в пользовательских интерфейсах.
Хорхе Аранго
Информационный архитектор, консультант, автор и педагог. Последние 25 лет он использовал архитектурное мышление, чтобы внести ясность и согласованность в цифровые продукты и услуги. Хорхе также преподает в программе интерактивного дизайна для выпускников Калифорнийского колледжа искусств.
Влияние ИИ на пользователей через информационную архитектуру
Мы можем подойти к этому вопросу с двух сторон.
- Первый — это влияние ИИ на процесс разработки информационной архитектуры, т. е. ИИ в качестве помощника дизайнера, создающего ИА. Здесь есть что исследовать, и о своих экспериментах в этом направлении я уже писал ранее.
- В этой статье рассмотрим другое направление: влияние ИИ на ИА на том уровне, на котором его ощущают пользователи. То есть системы навигации, маркировки, поиска и метаданных приложения или веб-сайта (также называемые «невидимыми»).
Конечно, оба направления в конечном итоге влияют на UX системы. Разница в том, что
- в первом случае люди используют ИИ для разработки ИА, которые впоследствии остаются относительно стабильными;
- во втором случае системные структуры и интерфейсы динамически контролируются искусственным интеллектом, который меняет их на лету, чтобы обеспечить индивидуальный подход к каждому пользователю.
Подумайте о разнице между генеративным инструментом искусственного интеллекта свободной формы, таким как ChatGPT, и старой системой голосового меню (IVR) с ее жесткими нисходящими деревьями выбора (например, «Для продаж нажмите 1; для поддержки нажмите 2…»). Оба являются интерфейсами к области знаний, и оба могут предоставить вам необходимую информацию, но первый гораздо более гибок — даже если эта гибкость достигается за счет более четких границ области данных.
При рассмотрении областей пользовательского интерфейса, на которые больше всего влияет информационная архитектура, на ум приходят 4 элемента:
- навигация,
- поиск,
- разметка,
- структуры метаданных системы, которые часто «невидимы» для пользователя, но существенно влияют на его работу.
Давайте рассмотрим возможное влияние ИИ на все четыре элемента.
Влияние ИИ на поиск
Навигация и поиск служат схожим целям: оба позволяют пользователям «перемещаться» в разные части вашего контента. Панели навигации позволяют осуществлять просмотр, а окна поиска позволяют пользователям искать то, что они ожидают там найти. Тем не менее, механизмы и ментальные модели поиска и просмотра достаточно различны, поэтому их стоит рассматривать отдельно. Начнем с поиска, поскольку именно здесь ИИ может оказать наиболее очевидное влияние.
ИИ обещает значительные возможности для улучшения поиска.
- Традиционные поисковые системы работают путем сопоставления вводимых пользователем запросов с ключевыми словами, хранящимися в базах данных индексированного контента.
- Затем результаты ранжируются по релевантности и отображаются пользователям на экранах результатов, которые они могут (часто) сортировать и фильтровать.
ИИ может улучшить каждый этап этого процесса: от анализа пользовательских запросов до поиска соответствующего контента и представления соответствующих результатов.
Выходя за рамки совершенствования существующих механизмов поиска, вы можете представить себе системы, реализующие петли обратной связи, управляемые искусственным интеллектом. То есть система настраивает индексы контента на основе условий поиска пользователей и моделей трафика сайта. Если по определенной фразе поступает много запросов и ей не сопоставлен хороший контент, система может предложить создать такой контент или создать его самостоятельно.
Но пользователям поиска не обязательно нужны результаты, указывающие на веб-страницы. Вместо этого они хотят ответов. Страницы результатов поиска, которые предлагают список ссылок на «страницы» в системе, будут восприниматься как старомодные (так уже сейчас начинают относится к поиску Google или Яндекса).
Конечно, бывают случаи, когда вам определенно нужен список результатов. Например, при поиске в магазине вам нужен список продуктов, а не синтезированный «ответ». (Хотя список 10 лучших продуктов, соответствующих произвольному критерию, в некоторых случаях может быть полезен.) Но во многих ситуациях более «нарративный» ответ может быть лучше, чем список результатов поиска. Ожидайте, что такие поисковые интерфейсы будут улучшаться и распространятся в ближайшие несколько лет.
Влияние ИИ на навигацию
Хотя я ясно вижу, как ИИ улучшит поиск (и это произойдет в ближайшее время), я менее уверен в способности ИИ эффективно преобразовывать панели навигации и другие «просматриваемые» элементы навигации пользовательского интерфейса. Хотя вы можете представить себе системы на основе искусственного интеллекта, которые отображают новые навигационные панели «на лету», мне сложно увидеть полезность таких подходов для большинства случаев использования.
Проблема здесь не в находимости, а в настройке контекста. Навигация — одно из назначений навигационных панелей. Но это не единственная их цель.
Вероятно, не менее важной является способность навигационных панелей устанавливать контекст и границы системы.
Например, рассмотрим панель навигации, которая включает в себя следующие варианты:
- Проверка
- Экономия
- Кредитные карты
- Кредитование
- Инвестирование
- Управление капиталом
Мне не нужно рассказывать вам, что это за сайт; простое присутствие этих фраз и слов рядом друг с другом — это все, что вам нужно. Установление чувства контекста является важной частью повышения удобства использования систем. Пользователи знают, чего ожидать от сайта банка. У них есть хорошие идеи о том, что они могут там найти и чем заняться.
Термины в глобальных навигационных панелях должны быть тщательно выбраны, чтобы обеспечить понятность и связность, с целью создания четкого представления о месте. (Конечно, вы также хотите уточнить, в каких частях сайта пользователи найдут то, что ищут.) Система, которая настраивает терминологию для каждого пользователя, может добиться персонализации за счет этого связного чувства контекста.
Стандартизация также является проблемой. Я слышал, как люди мечтают о пользовательских интерфейсах на основе искусственного интеллекта, которые адаптируются к потребностям и уровню компетентности своих пользователей.
Представьте себе устройство, пользовательский интерфейс которого полностью адаптирован под ваши особенности. Хотя он может удовлетворить ваши потребности, другому человеку будет сложно его использовать. И, конечно же, выбрав одноразовый пользовательский интерфейс, вы потеряете возможность учиться на документации или видео-уроках. Я ожидаю, что это также усложнит техническую поддержку, особенно при работе с начинающими пользователями. (Мне ненавистна перспектива помогать старшим родственникам настраивать и отлаживать их интерфейсы, управляемые искусственным интеллектом.)
Вы можете заметить, что я не хочу использовать искусственный интеллект для создания динамической навигации. Но я должен пояснить, что мои комментарии до сих пор относились к глобальным навигационным структурам, то есть к типу навигационных элементов, которые определяют, что такое система, как она работает и как ее понимают пользователи. Я ожидаю, что существуют действенные способы использования ИИ для создания локальных элементов навигации, которые пользователи ожидают персонализировать. Например, приложение может отображать разные параметры в зависимости от местоположения пользователя, времени суток, предыдущих взаимодействий и т. д. Давно существуют методы для выполнения подобных действий. Я ожидаю, что генеративный ИИ поможет сделать это лучше и быстрее.
Влияние ИИ на маркировку, таксономию и метаданные
Давайте теперь обратимся к другим областям, где информационная архитектура оказывает важное влияние: использованию языка для организации контента во всей системе.
Сюда входит маркировка элементов пользовательского интерфейса и таксономии для категоризации и организации информации.
Мы знаем, что генеративный ИИ может помочь в этой деятельности. Я писал о своих экспериментах по разметке постов в блогах и составлению стенограмм подкастов .
Но это случаи использования ИИ при проектировании информационной архитектуры — «ИИ как помощник ИА», наш первый вариант использования выше. Я говорю об этом здесь, потому что такая категоризация воспринималась бы по-другому, если бы она происходила «на лету», поэтому ее можно было бы осуществлять в реальном времени, т. е. если бы информация реорганизовалась почти в реальном времени во время взаимодействия с системой.
В каком-то смысле это уже происходит. Например, приложения для управления фотографиями, такие как Apple Photos и Google Photos, помечают ваши фотографии метаданными на основе того, что, по мнению их моделей, находится на изображении. Вот почему вы можете выполнять поиск в этих приложениях по таким словам, как «пляж», и получать соответствующие изображения. Опять же, это классификация информации ИИ, так же, как это делали люди в прошлом; просто это происходит быстрее и эффективнее.
Многие из пунктов, упомянутых в предыдущих разделах, применимы и здесь. Вам нужна определенная степень единообразия в языке системы, особенно если она предназначена для многопользовательской системы. Вы хотите создать относительно стабильный контекст, который четко определяет границы системы. В результате вы не хотите, чтобы эти вещи менялись слишком часто или индивидуально. Тем не менее, я ожидаю, что было бы полезно, чтобы ИИ-агент периодически настраивал язык и категории, чтобы оптимизировать находимость и понятность.
Форматы голосового и текстового чата
Сегодня наиболее распространенным пользовательским интерфейсом для взаимодействия с ИИ является поле ввода текста произвольной формы. Пользователь вводит подсказку и получает ответы от ИИ. Большие языковые модели (LLM) существуют уже несколько лет, но только осенью 2022 года, когда OpenAI внедрила в свой LLM пользовательский интерфейс на основе чата, они получили широкое распространение. В результате многие люди ожидают, что взаимодействие с ИИ будет происходить через чат.
Некоторые люди могут возразить, что традиционные конструкции пользовательского интерфейса, такие как панели навигации, менее актуальны сейчас, когда у нас есть «умные» интерфейсы чата: зачем отображать весь этот хлам пользовательского интерфейса, если вы можете просто сказать системе, что вы хотите?
Я категорически не согласен. Пользовательские интерфейсы на основе чата полезны в ситуациях, требующих диалогового взаимодействия, например телефонных разговоров, но они также неэффективны.
Существует множество взаимодействий, которые более эффективно обслуживаются более традиционными графическими интерфейсами. (Конечно, это справедливо для зрячих людей. Я ожидаю, что пользовательские интерфейсы на основе чата могут быть очень полезными для людей с нарушениями зрения.)
Пользовательские интерфейсы на основе чата также требуют высокого уровня владения языком. Пользователи должны знать, как спрашивать о чем-либо, используя слова. Хотя это, очевидно, является препятствием для людей, которые не умеют хорошо читать или писать (или вообще не умеют), это справедливо даже для устных интерфейсов. В некоторых сценариях такое «разговорное» взаимодействие может показаться естественным, но существует множество сценариев, в которых пользователи могут не знать, о чем спрашивать или как называются вещи.
Окно чата предоставляет возможности только для общего разговора, а не для взаимодействия с концепциями в конкретной области. Если рассматривать английский язык как API, он слишком открыт. Результатом являются те же контекстуальные проблемы, о которых я говорил выше, плюс серьезные проблемы с обнаружением. По этой причине я ожидаю, что взаимодействие в чате будет наиболее полезным в сценариях, в которых у пользователей есть четкая мысленная модель предметной области и где общение является нормой.
Выводы
Прочитав этот пост, вы можете прийти к выводу, что я пессимистично отношусь к использованию генеративного ИИ в информационной архитектуре. Это не так. Я очень воодушевлен возможностями. Но, признаюсь, мне больше интересен ИИ как инструмент, помогающий информационным архитекторам выполнять нашу работу более эффективно, чем как средство либо реструктурировать пользовательские интерфейсы на лету, либо вообще их устранять.
Подведем итоги. Из приведенных выше вариантов использования:
- я наиболее оптимистично настроен в отношении использования ИИ для улучшения поиска. Я ожидаю, что в ближайшем будущем поисковые системы станут радикально лучше. Это также взаимодействие, при котором пользователи ожидают ввода запросов в произвольной форме в текстовое поле.
- Я также заинтересован в использовании ИИ для оптимизации и улучшения таксономии и других метаданных практически в реальном времени.
- Меня меньше интересует использование ИИ для оперативной реструктуризации навигационных систем.
Мои эксперименты убедили меня, что генеративный ИИ может быть полезен в качестве инструментов проектирования и производства. Но я более консервативен, когда дело доходит до внедрения немодерируемого опыта, основанного на искусственном интеллекте.
Существуют этические и, возможно, юридические проблемы, связанные с обслуживанием структур пользовательского интерфейса, управляемых искусственным интеллектом.
- Во-первых, программы LLM могут давать непредсказуемые и ненадежные результаты, в том числе, возможно, отражая и закрепляя предубеждения или обслуживая чужую интеллектуальную собственность.
- Существуют также очевидные проблемы конфиденциальности при использовании личных данных в качестве входных данных для пользовательских интерфейсов, управляемых искусственным интеллектом.
Поэтому я чувствую себя более комфортно, используя ИИ для улучшения нас, людей, проектирующих информационные архитектуры, чем заставлять ИИ проектировать их напрямую. Признаюсь, эта позиция основана на предположениях, поскольку я не экспериментировал на собственном опыте с разработкой динамических пользовательских интерфейсов на основе искусственного интеллекта. Вероятно, это также отражает недостаток воображения с моей стороны. И, конечно, вы можете возразить, что у меня как у информационного архитектора возник конфликт интересов.
Но на данный момент меня больше волнуют возможности ИИ дополнить работу информационных архитекторов, а не полностью заменить их. Я убежден, что как только нынешний цикл ажиотажа утихнет, эти инструменты найдут свое место среди других, которые мы используем для создания отличных впечатлений для пользователей.
Адаптация и курирование: Онтограф
Интересно раскрыта тема, как информационный архитектор, я разделяю его опасения и надежды на ИИ.
Хорошо бы увидеть результаты такого взаимодействия ИИ и ИА.