Использование ИИ для решения проблемы дрейфа таксономии стало слишком распространенным запросом, особенно когда глоссарии и списки терминов (тегов, категорий) не совпадают с описываемым ими контентом. В статье проясним важное различие между созданием таксономий и их применением с учетом нейросетей.
Перевод и адаптация статьи эксперта по информационной архитектуре Хорхе Аранго
Таксономии для организации веб-контента
Сначала немного контекста. Речь пойдёт конкретно о таксономиях для организации веб-контента. Такие CMS, как Drupal и WordPress, позволяют авторам помечать элементы контента, помогая пользователям находить информацию позже. Но и контент, и таксономии развиваются со временем, и последовательная пометка тегами — это сложная задача, особенно для небольших команд с ограниченными ресурсами.
Я предположил, что ИИ может помочь в решении этой проблемы. Но что именно должен делать ИИ? Вот тут-то и возникает непонимание.
Подход, с которым я работаю, использует ИИ для маркировки контента терминами из предопределенной таксономии. Это отличается от того, что ИИ генерирует новые термины таксономии. Проще говоря: я использую ИИ для применения таксономий, а не для их создания. Это разные задачи.
ИИ лучше людей замечают закономерности в тексте в масштабе, что делает их полезными для последовательного применения терминов.
Но люди все еще лучше владеют навыками, необходимыми для определения таксономий — решая, какие термины следует включить и как они соотносятся друг с другом.
Таксономия как модель данных о домене
Таксономия — это не просто набор слов и фраз; это также модель, которая отражает, как пользователи понимают домен, согласуется со стратегическими целями организации и вписывается в более широкие культурные нормы.
Определение этой модели требует, среди прочего, суждения, контекстной осведомленности и понимания стратегических приоритетов и организационной политики. Выполнение этих задач пока выходит за рамки понимания современных систем ИИ.
Это не значит, что ИИ не может помочь — конечно, может. LLM преуспевают в обработке больших объемов контента, поиске закономерностей, обобщении и составлении планов. В этом качестве они могут оказать неоценимую помощь таксономистам и информационным архитекторам. Но есть и другой способ, которым ИИ может помочь — более глубокий и более захватывающий.
Эксплуатация таксономии
Таксономии не статичны и не определены абстрактно. Пробелы становятся очевидными только во время применения.
- Вы можете понять, что упускаете важные термины, когда начинаете помечать контент в масштабе.
- Или вы можете обнаружить, что часть модели не совсем верна и требует корректировки.
Проблема в том, что разметка большого объема контента занимает время, поэтому эффекты этих настроек видны не сразу.
Другие творческие дисциплины работают не так. Когда художники наносят масло на холст, они видят, как цвета распределяются и смешиваются в реальном времени. Они изменяют смешивание и мазки, чтобы добиться определенных эффектов. Они могут это делать, потому что получают немедленную обратную связь о последствиях своих действий.
Таксономистам не хватало такого уровня обратной связи в масштабе — до сих пор. ИИ позволяет гораздо быстрее увидеть, как различия применяются к большим наборам контента. Он помогает выявлять пробелы, несоответствия и возможности для уточнения в другом масштабе и с другой скоростью, указывая на новый способ работы.
Итак, хотя определение и применение таксономий — это разные задачи, ИИ, скорее всего, сотрет грань между ними. И это может быть хорошо — пока люди все еще орудуют кистями и палитрами.