Таксономия, метаданные и поиск

О трехстороннем подходе к управлению информацией для любого системного архитектора предприятия:

  1. Разработайте таксономию.
  2. Примените таксономию к своему контенту.
  3. Используйте таксономию, чтобы просматривать контент по-разному
Таксономия, метаданные и поиск

Таксономия

Таксономия — одно из тех расплывчатых слов, значение которых кажется немного туманным. Таксономия — это не навигация, хотя она и влияет на навигацию. Под таксономией мы подразумеваем «систему организации понятий и категоризации контента». 

Таксономия — это ваши метаданные, организованные в виде древовидной структуры, с категориями верхнего уровня, которые разветвляются, чтобы выявить подкатегории и термины на разных уровнях глубины. 

Таксономия выражает иерархические отношения (родительский/дочерний).

Другими словами, таксономия — это то, как вы организуете и классифицируете все свои информационные объекты. Это иерархическое представление одного термина с другим, выраженное в родственных, дочерних, внучатых, двоюродных и т. д. отношениях.

Метаданные

Придумать метаданные (информация об информации) для описания вашего предмета — ключевой первый шаг. Степень детализации метаданных зависит от ваших потребностей. Например, у Газпрома может быть много подкатегорий для слова «газ», а у Сбербанка может и не быть.

Некоторые стандартные подходы определяют общие атрибуты метаданных, такие как заголовок, описание, дата создания и т. д. Вы можете начать с использования таких стандартов, чтобы потом выйти за их рамки и разработать свою собственную модель метаданных, которая соответствует вашим потребностям.

Информационная архитектура и семантическая архитектура

При создании метаданных помните о разнице между «информационной архитектурой» и «семантической архитектурой». В информационной архитектуре «одна концепция может иметь разные выражения». В семантической архитектуре «одно выражение может иметь разные концепции». 

Например, Техническое задание и ТЗ являются разными выражениями одной и той же концепции. Но у слова «набор» могут быть разные понятия, например место, группа вещей, теннисный матч и так далее.

Язык «скользкий», и это объясняет причину, по которой люди изо всех сил пытаются найти что-то когда вводят ключевые слова в поля поиска. Обычно наши запросы такие краткие и общие; они не отражают уровень детализации и точности, которые действительно нужны, чтобы быстро найти необходимое. Именно эта многозначность языка лежит в основе того, почему люди не могут найти то, что ищут.

Хотя метаданные — это список ключевых слов, описывающих ваш контент, таксономия — это иерархическая организация этих метаданных. Вы можете критиковать таксономию, оценивая, выражают ли отношения родитель-потомок четкую логику. Подходят ли дети логически под родителя? Есть ли избыточность, полииерархия (одинаковые дети от разных родителей)? Являются ли термины параллельными, когда они должны быть параллельными, подчиненными или ортогональными?

Попробуйте с кем-нибудь из своей компании такое упражнение: организовать каталог товаров магазина типа Озон или Леруа-Мерлен (например коврики, ручные инструменты и сантехника) по разным группам. Вы увидите, что скорее всего группировки разных людей будет определенно отличаться друг от друга, если у вас не было четкого метода группировки. И поэтому, несмотря на все попытки, структура каждого каталога (списка-группировки) была уникальной.

Хотя нет четкого способа сгруппировать большое количество элементов, вы можете использовать метаданные для поиска связанных элементов. Вы можете установить эквивалентные термины в своей иерархии, а затем настроить результаты поиска для отображения эквивалентных элементов на том же уровне. Это требует больше усилий для таксономии. Хорошо структурированная таксономия приведет к лучшему поиску, потому что вы сможете лучше приблизиться к тому, что ищет пользователь. На основе вашей таксономии вы можете настроить связанные результаты.

Метаданные — это действительно основа для чего бы то ни было. Без применения этих метаданных к вашей информации вы не сможете использовать ее по-разному. Мы считаем, что все информационные работники должны быть специалистами по метаданным и таксономии. 

Если информация действительно является корпоративным активом, использование ее различными способами с помощью метаданных должно стать ключевой стратегией. Это может привести вашу компанию к серьезному конкурентному преимуществу.

Наслоение темпа

При разработке таксономии помните о концепции, называемой «наслоение темпа». Наслоение темпа — это идея о том, что изменения происходят с разной скоростью для разных групп внутри компании. Группа продаж или снабжения может меняться гораздо быстрее, чем другие группы, например бухгалтерия или ИТ. «Тактовая частота» команды склада может быть ниже, чем тактовая частота отдела маркетинга. И поскольку эти тактовые частоты изменяются с разной скоростью, одна группа расстраивается из-за того, что другая работает слишком медленно.

Применительно к таксономии это означает, что вам, возможно, придется постоянно развиваться. Ваша таксономия должна быть гибкой и адаптируемой к изменяющимся бизнес-средам. Некоторые компании пересматривают свою таксономию несколько раз в год, а затем выпускают обновления.

Информационный метаболизм

Термин «информационный метаболизм» можно использовать для обозначения скорости, с которой информация проходит через организацию. Это сопровождает идею наслоения темпа. Если в вашей организации высокий уровень информационного метаболизма, разработанная вами таксономия может быстро устареть и потребовать более гибкой и динамичной адаптации.

Одним из решений для повышения гибкости и адаптивности вашей таксономии может стать создание таксономии «снизу-вверх» с подключением к процессу народного творчества.

Проявление

Фольксономия — это система тегов, которая позволяет вам идти в ногу с динамичной, быстро меняющейся средой, где термины постоянно меняются. Фольксономия — это система метаданных, которая позволяет пользователям добавлять к контенту свои собственные теги, а не извлекать их из набора структурированных тегов, установленных и спущенных сверху в фиксированной таксономии. Одна из проблем с фолксономиями заключается в том, что вы получаете множество терминов, выражающих одно и то же понятие, но написанных по-разному.

Чтобы решить эту проблему, пользователи могут добавлять свои собственные термины, но по мере их добавления им предлагается выбрать похожие термины, уже имеющиеся в базе данных. Это обеспечивает лучшее из обоих миров — позволяя пользователям расширять существующие метаданные с помощью новых тегов, а также побуждая пользователей выбирать из уже установленных тегов.

Несмотря на хаотичность фольксономий, иногда проявляется организующий принцип. Понятие «возникновение» — это идея порядка из хаоса. Без какой-либо координации между сторонами система внезапно превращается в собственный порядок, основанный на коллективном стремлении независимо действующих умов.

Централизация метаданных

Вы можете организовать все свои метаданные в различных инструментах. Одна из проблем заключается в том, что в вашей организации может быть много различных систем (корпоративная интрасеть, общедоступный веб-сайт, база данных продуктов и т. д.), и все они используют терминологию, хранящуюся в отдельных инструментах. В идеале вы хотите получать данные непосредственно из своего инструмента метаданных, а не иметь отдельные разрозненные экземпляры метаданных.

Представьте эту проблему как набор пультов дистанционного управления на журнальном столике. Обычно у людей есть несколько пультов дистанционного управления — один для переключения каналов, другой для изменения громкости, третий для работы с видеомагнитофоном и т. д. Мечта состоит в том, чтобы иметь один универсальный пульт, который бы управлял ими всеми, и хотя многие пульты утверждают, что обладают универсальными возможностями, на самом деле это не так. 

Универсальный пульт станет единственным инструментом для управления таксономиями в вашей организации.

Онтология

Слово «онтология» обычно пугает людей и кажется очень философским, но на самом деле онтология — это просто набор таксономий. Например, солнечная система относится к галактике так же, как таксономия к онтологии. Галактика включает в себя несколько солнечных систем, так же как онтология может включать в себя несколько таксономий.

Модели контента

После того, как вы установили свои метаданные, вы начинаете разрабатывать модели контента. Модель контента — это просто «смешанные вместе метаданные». Например, одна модель контента может быть просто заголовком и описанием. 

Модель контента может выражать различные правила использования метаданных.  Установленная модель контента позволяет создавать различные типы контента, что очень сильно повышает гибкость в создании, комбинировании, дистрибуции и актуализации контента.

Все эти типы контента объединяются в системе управления контентом (CMS), которая может динамически отображать выходные данные на основе различного контента. CMS извлекает информацию на основе метаданных, следуя правилам или шаблону типа модели контента.

Динамический дисплей

Представьте веб-сайт с различными мобильными телефонами. CMS может динамически отображать страницу, просто отображая данные, соответствующие определенным атрибутам метаданных. Тип контента определяет, где и как должны отображаться данные, но вся система представляет собой динамический рендеринг. У вас нет человека, который вручную кодирует HTML за кулисами, чтобы определить порядок и отображение. Вместо этого CMS делает это через метаданные, — это настоящая «контентная хореография».

Если вы можете собирать информацию о своих пользователях, вы можете запрограммировать CMS для отображения информации на различных дисплеях (информационных витринах или витринах данных) в зависимости от профиля пользователя. Это один из способов динамического изменения информации в соответствии с потребностями и ролью пользователя, тем самым увеличивая возможность поиска контента. Ваш контент больше не статичен, а скорее динамичен и меняется.

Предклассифиция и постклассификация

Эти несколько терминов помогут разобраться с настройкой динамического контента. Предварительно классифицированная система устанавливает фиксированные порталы, в которые пользователь может войти, чтобы просмотреть информацию, отображаемую различными способами. 

Постклассифицированная система создает порталы «на лету» в виде списка аспектов, к которым пользователь может перейти после того, как он или она введет поисковый запрос.

Весь массив метаданных информации компании, смешанных с CMS, может привести к гораздо более гибкой организации информации, где нет единой фиксированной организации, а есть множество разных организаций, каждая из которых основана на потребностях пользователей в различной информации.

Оглавления и таксономии

Вы можете подумать, что никогда ранее не создавали таксономий. Но скорее всего вы это уже делали, когда организовывали навигацию по оглавлению в файле справки, отчета или доклада. Это было упражнение в таксономии! 

Когда мы решаем, куда поместить новый файл или заметку, мы задумываемся, что представляют собой папки верхнего уровня, каждая вложенная папка и вложенная вложенная папка, и какие задачи относятся к одной и той же теме, и какие темы связаны. Не является ли это отражением иерархии? Которые существовали бы в отдельной таксономии? Видимо, в какой-то степени да. Несмотря на то, что таксономия — это не навигация, структурирование вашей навигации — это упражнение, которое заставляет вас думать о таксономии.

Хотя многие пользователи могут не использовать оглавление для поиска информации, ваше оглавление сообщает пользователям ценную информацию. Он передает таксономию, которая помогает пользователям понять иерархию и взаимосвязь одного понятия и термина с другим. Этот структурный обзор вашего контента может быть важен. 

Люди предпочитают информацию, которая включает в себя последовательность. Они любят просматривать. Навигация обеспечивает повествование, за которым люди следят в Интернете. Он рассказывает историю — историю вашего сайта. В этом отношении в веб-навигации есть что-то знакомое и успокаивающее. Широко распространенное, казалось бы, естественное использование навигации для доступа к контенту в Интернете отражает ее силу как средства повествования.

— Джеймс Калбах, Проектирование веб-навигации

Другими словами, ваше оглавление, которое выражает иерархию, порядок и взаимосвязи внутри вашей информации, помогает читателю с первого взгляда понять всю информацию. Даже если пользователь не перемещается по этой иногда лабиринтной структуре оглавления,  отсутствие  оглавления вообще вызывает у пользователей беспокойство. Если вы замените это оглавление другим видом организации, не выражающим семантических отношений информационных компонентов, ваши пользователи могут почувствовать себя потерянными.

Тем не менее, хотя организация оглавления или TOC (Table of Contents) и построение таксономии кажутся похожими, не будет ли намного проще построить TOC, если у вас уже есть таксономия, на которую можно ссылаться? Таксономия уже должна обеспечить серьезную критическую мысль, что делает оглавление чем-то вроде производного упражнения.

Было бы интересно узнать о вашем подходе к созданию и использованию таксономии при написании справочного материала.

Вы дочитали статью до конца, видимо вас так же интересует эта тема. Пожалуйста, поставьте оценку пользы для вас этого материала.
Если у вас есть свои идеи по теме, напишите в комментариях — мы с радостью возьмем на вооружение и улучшим этот материал с пользой для других читателей.

Оцените автора
Онтограф
Добавить комментарий