Таксономия — это структурированный контролируемый словарь, который представляет собой список терминов (или понятий), обычно используемых для маркировки контента, чтобы облегчить его поиск. Структура может быть иерархической, многогранной или комбинированной. Обычно для широкой аудитории таксономию определяют как иерархическую систему классификации.
Таксономии также помогают создать оптимизированную карту или информационную архитектуру, позволяет пользователям интуитивно перемещаться по контенту и находить нужные документы.
У таксономии есть две основные характеристики: понятия и структура. Кто-то предпочитает фокусироваться на контролируемом словаре и аспектах наименования понятий и вещей, тогда как другие сосредоточены на аспекте иерархической классификации таксономий.
Но важно понимать при этом, что таксономия и система классификации не обязательно совпадают.
Суть в том, что система классификации является более общей и жесткой и предназначена для широкого использования, в то время как таксономия, настраивается более тонко для конкретного варианта использования и контекста компании, она гибкая и может легко меняться. Подробнее о разнице между таксономиями и системами классификации можно посмотреть в отдельной статье.
Таксономия понятий для поиска информации очень похожа на научную таксономию. Если мы считаем, что таксономии — это системы для именования и иерархической организации понятий, то таксономию для поиска информации, состоящую из терминов для маркировки и извлечения содержимого, можно рассматривать как таксономию контролируемого словаря, в отличие от таксономий вещей, таких как организмы. Диаграмма иллюстрирует возможный способ рассмотрения информационно-поисковых таксономий.
Между тем, существует также несколько хорошо известных систем классификации, называемых «таксономиями», таких как линнеевская таксономия организмов и таксономия образовательных целей Блума. Они кажутся совершенно отличными от информационно-поискового типа таксономии. Иерархические уровни имеют названия (Царство, Тип, Класс и т. д.). Отношение иерархических уровней друг к другу не соответствует стандартам тезауруса: общий-специфический, общий-экземпляр или часть-целое. Скорее, это отношение члена класса или подкласса, которое существует в онтологиях, но не в информационно-поисковых таксономиях.
Несколько видов систем организации знаний определяются их опубликованными стандартами. Для тезаурусов существуют ANSI/NISO Z39.19 и ISO 25964 . Для терминологии существует ISO/TC 37/SC 3 и другие соответствующие стандарты. Для онтологий есть OWL (язык веб-онтологий) от W3C . Однако не существует стандарта конкретно для «таксономий» или даже для «систем классификации», поэтому их по-прежнему трудно определить. Обозначения «система классификации», «схема классификации» и «таксономия» продолжают использоваться как синонимы.