Семантическая сеть — это видение расширения существующей Всемирной паутины, которое предоставляет программам машинно-интерпретируемые метаданные опубликованной информации и данных.
Другими словами, мы добавляем дополнительные описания к существующему контенту и данным в Интернете в таком формате, что они понятны не только нам, но и алгоритмам.

В результате компьютеры способны делать осмысленные интерпретации подобно тому, как мы с вами обрабатываем информацию для достижения своих целей.
Конечная цель семантической сети, как ее видит ее основатель Тим Бернерс-Ли, состоит в том, чтобы позволить компьютерам лучше манипулировать информацией от нашего имени. В контексте семантической паутины слово «семантический» указывает на возможность машинной обработки или на то, что машина может делать с данными. Принимая во внимание, что «сеть» передает идею навигации по пространству взаимосвязанных объектов с сопоставлениями от URI к ресурсам.
Развивающееся видение семантической сети
То, что стоит за первоначальным видением Semantic Web, было связано с тремя вещами:
- автоматизацией поиска информации,
- Интернетом вещей и
- персональными помощниками.
Однако со временем эта концепция превратилась в два важных типа данных, которые, вместе взятые, реализуют ее видение сегодня. Это связанные открытые данные и семантические метаданные.
Связанные открытые данные: путь через лабиринт данных
Чтобы семантическая паутина функционировала, компьютеры должны иметь доступ к структурированным наборам информации и наборам правил вывода, которые они могут использовать для проведения автоматизированных рассуждений.
Семантическая паутина Новая форма веб-контента, значимая для компьютеров, откроет революцию новых возможностей.
Связанные открытые данные (LOD) — это структурированные данные, смоделированные в виде графа и опубликованные таким образом, чтобы обеспечить взаимосвязь между серверами
— Тим Бернерс-Ли (2006 г.)
4 правила связанных данных
- Используйте URI в качестве имен для объектов;
- Используйте HTTP URI, чтобы люди могли искать эти имена.
- Когда кто-то ищет URI, предоставьте полезную информацию, используя стандарты (RDF*, SPARQL).
- Включите ссылки на другие URI. так что они могут обнаружить больше объектов.
LOD позволяет людям и машинам получать доступ к данным на разных серверах и более легко интерпретировать их семантику. В результате Semantic Web переходит от пространства, состоящего из связанных документов, к пространству, состоящему из связанной информации. Что, в свою очередь, дает возможность создать сильно взаимосвязанную сеть машинно-обрабатываемых значений.
Связанные открытые данные (LOD) включают
- Фактические данные о конкретных объектах и концепциях (например, Москва, 2-я мировая война или Достоевский);
- Онтологии — семантические схемы, определяющие:
- Классы объектов (например, Люди, Организации, Места и Документы);
- Типы отношений (например, родитель или производитель);
- Атрибуты (например, ДоБ человека или население географического региона ).
Сегодня существуют тысячи наборов данных, опубликованных как LOD в различных секторах, таких как энциклопедии, географические данные, правительственные данные, научные базы данных и статьи, развлечения, путешествия и т. д. Только в науках о жизни более 100 научных баз данных опубликованы как LOD.
Из-за их связи эти наборы данных образуют гигантскую сеть данных или граф знаний, который связывает огромное количество описаний объектов и концепций общей важности. Например, есть несколько описаний города Москва (например, одно взято из Википедии, другое — из туристического справочника и т. д.).
Семантические метаданные: тегирование существующей сети
Семантические метаданные представляют собой семантические теги, которые добавляются к обычным веб-страницам для лучшего описания их значения. Например, страница города Москва в Википедии может быть семантически аннотирована ссылками на несколько связанных с городом понятий и объектов, например, Кремль, Большой театр, МГУ, Москва-река, телефонный код, день города и т.д. .
Такие метаданные значительно упрощают поиск веб-страниц на основе семантических критериев. Это устраняет любую потенциальную двусмысленность и гарантирует, что при поиске Парижа (столицы Франции) мы не получим страницы о Пэрис Хилтон.
Если мы хотим иметь четко определенную связь между темой веб-страницы и соответствующей страницей или документом, лучше всего использовать одну из схем метаданных структурированных данных. В настоящее время наиболее популярной такой схемой является Schema.org , которую создали Google, Yahoo, Microsoft и Яндекс. Согласно недавнему исследованию Университета Мангейма, в 2015 году 30% веб-страниц содержали семантические метаданные.
Взглянем под капот
Semantic Web предоставляет общую структуру, которая позволяет совместно и повторно (многократно) использовать данные между приложениями, предприятиями и сообществами. Это совместная работа под руководством W3C с участием большого числа исследователей и промышленных партнеров.
Фундаментальным для принятия видения Semantic Web была разработка набора стандартов, установленных международным органом по стандартизации — Консорциумом World Wide Web (W3C) :
- Resource Description Framework (RDF) — простой язык описания объектов и их отношений в графе;
- Протокол SPARQL и язык запросов RDF (SPARQL) — протокол и язык запросов для данных RDF;
- Унифицированный идентификатор ресурса (URI) — строка символов, предназначенная для однозначной идентификации ресурсов и расширяемости через схему URI.
Доступность таких стандартов способствовала развитию экосистемы различных инструментов от разных поставщиков, которые работают с данными RDF (известными как хранилища триплетов), редакторов онтологий, инструментов тегов, которые используют анализ текста для автоматического создания семантических метаданных, семантические поисковые системы и многое другое.
Графики знаний: следующая реинкарнация семантической паутины
Хотя графы знаний появились позже, они быстро стали мощным стимулом для принятия стандартов Semantic Web и всех реализующих их семантических технологий. Графы знаний привносят парадигму семантической паутины на предприятия, вводя семантические метаданные, чтобы вывести управление данными и управление контентом на новый уровень эффективности и устраняя разрозненность, чтобы обеспечить синергию с различными формами управления знаниями.
Графы корпоративных знаний используют онтологии для создания явных различных концептуальных моделей (схем, таксономий, словарей и т. д.), используемых в различных системах предприятия. Используя сленг управления корпоративными данными, графы знаний представляют собой семантические справочные данные премиум-класса: набор взаимосвязанных описаний сущностей — объектов, событий или концепций.
Таким образом, графы знаний помогают организациям усовершенствовать конфиденциальную информацию, используя глобальные знания в качестве контекста для интерпретации и источника для обогащения.
Семантическая сеть — это сеть связей между различными формами данных, позволяющая машине делать то, что она не могла делать напрямую.
Благодаря своей способности повышать генерацию, интеграцию и понимание данных концепция семантической паутины быстро внедрялись в управление данными и информацией. Сегодня многие организации используют связанные данные в качестве механизма внутренней публикации основных данных.
Стандарты Semantic Web широко используются при разработке графов знаний в различных областях: правительство и гос.услуги, СМИ, бизнес, наука и т.п.