Semantic Web

Семантическая сеть — это видение расширения существующей Всемирной паутины, которое предоставляет программам машинно-интерпретируемые метаданные опубликованной информации и данных.

Другими словами, мы добавляем дополнительные описания к существующему контенту и данным в Интернете в таком формате, что они понятны не только нам, но и алгоритмам.

Semantic Web

В результате компьютеры способны делать осмысленные интерпретации подобно тому, как мы с вами обрабатываем информацию для достижения своих целей.

Конечная цель семантической сети, как ее видит ее основатель Тим Бернерс-Ли, состоит в том, чтобы позволить компьютерам лучше манипулировать информацией от нашего имени. В контексте семантической паутины слово «семантический» указывает на возможность машинной обработки или на то, что машина может делать с данными. Принимая во внимание, что «сеть» передает идею навигации по пространству взаимосвязанных объектов с сопоставлениями от URI к ресурсам.

Развивающееся видение семантической сети

То, что стоит за первоначальным видением Semantic Web, было связано с тремя вещами:

  • автоматизацией поиска информации,
  • Интернетом вещей и
  • персональными помощниками.

Однако со временем эта концепция превратилась в два важных типа данных, которые, вместе взятые, реализуют ее видение сегодня. Это связанные открытые данные и семантические метаданные.

Связанные открытые данные: путь через лабиринт данных

Чтобы семантическая паутина функционировала, компьютеры должны иметь доступ к структурированным наборам информации и наборам правил вывода, которые они могут использовать для проведения автоматизированных рассуждений.

Семантическая паутина Новая форма веб-контента, значимая для компьютеров, откроет революцию новых возможностей.

Связанные открытые данные (LOD) — это структурированные данные, смоделированные в виде графа и опубликованные таким образом, чтобы обеспечить взаимосвязь между серверами

— Тим Бернерс-Ли (2006 г.)

4 правила связанных данных

  • Используйте URI в качестве имен для объектов;
  • Используйте HTTP URI, чтобы люди могли искать эти имена.
  • Когда кто-то ищет URI, предоставьте полезную информацию, используя стандарты (RDF*, SPARQL).
  • Включите ссылки на другие URI. так что они могут обнаружить больше объектов.

LOD позволяет людям и машинам получать доступ к данным на разных серверах и более легко интерпретировать их семантику. В результате Semantic Web переходит от пространства, состоящего из связанных документов, к пространству, состоящему из связанной информации. Что, в свою очередь, дает возможность создать сильно взаимосвязанную сеть машинно-обрабатываемых значений.

Связанные открытые данные (LOD) включают

  • Фактические данные о конкретных объектах и ​​концепциях (например, Москва, 2-я мировая война или Достоевский);
  • Онтологии — семантические схемы, определяющие:
  • Классы объектов (например, Люди, Организации, Места и Документы);
  • Типы отношений (например, родитель или производитель);
  • Атрибуты (например, ДоБ человека или население географического региона ).

Сегодня существуют тысячи наборов данных, опубликованных как LOD в различных секторах, таких как энциклопедии, географические данные, правительственные данные, научные базы данных и статьи, развлечения, путешествия и т. д. Только в науках о жизни более 100 научных баз данных опубликованы как LOD.

Из-за их связи эти наборы данных образуют гигантскую сеть данных или граф знаний, который связывает огромное количество описаний объектов и концепций общей важности. Например, есть несколько описаний города Москва (например, одно взято из Википедии, другое — из туристического справочника и т. д.).

Семантические метаданные: тегирование существующей сети

Семантические метаданные представляют собой семантические теги, которые добавляются к обычным веб-страницам для лучшего описания их значения. Например, страница города Москва в Википедии может быть семантически аннотирована ссылками на несколько связанных с городом понятий и объектов, например, Кремль, Большой театр, МГУ, Москва-река, телефонный код, день города и т.д. .

Такие метаданные значительно упрощают поиск веб-страниц на основе семантических критериев. Это устраняет любую потенциальную двусмысленность и гарантирует, что при поиске Парижа (столицы Франции) мы не получим страницы о Пэрис Хилтон.

Если мы хотим иметь четко определенную связь между темой веб-страницы и соответствующей страницей или документом, лучше всего использовать одну из схем метаданных структурированных данных. В настоящее время наиболее популярной такой схемой является Schema.org , которую создали Google, Yahoo, Microsoft и Яндекс. Согласно недавнему исследованию Университета Мангейма, в 2015 году 30% веб-страниц содержали семантические метаданные.

Взглянем под капот

Semantic Web предоставляет общую структуру, которая позволяет совместно и повторно (многократно) использовать данные между приложениями, предприятиями и сообществами. Это совместная работа под руководством W3C с участием большого числа исследователей и промышленных партнеров.

Фундаментальным для принятия видения Semantic Web была разработка набора стандартов, установленных международным органом по стандартизации — Консорциумом World Wide Web (W3C) :

  • Resource Description Framework (RDF) — простой язык описания объектов и их отношений в графе;
  • Протокол SPARQL и язык запросов RDF (SPARQL) — протокол и язык запросов для данных RDF;
  • Унифицированный идентификатор ресурса (URI) — строка символов, предназначенная для однозначной идентификации ресурсов и расширяемости через схему URI.

Доступность таких стандартов способствовала развитию экосистемы различных инструментов от разных поставщиков, которые работают с данными RDF (известными как хранилища триплетов), редакторов онтологий, инструментов тегов, которые используют анализ текста для автоматического создания семантических метаданных, семантические поисковые системы и многое другое.

Графики знаний: следующая реинкарнация семантической паутины
Хотя графы знаний появились позже, они быстро стали мощным стимулом для принятия стандартов Semantic Web и всех реализующих их семантических технологий. Графы знаний привносят парадигму семантической паутины на предприятия, вводя семантические метаданные, чтобы вывести управление данными и управление контентом на новый уровень эффективности и устраняя разрозненность, чтобы обеспечить синергию с различными формами управления знаниями.

Графы корпоративных знаний используют онтологии для создания явных различных концептуальных моделей (схем, таксономий, словарей и т. д.), используемых в различных системах предприятия. Используя сленг управления корпоративными данными, графы знаний представляют собой семантические справочные данные премиум-класса: набор взаимосвязанных описаний сущностей — объектов, событий или концепций.

Таким образом, графы знаний помогают организациям усовершенствовать конфиденциальную информацию, используя глобальные знания в качестве контекста для интерпретации и источника для обогащения.

Семантическая сеть — это сеть связей между различными формами данных, позволяющая машине делать то, что она не могла делать напрямую.

Благодаря своей способности повышать генерацию, интеграцию и понимание данных концепция семантической паутины быстро внедрялись в управление данными и информацией. Сегодня многие организации используют связанные данные в качестве механизма внутренней публикации основных данных.

Стандарты Semantic Web широко используются при разработке графов знаний в различных областях: правительство и гос.услуги, СМИ, бизнес, наука и т.п.

Вы дочитали статью до конца, видимо вас так же интересует эта тема. Пожалуйста, поставьте оценку пользы для вас этого материала.
Если у вас есть свои идеи по теме, напишите в комментариях — мы с радостью возьмем на вооружение и улучшим этот материал с пользой для других читателей.

Оцените автора
Онтограф
Добавить комментарий