3 основных функции графа знаний их возможностями, и о том, как они создают ценность для четырех ключевых игроков компании, — аналитика, инженера по данным, директоров по финансам (CFO) и информации (CIO).
- Модель графа знаний идентична модели нейронной сети человека
- 3 ключевых функции графа знаний
- Уникальный идентификатор
- Четко определенные значения
- Встроенная логика
- Аналитик и граф знаний
- Директор по информационным технологиям (CIO) и граф знаний
- Инженер по эксплуатации и граф знаний
- Финансовый директор и граф знаний
Модель графа знаний идентична модели нейронной сети человека
Часто терминология мира графов знаний ошеломляет тех, кто только начинает с ним знакомиться. Существует множество аббревиатур, таких как RDF, OWL, SHACL и URL, не говоря уже о таких словах, как «онтология» и «семантика», которые, кажется, вырвались из ночных кошмаров студента-философа. Но поверьте, графы знаний на самом деле очень интуитивны, потому что они подходят к данным почти так же, как люди — подобно нейронной сети связанных понятий.
3 ключевых функции графа знаний
Уникальный идентификатор
Каждое понятие в графе знаний, будь то человек, место, транзакция, документ или что-то еще, имеет уникальный идентификатор. Это означает, что мы можем использовать любое количество различных терминов для обозначения одного и того же концептуального объекта.
Например, если вы добавляете нового сотрудника в граф персонала вашей компании, то вы выбираете концепт «Человек», а не просто вписываете имя в строку штатного расписания. Этот объект-человек, скорее всего, будет иметь связанные с ним имена, но это концепция конкретного и уникального человека. Поэтому, если имя этого человека меняется или он начинает использовать прозвище, можно не редактировать запись этого человека, а просто связать с ним новые имена на графе. По сути, граф знаний работает с «вещами», а не со «строками».
Четко определенные значения
Как только у вас появляются уникальные концепты (понятия) на графе, их необходимо определить. Вы добавили понятие «Человек» к графу знаний, но алгоритм сам по себе не знает, что такое человек. Нужно обучить алгоритм, используя машино-читаемые стандарты.
Например, у человека должно быть ФИО, день рождения и пол. Итак, теперь каждый человек на графе должен быть связан с другими объектами, такими как имя, день рождения и пол. Можно дополнительно определить подкатегорию лиц, которые являются сотрудниками (наемными работниками). У этих людей также должны быть зарплаты, даты начала работы, роли и так далее.
Встроенная логика
Определения, описанные выше, выходят за рамки атрибутов и также кодифицируют бизнес-логику. Можно определить, что город должен принадлежать государству, а область стране, а район области. Как человек, я знаю, что город в области должен находиться в той же стране, что и область, которому он административно принадлежит, но в реляционной СУБД вы не сможете прыгнуть от города к стране. В графе знаний наши четкие и подробные определения понятий позволяют графу делать такие выводы.
Комбинация этих трех атрибутов позволяет графу знаний генерировать ценность для нескольких разных игроков.
Аналитик и граф знаний
Наиболее очевидный способ, которым графы знаний доказывают свою ценность, — это анализ. Аналитикам нужна возможность обнаруживать и идентифицировать активы, делать прогнозы и отвечать как на количественные, так и на качественные вопросы. Графы знаний с их четко определенными объектами и определениями облегчают эти задачи.
Рассмотрим такой вопрос «Сколько наших клиентов проживает в Москве?» Используя традиционные методы, этот вопрос становится сложным запросом. Во-первых, аналитику нужна таблица со всеми клиентами по всем направлениям бизнеса. Затем им нужно найти способ связать их с местоположением и абстрагироваться от регионального уровня, что, вероятно, включает в себя множественные соединения и ручную агрегацию. Им нужно ассоциировать их с регионом, но что такое Москва? Включают ли они Московскую область? У разных людей могут быть разные определения.
С графом знаний это легко. Во-первых, диаграмма уже содержит все объекты клиентов, потому что данные не распределяются по таблицам; это просто связывает их с разными направлениями бизнеса. Затем, исходя из определения клиента, каждый клиент уже связан с местоположением, которое граф с помощью встроенной логики понимает как принадлежащее состоянию.
В идеале компания заранее определила регион Москва, и аналитик может просто задать вопрос, как указано. Но если Москва еще не существует в графе как понятие, аналитик просто создает новое понятие региона и связывает его с понятиями соответствующих областей, например Москва вместе с Московской областью. Нет необходимости редактировать тысячи строк, потому что концепция региона уже связана с концепцией каждого клиента, поэтому вывод позволяет связать их с нужным регионом.
Простота этих запросов позволяет аналитику лучше выявлять риски. Если в порту С-Петербурга есть невыполненные заказы, и компания ожидает задержек с отгрузкой, она может решить проблему, передав всю информацию о незавершенных заказах клиентам в пунктах Северо-Западного региона, даже если о них нет упоминаний в любой из заказов.
Директор по информационным технологиям (CIO) и граф знаний
Следующая область, в которой графы знаний доказывают свою ценность, — это надзор и контроль. ИТ-директора используют информационные панели для обзора всей картины по IT-инфраструктуре, но и должны иметь возможность углубляться в детали, чтобы понять причину состояний элементов инфраструктуры. Они чаще всего определяют, где возникнут узкие места и куда пойдет их бюджет. Им необходимо обеспечить соблюдение нормативных требований и проводить более абстрактный стратегический анализ.
Целостный подход, используемый графами знаний, позволяет получить широкое представление об организации. Данные не разбиваются произвольно на разрозненные таблицы, в которых одни и те же понятия повторяются снова и снова. Каждое понятие существует ровно один раз в графе и связано строго определенными отношениями с другими.
Это делает извлечение информации из разных направлений бизнеса относительно простым. Система, используемая двумя разными частями бизнеса, понимается как единая платформа из-за концепции уникальности объекта. ИТ-директору не нужно беспокоиться о двойном учете, потому что он появляется в нескольких местах.
В то же время графы знаний помогают обеспечить соблюдение нормативных требований. Поскольку в разных юр.лицах используются разные определения понятий, организация данных для отчетов по холдингу может быть проблематичной. Но в графе знаний предприятия могут встроить определения и логику, соответствующие каждому предприятию, но сопоставимые с общей моделью данных и таксономиям по всей компании, поддерживая связность управления без какой-либо дополнительной ручной работы.
Инженер по эксплуатации и граф знаний
На более низком уровне, чем ИТ-директор, находятся люди, отвечающие за процессы. Инженеры по эксплуатации должны следить за тем, чтобы свет был включен, а ИТ-системы работали. Они ценят возможность постепенных улучшений и автоматизацию рутинных процессов. Унификация и стандартизация являются ключевыми аспектами их усилий по оптимизации систем.
Инженеры ценят графы знаний за их централизацию и соблюдение общих определений. В приведенном выше примере у организации теперь есть стандартное представление «С-Петербург», потому что определение задокументировано и встроено в нашу граф знаний. Всякий раз, когда любые другие вопросы относятся к этому региону, они будут использовать одно и то же определение, обеспечивая согласованность во всем бизнесе и снижая будущие рабочие нагрузки на ИТ.
Финансовый директор и граф знаний
Наконец, графы знаний приносят пользу таким людям, как финансовые директора, которые беспокоятся о чистой прибыли. Возможность многократного использования графов знаний помогает сократить расходы. Как только бизнес определяет модель, по которой он работает, она остается на графе, поэтому граф со временем только растет, становясь все более полным и полезным. В первый раз, когда вы добавляю новую модель или понятие на граф, вам нужно пройти через процесс определения. После этого вы много раз используете его без затрат времени и усилий.
Чтобы придерживаться моего примера «Москва», после того, как я определил его и связал с другими понятиями, я могу связать любую информацию, которую я добавляю о Москве, с любым другим понятием, которого оно касается, без какой-либо дополнительной работы. Допустим, мой бизнес расширяется. Мне не нужно обновлять каждую запись клиента с новым регионом Мне просто нужно определить регион Крым как находящийся в Российской Федерации, и тогда каждый клиент из Крыма появится в запросах для России.
В то же время улучшенный анализ открывает новые возможности, создавая потенциал для получения новых чистых потоков доходов. Те же самые данные теперь представляют большую ценность, чем раньше, потому что они могут подпитывать новые продукты и услуги.