Цель состоит в том, чтобы объединить децентрализованную и разнородную базу данных в центральный и открытый граф знаний о туризме в России, который может использоваться совместно всеми участниками индустрии туризма и внешними поставщиками услуг. Базы данных графов составляют основу для предоставления гостям таких ответов приложений искусственного интеллекта, которые будут правдивы, а так же соответствовать ситуации и контексту туриста.
- Ключевые выводы
- Граф знаний как современная форма архитектуры данных
- Отличие графовых баз данных от реляционных баз данных
- Преимущества графа знаний для туризма в России
- Обмен данными
- Сокращение региональных различий
- Легко связать с внешними данными
- Легко выполнять сложные запросы
- Граф знаний как архитектура данных будущего
Ключевые выводы
- В графовых базах данных существующие данные связаны друг с другом.
- Различные источники данных могут быть связаны друг с другом.
- Базы данных графов можно использовать для предоставления ответов на сложные поисковые запросы.
- Базы данных графов образуют основу для разработки и использования приложений ИИ в будущем.
- С созданием графа знаний для туризма в России создается современная архитектура базы данных, которая формирует основу для цифровых приложений будущего.
Граф знаний как современная форма архитектуры данных
В будущем гости все чаще будут искать информацию с помощью голоса. Голосовые запросы записываются на смартфон с помощью функции диктовки или адресуются в виде вопросов цифровым помощникам, таким как Алиса Яндекса, Салют Сбера, или Google Assistant.
При голосовом вводе следует учитывать, что запросы и ожидаемые ответы отличаются от классического поискового запроса. Сложность увеличивается, поскольку запросы часто делаются в определенном контексте и в зависимости от погоды, текущего местоположения, личных предпочтений и т. д. На вопрос «Что я могу сделать в городе N на выходных?» следует расшифровать естественный язык и дать конкретный, персонализированный ответ, учитывающий соответствующую ситуацию гостя.
Для этого необходимо, чтобы различные данные были связаны друг с другом: туры с гастрономическими предложениями, гастрономия с мероприятиями, мероприятия с вариантами мобильности и т. д.
Цель состоит в том, чтобы объединить децентрализованную и разнородную базу данных в центральный и открытый граф знаний о туризме в России.
Такой граф знаний может использоваться совместно всеми участниками индустрии туризма и внешними поставщиками услуг.
Базы данных графов составляют основу для предоставления гостям таких ответов, которые соответствуют ситуации и контексту. Благодаря архитектуре данных в виде сети отдельные точки данных могут быть очень хорошо связаны друг с другом.
Так же, как в реальном мире общественный транспорт, места проведения, достопримечательности или рестораны в городе связаны друг с другом, эти связи также могут быть представлены в графовой базе данных.
Не каждое отношение необходимо перепрограммировать, поскольку в графовых базах данных соединения возникают посредством чистого ввода данных, в котором отношения явно определены. Кроме того, связи между вновь введенными данными возникают благодаря их взаимосвязи с уже сохраненными данными, например, посредством географической привязки (так называемое географическое обоснование).
Для достижения такой функциональности данные должны иметь соответствующее качество и быть связаны друг с другом в таком графе знаний. Дополнительная информация, такая как географические координаты, необходима для установления связи от пункта назначения до ближайшего ресторана. Это означает, что точность хранения данных становится все более важной. Цель состоит в том, чтобы соединить децентрализованную и разнородную базу данных туризма в России через граф знаний.
Базы данных графов можно очень хорошо использовать для отображения связей между данными.
Отличие графовых баз данных от реляционных баз данных
Термин «база данных» часто ассоциируется с таблицами со многими столбцами и строками, похожими на таблицу Excel. Такие базы данных также называются реляционными, поскольку отдельные таблицы могут быть связаны друг с другом посредством отношений. Это позволяет, например, определить связь между достопримечательностью и близлежащими ресторанами.
Такие отношения можно развивать в реляционных базах данных. Однако таблицы по своей сути являются жесткими, и их можно изменить лишь с трудом. Кроме того, большое количество многоуровневых связей (отношений), создаваемых путем связывания таблиц, быстро приводит к путанице.
Графовые базы данных отличаются от реляционных баз данных по своей структуре и построению. Они созданы в сетевой структуре. Узлы (визуально представленные в виде точек) соединены друг с другом ребрами (представленными в виде линий). Возможные соединения в этой сетевой структуре значительно более гибкие, чем в реляционной базе данных. Данные и их взаимосвязь друг с другом можно адаптировать и обмениваться, что обеспечивает гибкие изменения и расширения.
В настоящее время данные о туризме в основном доступны в реляционных базах данных и в отдельных таблицах, которые практически не связаны друг с другом. Цель состоит в том, чтобы обработать эти данные так, чтобы они были единообразно доступны, чтобы создать связь между входными данными из разных Регионов и территорий.
Различные наборы данных Регионов должны быть стандартизированы и централизованно доступны для всех.
В принципе, связь между данными может быть установлена и в реляционных базах данных через соединения. Однако это быстро становится запутанным, поскольку запросы на нескольких уровнях могут стать очень сложными. С другой стороны, графовые базы данных предназначены для отображения взаимосвязей между данными.
Архитектура данных в сетевых структурах становится все более важной, поскольку единообразно описанные данные и их взаимосвязь друг с другом могут автоматически пониматься и далее обрабатываться машинами, что является важной поддержкой для приложений искусственного интеллекта.
Стартапы также могут очень легко декодировать эту форму хранения данных, что позволяет им напрямую получать доступ к данным и реализовывать инновационные идеи без необходимости кропотливой расшифровки логики взаимосвязи между данными. Поэтому путь к цифровой трансформации туристической отрасли России лежит через разработку и эксплуатацию централизованной графовой базы данных по туризму в России.
Сеть данных с использованием различных систем баз данных:
База данных графов. Данные гибко связаны между собой в сеть. Легко изменять структуру данных.
Реляционная база данных. Связи между данными строятся через таблицы. Сложно менять структуру данных и связей.
Помимо прочего, Яндекс и Google управляет такой графовой базой данных, которую называют «Граф знаний», поскольку ее цель — предоставлять контекстно-зависимые ответы с использованием различных источников данных. Например, Google может отображать подходящие рестораны или мероприятия вдоль пешеходной тропы. Доступ к этой сетевой структуре данных также можно использовать для генерации более точных ответов для голосовых помощников.
Недостаток этой схемы знаний от Google: она не является общедоступной и используется Google только для собственных цифровых приложений. Поэтому невозможно получить доступ к существующим ссылкам во вселенной Google.
Преимущества графа знаний для туризма в России
Есть необходимость создать открытую и независимую диаграмму знаний для туризма в России. Заинтересованные стороны туризма получают выгоду от предоставления данных в таком графе знаний, связывая их с другими данными.
Например, на основе геоданных можно вывести информацию о близлежащих ресторанах на пешеходных или велосипедных маршрутах, а также установить множество других связей между различными данными.
Это создает над-региональную сеть в графе знаний российского туризма, поскольку данные о туризме всех участвующих сторон единообразно маркируются и интегрируются. На этой основе можно создать межрегиональное сотрудничество и взаимодействие поставщиков туристической индустрии, посредством которого можно будет разрабатывать новые цифровые услуги для гостей.
Эти обширные возможности использования данных также способствуют подготовке приложений на основе искусственного интеллекта. Потому что описание и разметка данных производится с использованием разделяемой (стандартной) онтологией, такой как Schema.org, и сохранение их в сетевой структуре делает как сами данные, так и их связи друг с другом машиночитаемыми. Вам не обязательно разрабатывать собственные приложения. Данные, содержащиеся в «Графе знаний о российском туризме», также могут использоваться Яндексом и Google, а также другими внешними субъектами, такими как поставщики транспортных услуг и т. д. Цель состоит в том, чтобы добиться максимальной наглядности.
Обмен данными
Данные из графа знаний о российском туризме могут быть использованы всеми заинтересованными сторонами:
- Поставщики мобильных услуг, онлайн-турагентства или поисковые системы также могут получить доступ к данным и использовать их, улучшая аналитику и свои продукты.
- Гости получают больше информации из существующих данных в соответствии со своим контекстом.
- Индустрия туризма получает данные о турпотоке, потенциалах и рисках за счет совместного обогащения данными графа знаний.
Сокращение региональных различий
Граф знаний имеет единую структуру благодаря интегрированным моделям. Таким образом учитываются языковые различия между регионами, ведь ресторан также можно назвать пабом, баром, кафе, тратторией, столовой и т. д.
Все децентрализованные данные, подготовленные в соответствии с этими спецификациями, могут быть связаны друг с другом без каких-либо дополнительных усилий. Без сложной интеграции интерфейса эти данные можно интегрировать в граф знаний, а затем передать оттуда в различные региональные системы баз данных.
- Гости имеют возможность сравнивать предложения по своему запросу в разных регионах.
- Индустрия туризма: снижаются возможные ограничения на использование данных, поскольку все данные понимаются одинаково.
Легко связать с внешними данными
Внешние данные, такие как информация о погоде, гео-информационные системы, расписания транспорта или многочисленные реестры туроператоров или муниципальных образований, могут быть интегрированы в «Граф знаний». В результате получается связь с данными, которые в первую очередь не связаны с туризмом, но все же важны для туризма.
- Гости получают доступ к комплексной информационной базе о всех объектах туризма.
- Индустрия туризма снижает затраты и получает новые возможности за счет использования внешних источников данных.
Легко выполнять сложные запросы
Благодаря сетевой структуре внутри графа знаний и семантическому описанию данных возможна высокая эффективность даже для сложных запросов. Преимущество состоит в том, что общий объем данных не влияет на сложность схемы и, следовательно, может быть немедленно понят и применен. Таким образом, больше данных просто означает лучшие ответы.
- Гости: добавленная стоимость за счет более качественных ответов.
- Индустрия туризма: добавленная стоимость за счет создания комплексных услуг на основе данных.
Граф знаний как архитектура данных будущего
Применение искусственного интеллекта (ИИ) часто до сих пор кажется научной фантастикой. Но они станут стандартом раньше, чем многие думают сегодня. Вот почему важно заложить для этого базу данных уже сейчас.
Граф знаний играет важную роль для туризма в России. Потому что искусственный интеллект не сравним с человеческим интеллектом в нескольких отношениях. В частности, это означает:
- Машины учатся с помощью алгоритмов, оценивая данные и распознавая в них закономерности. В сфере туризма это может повлиять на динамику цен, потоки посетителей и т. д.
- На основе распознавания образов машины могут предсказывать определенные обстоятельства (предиктивная аналитика), например, задавая вопрос: какой аттракцион особенно популярен и когда и как это влияет на ценообразование?
- На основе таких прогнозов гостям можно дать целевые рекомендации: например, какие направления менее посещаемы в конкретный праздничный день и какой вид транспорта является самым быстрым и дешевым способом добраться туда?
- Эти рекомендации основаны на записанном поведении пользователя и могут быть специально персонализированы: например, гостю затем рекомендуется ресторан, который ему больше всего подходит.
Данные в графе знаний помогают автоматически предоставлять гостям персональные рекомендации.
Ответы и прогнозы, подобные тем, которые представлены в упомянутых примерах, можно легко извлечь из графа знаний. В графовых базах данных значимые ссылки (например, на основе географического положения) можно создавать независимо с помощью запросов и корректировать на основе опыта. Если гости принимают определенные предложения, система может настроиться на основе этой обратной связи и предложить еще более индивидуальные предложения. Однако прежде чем машины смогут работать автономно, им нужна хорошая база данных.
Поэтому данные должны, с одной стороны, иметь единую маркировку, а с другой стороны, быть доступными в сетевой структуре. В этом случае их можно запросить во всех мыслимых направлениях с помощью алгоритмов. По этой причине техническую реализацию Графа знаний для туризма в России всегда следует рассматривать в связи с установлением общего стандарта данных.
Автономные рекомендатели преследуют цель поддержать туристов, в то же время имея возможность влиять на их поведение. Прогнозы (предиктивная аналитика) и полученные на их основе персональные рекомендации могут предоставляться как в виде цифрового сервиса для гостей в пункте назначения, так и использоваться в качестве инструмента для сопровождения посетителей.
Основой рекомендаций в реальном времени может быть база данных Графа знаний по туризму в России. Его функции можно объединить в автономный рекомендатель в качестве спутника в отпуске.