Идеальная пара: связанные открытые данные и искусственный интеллект

Блог

Машино-читаемые данные в форме связанных открытых данных и машинное обучение напрямую связаны. Цель состоит в том, чтобы распознать закономерности в данных с помощью машины и сделать на этой основе прогнозы.

Искусственный интеллект – что это на самом деле?

Тема связанных открытых данных (Linked Open Data, LOD) часто упоминается в связи с термином искусственный интеллект (ИИ). Искусственный интеллект следует понимать как общий термин, используемый для описания различных автоматизированных вычислительных методов, таких как машинное обучение (Machine Learning, ML).

Это правда, что машино-читаемые данные в форме связанных открытых данных и машинное обучение напрямую связаны. Цель состоит в том, чтобы распознать закономерности в данных с помощью машины и сделать на этой основе прогнозы.

В случае распознавания изображений это может служить примером автоматического дифференцирования собак и кошек на основе расчетных моделей (алгоритмов). Машина учится на основе примеров (обучающие данные): чем больше изображений собак и/или кошек обрабатывается машиной и чем больше ошибок исправляется (обучение алгоритма), тем лучше становится модель расчета.

Поэтому основой машинного обучения является обучение больших языковых моделей обучающими данными. Такие алгоритмы также развиваются дальше после нескольких раундов обучения, поэтому можно говорить о предполагаемом «интеллекте». Данные обучения для этих алгоритмов теперь могут существовать в разных формах. Как только все данные помечены единым «языком» или «онтологией» (например, Schema.org), можно говорить о структурированных данных.

Они совместимы и обычно особенно хорошо интерпретируются машинами. Таким образом, описание данных, а также их бесплатное предоставление являются инструментом искусственного интеллекта. Он может опираться на такую ​​базу данных, поскольку язык описания также доступен для чтения и интерпретации машинами.

Процесс машинного обучения

Связанные открытые данные и цифровые помощники

В качестве базового приложения для связанных открытых данных и искусственного интеллекта мы часто говорим о цифровых или умных помощниках. Это системы, которые могут отвечать на индивидуальные запросы и предоставлять гостям персональные рекомендации. Предполагается, что в ближайшем будущем эти системы помощи будут доступны путешественникам в качестве консультантов или тренеров.

Чтобы это работало хорошо, данные из разных источников должны быть доступны и качественно сопоставлены между собой, чтобы их можно было предоставить алгоритмам искусственного интеллекта.

Можно говорить о двух типах данных:

  • Данные для гостей: это все данные, которые также обсуждаются в контексте связанных открытых данных. Например: объекты, события, отели, расписания, гастрономия и т. д.
  • Данные о гостях: пользовательские данные и, следовательно, персональные данные. Они не обсуждаются в Связанных открытых данных из-за политики конфиденциальности.

Что касается данных о гостях, можно провести дополнительное различие между

  • статическими данными (объекты, основные данные отеля и т. д.) и
  • динамическими данными (события, погода, дорожная ситуация, доступность отелей и цены и т. д.).

С одной стороны, данные о гостях можно использовать для создания профилей пользователей об их предпочтениях и поведении.

С другой стороны, агрегирование пользовательских данных открывает большие возможности для прогнозирования уровня занятости, потоков посетителей, а также многих других сценариев, которые важны для цифровых помощников, чтобы иметь возможность делать прогнозы относительно уровня загруженности и т. д. и передавать их гостям напрямую.

Данные, касающиеся гостя

Сочетание связанных данных открывает большой потенциал для объединения аналогового и цифрового миров опыта туриста. Помимо данных, для этого требуется, в частности, интерфейс между гостем и местом назначения, а также инфраструктура, обеспечивающая обмен данными (см.рисунок ниже).

Идеальная пара: связанные открытые данные и искусственный интеллект

В такой базе данных с цифровой инфраструктурой могут работать приложения с такими функциями, как:

  • автоматизированный контроль доступа (например, на фестивалях),
  • безналичная оплата (например, в парках развлечений),
  • средства навигации любого типа (например, на горнолыжных курортах) или
  • все мыслимые передачи информации (например, на речные круизы) могут быть реализованы в режиме реального времени.

Региональные туристко-информационные центры (РТИЦ) как цифровые платформы

Сочетание данных о гостях в форме связанных открытых данных с данными о гостях в форме профилей пользователей позволяет РТИЦ (Региональные туристко-информационные центры) самим стать цифровой платформой. На уровне пункта назначения в этом контексте особенно многообещающими кажутся цифровые гостевые карты.

Идеальная пара: связанные открытые данные и искусственный интеллект

Однако понятие карты гостя следует понимать гораздо шире.

  • С одной стороны, цифровая карта гостя — это объект, который может собирать данные пользователя (с его согласия).
  • С другой стороны, открытые данные обо всех соответствующих точках взаимодействия в пункте назначения доступны и могут отображаться гостям через дополнительное приложение на карте. Физический элемент карты или носимое устройство позволяет получить доступ к реальным предложениям.
Идеальная пара: связанные открытые данные и искусственный интеллект

В перспективе при поддержке искусственного интеллекта могут быть разработаны модели, направляющие поведение пользователей в определенное русло. Такое целенаправленное влияние на поведение можно очень хорошо сочетать с аспектами устойчивости, если определенное (устойчивое) поведение вознаграждается. Гость получает толчок в определенном направлении.

Управление данными в эпоху искусственного интеллекта

Поэтому обработка данных весьма актуальна, особенно на фоне машинного обучения. Важно понимать, что речь идет прежде всего об определении единого языка разметки, а не единой платформы для публикации данных.

Потому что цель связанных открытых данных именно в этом: независимость от конкретной системы.

Объединив данные по единому стандарту, база данных будет представлять собой нечто большее, чем просто сумму ее частей. Таким образом, данные не обязательно должны храниться централизованно, но их необходимо последовательно маркировать. Это единственный способ обеспечить независимость от сторонних поставщиков (платформ), таких как Яндекс или Google, поскольку открытые данные могут использовать все.

Чтобы обеспечить широкое использование данных, жизненно важно, чтобы Региональные ТИЦ обучали своих поставщиков услуг и других заинтересованных сторон в сфере туризма в регионе и объясняли актуальность современного управления данными. Каждый пункт назначения сам решает, какие данные следует сделать общедоступными. В конечном итоге решающее значение имеют индивидуальная цифровая стратегия и лежащие в ее основе бизнес-модели.

Оцените статью
( 1 оценка, среднее 5 из 5 )
Туризм | открытые данные