Integrating an ontology-driven approach to data visualization and AI based visualization with Plotly
[Интеграция подхода к визуализации данных на основе онтологии и визуализации на основе ИИ с использованием Plotly]
A. D. Dzheiranian,
L. N. Lyadova National Research University "Higher School of Economics", Perm Branch
Аннотация:
В данном исследовании представлен прототип ассистента, управляемого искусственным интеллектом, который автоматизирует генерацию скриптов визуализации данных на основе запросов на естественном языке, устраняя необходимость пользователей владеть навыками программирования. В статье рассматриваются исследования, направленные на разработку средств для эффективной визуализации данных, проводится сравнение систем визуализации данных, основанных на использовании искусственного интеллекта, показаны ограничения существующих средств. Предлагаемый подход к визуализации данных основан на интеграции DSM-платформы (языкового инструментария), управляемого знаниями, и инструментов генеративного искусственного интеллекта. Предлагаемая методология разделяет задачи визуализации данных на два типа: стандартные и нестандартные. Стандартные задачи решаются с помощью генерации кода на основе подсказок в визуальной среде. Нестандартные задачи обрабатываются путем расширения существующих библиотек с помощью определяемых пользователем пакетов. Языково-ориентированный подход с использованием средств DSM эффективно объединяет обе категории: для стандартных задач пользователи работают с существующими DSL и настраивают параметры по мере необходимости, тогда как для нестандартных задач пользователи разрабатывают новые DSL с помощью языкового инструментария, автоматизирующего создание визуальных DSL и генерацию кода. Ядром языкового инструментария является многоаспектная онтология. Благодаря интеграции большой языковой модели (LLM) с фреймворком, управляемым знаниями, и многоаспектной онтологией, система обеспечивает динамические, контекстно-ориентированные рабочие процессы визуализации, которые гарантируют семантическую прослеживаемость и воспроизводимость. Онтология не только хранит описания задач визуализации данных, но и облегчает повторное использование сгенерированных скриптов, повышая тем самым адаптивность системы и способствуя совместной аналитической работе сообществ пользователей. Набор данных, содержащий записи и переменные, охватывающие различные предметные области, используется для демонстрации функциональности прототипа. В статье приведены примеры разработки нескольких вариантов визуализаций, демонстрирующие применение предлагаемого подхода. Приведённые примеры демонстрируют эффективность прототипа в создании гистограмм, точечных диаграмм и других методов визуализации и снижении технических барьеров для пользователей. В перспективе функциональность ассистента будет расширена за счёт поддержки пользовательских пакетов визуализации и дополнительного обучения LLM для решения нестандартных задач и сложных сценариев визуализации.
Ключевые слова:
визуализация данных, искусственный интеллект, предметно-ориентированное моделирование, языковой инструментарий, онтология, Python, Dash, Plotly
Язык публикации: английский
DOI:
10.15514/ISPRAS-2025-37(4)-26