RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2024, том 36, выпуск 6, страницы 7–18 (Mi tisp936)

Improving estimation models by merging independent data sources

[Совершенствование моделей оценки путем объединения независимых источников данных]

F. Valdés-Souto, J. Valeriano-Assem

National Autonomous University of Mexico

Аннотация: Оценка затрат/усилий на программное обеспечение является ключевой темой исследований более шести десятилетий из-за его влияния на отрасль. Несмотря на многочисленные модели, подходы, основанные на регрессии, доминируют в литературе. Проблемы включают в себя недостаточные наборы данных с достаточным количеством точек данных и произвольную интеграцию различных исходных баз данных. В этом исследовании предлагается использовать тест Крускала-Уоллиса для проверки интеграции отдельных исходных баз данных с целью избежать смешивания несвязанных данных, увеличения точек данных и улучшения моделей оценки. Было проведено тематическое исследование с данными из офиса международной компании в Мексике, который обеспечивает разработку программного обеспечения для «микросервисов и API». Были проанализированы данные за 2020 год. Качество модели оценки значительно улучшилось. MMRE снизился на 25,4% (с 78,6% до 53,2%), стандартное отклонение снизилось на 97,2% (с 149,7% до 52,5%), а показатель Pred (25%) вырос на 3,2 процентных пункта. Количество точек данных увеличилось, и были соблюдены ограничения линейной регрессии. Тест Крускала-Уоллиса эффективно улучшил модели оценки, подтвердив интеграцию базы данных.

Ключевые слова: модель линейной регрессии, оценка программного обеспечения, оценка затрат, оценка стоимости, функциональный размер, метод COSMIC, тест Крускала-Уоллиса

Язык публикации: английский

DOI: 10.15514/ISPRAS-2024-36(6)-1



© МИАН, 2026