Аннотация:
Современная сфера образования характеризуется растущим использованием тестов с множественным выбором для оценки знаний и навыков учащихся. Одним из распространенных методов подбора предложений для таких тестов является применение процедур кластеризации текстовых данных. В данном исследовании был разработан модуль для отбора предложений, включающий три этапа: предварительную обработку, вычисление параметров предложений и их кластеризацию. Однако объективная оценка качества полученных кластеров с помощью коэффициента силуэта и индекса Дэвиса–Болдина показала, что использованная модель кластеризации не дала удовлетворительных результатов.