Аннотация:
Массовое обучение в российских вузах по специальностям (направлениям), связанным с точными и техническими науками, характеризуется высоким уровнем отсева начиная с первого курса обучения. Существующие на сегодняшний день уровень школьного образования, система отбора абитуриентов через процедуру ЕГЭ во многих случаях не гарантируют, что будущие студенты смогут успешно освоить наукоемкие специальности. Упор на личностно-ориентированное, индивидуальное обучение возможен только после того, как студенты проявили себя на первых этапах учебы, поэтому опережающее выявление способности вчерашних абитуриентов эффективно учиться является весьма актуальной задачей.
Рассматриваются методики построения деревьев решений, предназначенных для классификации студентов, выделяя из них множество тех (группу риска), кто с высокой долей вероятности будет отчислен уже по итогам первого учебного цикла (триместра). При этом в качестве входных данных используется минимальная информация о первокурсниках, зафиксированная в их личном деле. Построение модели осуществлялось по данным о студентах направления «Прикладная математика и информатика» Пермского государственного национального исследовательского университета за пятилетний период наборов (2014–2018 гг.). При этом информация 2014–2017 гг. использовалась для обучения, а поток 2018 г. в качестве тестового. На этапе машинного обучения было рассмотрено несколько моделей деревьев решений, которые оптимизировались с помощью балансировки, ограничения на максимальную глубину дерева и минимального количества элементов в листе. Эффективность бинарной классификации оценивалась с помощью матрицы неточностей и целого ряда получаемых на ее основе числовых критериев.
В результате машинного обучения построено дерево решений, которое спрогнозировало попадание в группу риска 16 из 17 человек, отчисленных уже по итогам первого триместра. Иными словами, оказавшихся по ряду причин неспособными к обучению по направлению «Прикладная математика и информатика». Помимо этого, удалось определить уровень значимости различных видов исходных данных, показав, что результаты ЕГЭ в значительной мере определяют успешность студентов на этом этапе обучения. Определение группы риска дает определенные ориентиры для целенаправленной деятельности педагогов и вузовских психологов, что в конечном итоге может послужить основанием для повышения качества обучения и уменьшения отсева. Выполненная работа демонстрирует возможности методов интеллектуального анализа данных при решении плохо формализуемых задач, характерных для этого вида деятельности человека.
УДК:
378.02
Поступила в редакцию: 12.10.2020 Исправленный вариант: 12.10.2020 Принята в печать: 16.11.2020