МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Построение вероятностных моделей выживаемости по усеченным слева и цензурированным справа данным
Е. В. Чимитоваa,
И. М. Митрофановb a Новосибирский государственный технический университет
b Научный центр клинической и экспериментальной медицины Сибирского отделения Российской академии медицинских наук
Аннотация:
В задачах анализа данных типа времени жизни, полученные выборки наблюдений, как правило, являются цензурированными справа. Кроме того, часто возникает ситуация, когда
в выборку попадают только те объекты (индивидуумы), продолжительность жизни которых удовлетворяет некоторому условию. В этом случае полученные данные являются усеченными. Рассматривается задача построения модели пропорциональных интенсивностей Кокса по усеченным слева и цензурированным справа данным. На основе полупараметрической модели, в которой распределение продолжительности жизни предполагается неизвестным, проводится отбор факторов, оказывающих статистически значимое влияние на функцию выживаемости. Для проверки гипотезы о равенстве регрессионных параметров данной модели нулю используется критерий Вальда. Методами компьютерного моделирования исследуется сходимость распределения статистики критерия Вальда к соответствующему предельному
$\chi^2$-распределению при различной степени цензурирования. Предлагается подход
к проверке гипотезы о согласии с параметрической моделью пропорциональных интенсив-ностей по усеченным слева и цензурированным справа выборкам на основе остатков Кокса–Снелла, которые, в случае верности нулевой гипотезы, подчиняются стандартному экспоненциальному распределению. Для проверки гипотезы предлагается воспользоваться модифицированными критериями согласия Колмогорова, Крамера–Мизеса–Смирнова и Андерсона –Дарлинга. Приводится пример применения полученных результатов для статистического анализа выживаемости некоренного населения в районах промышленного освоения Севера. На основе полупараметрической модели пропорциональных интенсивностей Кокса выявляются прогностические факторы, значимо влияющие на продолжительность жизни людей. Далее вводится параметризация базовой функции интенсивности, соответствующая обобщенному гамма-распределению. Проверяется статистическая гипотеза об адекватности полученной параметрической модели.
Ключевые слова:
усеченные слева данные, цензурированные данные, модель пропорциональных интенсивностей Кокса, критерий Вальда, непараметрические критерии согласия, функция выживаемости, обобщенное гамма-распределение.
УДК:
62-83:519.2
Поступила в редакцию: 01.10.2014