|
|
| СЕМИНАРЫ |
|
Семинар отдела дискретной математики МИАН
|
|||
|
|
|||
|
Модифицированный критерий Хеллер-Хеллера-Горфин для проверки однородности А. П. Бузин Московский государственный университет имени М. В. Ломоносова |
|||
|
Аннотация: Рассмотрим задачу проверки гипотезы однородности Пусть $$ \lim_{n\rightarrow \infty} n_j/n =: \alpha_j, \ j=1,2,\dots,m. $$ Пусть Везде далее будем считать фиксированным натуральный параметр $$\widehat{\chi}^2_n(T) := \sum_{j=1}^{m}\sum _{i=1}^{k}\frac{\left( \widehat{F}_{j,n_j}(\Delta_i) -\widehat{H}_n (\Delta_i) \right)^{2} n_j } { \widehat{H}_n(\Delta_i) }, $$ где Известна проблема критерия однородности хи-квадрат, связанная с тем, что выбор ячеек разбиения достаточно существенно влияет на мощность. В связи с этим ряд авторов предлагал рассматривать различные формы перебора ячеек. Одним из наиболее эффективных решений в этом направлении с точки зрения мощности критерия является критерий, предложенный Хеллер, Хеллером и Горфин (Heller R., Gorfine M., Heller Y. A class of multivariate distribution-free tests of independence based on graphs //Journal of Statistical Planning and Inference. – 2012. – Т. 142. – №. 12. – С. 3097-3106.). Этот критерий предлагал перебирать всевозможные разбиения Мы предлагаем модификацию соответствующих статистик и получаем ряд предельных теорем для модифицированных статистик. Рассмотрим совместное распределение Обозначим $$ D_\varepsilon:= \sup_{T \in \mathcal{T}_{\varepsilon, n} } \widehat{\chi}^2_n(T),\quad D_\varepsilon^\prime:= \frac{1}{|\mathcal{T}_{\varepsilon, n}|} \sum_{T \in \mathcal{T}_{\varepsilon, n} } \widehat{\chi}^2_n(T), $$ где Теорема При верной гипотезе при фиксированном В докладе будет показана стостоятельность критериев, построенных по статистикам Для случая $$ \begin{aligned}& D_0 := \sup_{T: \widehat{H}_n(\Delta_i(T))>\varepsilon_n} \left( \sum_{j=1}^m \sum _{i=1}^{k}\frac{\left( \widehat{F}_{j,n_j}(\Delta_i) -\widehat{H}_n (\Delta_i) \right)^{2} n_j } { \widehat{H}_n(\Delta_i) \ln^2 \left(\widehat{H}_n(\Delta_i)/2 \right) } \right), \\ & D_0^\prime := \frac{1}{|\mathcal{T}_{\varepsilon_n, n}|} \sum_{T \in \mathcal{T}_{\varepsilon_n, n} } \left( \sum_{j=1}^m \sum _{i=1}^{k}\frac{\left( \widehat{F}_{j,n_j}(\Delta_i) -\widehat{H}_n (\Delta_i) \right)^{2} n_j } { \widehat{H}_n(\Delta_i) \ln^2 \left(\widehat{H}_n(\Delta_i)/2 \right) } \right). \end{aligned} $$ В докладе также будут изложены предельные свойства статистик |
|||