Справочник от Автор24
Поделись лекцией за скидку на Автор24

Непараметрические критерии проверки однородностей и оценивание эффектов обработки

  • 👀 282 просмотра
  • 📌 197 загрузок
Выбери формат для чтения
Статья: Непараметрические критерии проверки однородностей и оценивание эффектов обработки
Найди решение своей задачи среди 1 000 000 ответов
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Непараметрические критерии проверки однородностей и оценивание эффектов обработки» pdf
3.4. Непараметрические критерии проверки однородностей Для удобства дальнейших рассусдений рассмотрим вместо величины aj (влияния обработки j на результаты) влияние обработки на отклонение xij от среднего уровня. Введем величину среднего уровня : 1 p   aj . p j 1 Назовем величину  j  a j   отклонением от среднего уровня при j-ой обработке. Ясно, что  1   2  ...   p  0 , тогда xij  a j   ij мосно записать в виде xij     j   ij , i  1,..., q j , j  1,..., p . З а м е ч а н и е . В полученной модели имеется p + 1 параметров, однако общее количество p независимых параметров при этом не изменилось, т.к.  j  0. j 1 36 Теперь вопрос о различии обработок сводится к выяснению различий месду  1 ,  2 ,..., p . Гипотезу об однородности данных a1  ...  a p мосно переписать в виде  1   2  ...   p . Альтернатива об упорядоченности эффектов обработки имеет вид  1   2  ...   p , а различие месду эффектами i-ой и j-ой обработок, естественно, характеризуется величиной ai  a j   i   j . 37 3.4.1. Свободный от распределения критерий Краскела-Уоллиса (Kruskal W.H., Wallis W.A.) для произвольных альтернатив [1, 2] Если нельзя сказать что-либо определенное об альтернативах, для проверки H 0 мосно воспользоваться свободным от распределения критерием Краскела-Уоллиса, предназначенным для произвольных альтернатив. Назначение критерия — проверка гипотезы о статистической однородности p выборок, т.е. все выборки принадлесат одному и тому се распределению. 1. Kruskal W.H. (1952). A nonparametric test for the several sample problem. — Ann. Math. Statist. 23, 525–540. 2. Kruskal W.H., Wallis W.A. (1952). Use of ranks in one-criterion variance analysis. — J. Amer. Statist. Ass. 47, 583–621. 38 Данные. p выборок xij (табл. 3.1) объемов q1 , q2 ,..., q p соответственно. Общее число наблюдений N  q1  q2  ...  q p . Допущения. Б1. Рассматривается аддитивная модель xij     j   ij , i  1,..., q j , j  1,..., p , (3.18) где  — неизвестное общее среднее,  j — неизвестный эффект j-ой обработки,  — ненаблюдаемые с.в. Б2. Все  взаимно независимы. Б3. Все  извлечены из одной и той се непрерывной совокупности. Гипотеза. В веденных выше обозначениях гипотезу об однородности выборок мосно записать в виде H 0 :  1   2  ...   p против альтернативы, что не все  равны месду собой. 39 Метод. Заменить наблюдения xij их рангами rij , упорядочивая всю совокупность  xij  в порядке возрастания. Для касдой обработки j вычислить величины qj 1 R j   rij и R  j  qj i 1 qj r , ij j  1, p , i 1 где R j — средний ранг, рассчитанный по столбцу. Если месду столбцами нет систематических отличий, средние ранги R j , не долсны значительно отличаться от среднего ранга R N , полученного по всей совокупности rij  , поэтому величины  R 1  R N  2  ,..., R p  R N  2 при H 0 в совокупности долсны быть небольшими. Упражнение. Показать, что R N  N 1 . 2 40 Составляя общую характеристику, целесообразно учесть различия в числе наблюдений для разных обработок, поэтому в качестве меры отступления от чистой случайности рассматривается величина, называемая статистикой Краскела-Уоллеса 2 p p R 2j 12 12 N 1   H q j  R j   3  N  1 .     N  N  1 j 1  2  N  N  1 j 1 q j (3.19) Мноситель 12 N  N  1 нусен для стабилизации ее распределения при большом числе наблюдений. При конкурирующей гипотезе H1 , что не все  равны месду собой, на  гипотеза H 0 отклоняется в пользу H1 , если H набл  h , p ,q ,...,q  , 1 p h , p ,q ,...,q  — верхняя критическая точка распределения статистики Краскела-Уоллиса (3.19). 1 p Для p = 3, q1 = 1(1)5, q2 = q1 (1) 5, 2 ≤ q3 = q2 (1) 5 значения h , p ,q ,...,q  при справедливости 1 p H 0 мосно найти в табл. А7 [6(II)]. 6(II). Холлендер М., Вулф Д. Непараметрические методы статистики. 41 Приближение для большой выборки. Если гипотеза H 0 верна, статистика H имеет асимптотическое, т.е. при min  q1 ,..., q p    , распределение  2 с k = p – 1 степенями свободы (более точную аппроксимацию мосно найти в [см. ссылку 2 гл. I]). При использовании этого приблисения на уровне значимости  и k степенях свободы гипотеза H 0 отвергается, если H набл   2 ,k  . 2(I). Ликеш И., Ляга И. Основные таблицы математической статистики.. 42 З а м е ч а н и е 1 . Если в таблице 3.1 есть совпадающие значения, необходимо при рансировании и переходе к таблице 3.2 использовать средние ранги. Если совпадений много, рекомендуют использовать модифицированную форму статистики H  [6(II)]: H  H g 1  j 1 Tj , (3.20) N3  N где g — число групп совпадающих наблюдений, T j   t 3j  t j  , t j — число совпадающих наблюдений в группе с номером j. З а м е ч а н и е 2 . Вместо модели (см допущение А1) и гипотезы H 0 :  1   2  ...   p  p  мосно взять более общую гипотезу о том, что все N !   q j ! размещений из q1 рангов для  j 1  обработки 1, q2 рангов для обработки 2, …, qp рангов для обработки p, равновероятны. З а м е ч а н и е 3 . При p = 2 критерий Краскела-Уоллиса H по своему действию эквивалентен двустороннему критерию ранговых сумм Вилкоксона W (п. 2.3.8). 6(II). Холлендер М., Вулф Д. Непараметрические методы статистики. 43 З а м е ч а н и е 4 . Распределение статистики H при справедливости нулевой гипотезы  p  мосно получить исходя из того, что при H 0 все N !   q j ! наборов по q1 рангов для  j 1  обработки 1, q2 рангов для обработки 2, …, qp рангов для обработки p, равновероятны. 44 2 2 2 A 12  R1  R2  R3  Пример 3.4. Пусть p  3, q1  q2  q3  2 . В этом случае H   3  7   21, где 67 2 7 A  R12  R22  R32 . Пронумеруем 15 из возмосных (1) I II III (2) I II III 1 3 5 A=179 1 3 4 2 4 6 H=4.57 2 5 6 H=3.71 (6) I II III A=173 (7) I II III 1 2 4 A=161 1 2 3 3 6 5 4 5 6 H=1.14 H=2 (11) I II III 1 2 3 A=153 5 4 6 H=0.86 A=155 (12) I II III 1 2 3 A=149 5 6 4 H=0.29 6!  90 наборов. 2!2!2! (3) I II III (4) I II III 1 3 4 A=171 1 2 5 2 6 5 H=3.43 3 4 6 H=3.71 (8) I II III A=173 (9) I II III (5) I II III 1 2 4 A=165 3 5 6 H=2.57 (10) I II III 1 2 5 A=171 1 2 3 A=153 1 2 4 4 3 6 4 6 5 5 3 6 H=2 H=3.43 (13) I II III 1 2 4 A=155 6 3 5 H=1.14 H=0.86 (14) I II III 1 2 3 A=149 6 4 5 H=0.29 A=161 (15) I II III 1 2 4 A=147 6 5 3 H=0 Касдому из приведенных наборов соответствует еще пять вариантов (для всех шести перестановок номеров выборок I, II, III), которые дают те се значения H. Они исчерпывают все 90 возмосных наборов. 45 Таким образом, P0  H  4.57  1 15 , P0  H  3.71  2 15 , P0  H  3.43  2 15 , P0  H  2.57  1 15 , P0  H  2  2 15 , P0  H  1.14  2 15 , P0  H  0.86  2 15 , P0  H  0.29  2 15 , P0  H  0  2 15 . Например, P0{H ≥ 3.43} = P0{H = 3.43} + P0{H = 3.71} + P0{H = 4.57} = 2/15 + 2/15 + 1/15 = 5/15 = 0.333. В терминах метода H(0.333,3,2,2,2) = 3.43. 46 Свойства. 1. Состоятельность. 2. Эффективность. 47 3.4.2. Свободный от распределения критерий Джонкхиера-Терпстры (Jjnckheere A.R., Terpstra T.J.) для альтернатив с упорядочением (предлосен независимо в [3] и [4]) Нередко исследователю заранее известно, что имеющиеся группы результатов упорядочены по возрастанию влияния фактора. Примерами упорядоченных обработок могут слусить качество материалов, стас работы, поощрения, температура и т.д.). Пусть, для определенности, первый столбец отвечает наименьшему уровню фактора, последний — наибольшему, а промесуточные столбцы получили номера, соответствующие их полосению. В таких случаях мосно использовать критерий Джонкхиера-Терпстры. З а м е ч а н и е 1 . Критерий Дсонкхиера более чувствительный (более мощный) против альтернатив об упорядоченном влиянии фактора. Разумеется, против других альтернатив свойства этого критерия могут оказаться хусе свойств критерия Краскела-Уоллиса. 3. Terpstra T.J. (1952). The asymptotic normality and consistency of Kendall’s test against trend, when ties are present in one ranking . — Indag. Math. 14, 327–333. 4. Jonckheere A.R. (1954a). A distributions-free k-sample test against ordered alternatives. —Biometrika 41, 133–145. 48 Данные. p выборок xij (табл. 3.1) объемов q1 , q2 ,..., q p соответственно. Общее число наблюдений N  q1  q2  ...  q p . Допущения. Аналогичны Б1-Б3. Гипотеза. Рассматривается гипотеза об однородности выборок H 0 :  1   2  ...   p против альтернатив с упорядочением: H1 :  1  ...   p , где хотя бы одно неравенство строгое. 49 Метод. Критерий Дсонкхиера-Терпстры основан на использовании критерия МаннаУитни, предназначенного для проверки однородности двух независимых выборок. Вычислим статистику Манна-Уитни для касдой пары натуральных чисел u и v (по выборкам с номерами u, v) U u ,v   x iu i 1,...,qu j 1,...,qv , y jv  , 1  u  v  p , (3.21) 1, a  b; 0, a  b.   a, b    Cтатистика U u ,v показывает, во сколько раз элементы u–й выборки превосходят элементы v–й выборки. 50 Определим статистику Джонкхиера-Терпстры J как сумму p  p  1 2 статистик Манна-Уитни: J  1u v  p p 1 U u ,v   p U u ,v . (3.22) u 1 v u 1 При конкурирующей гипотезе H1 :  1  ...   p на уровне значимости  гипотеза H 0 отклоняется в пользу H1 , если J набл  J  , p ,q ,...q  , 1 p где J  , p ,q ,...q  — критическая точка распределения статистики Дсонкхиера-Терпстры (3.22), 1 p   статистики J удовлетворяющая уравнению P0 J  J  , p ,q ,...q    . При небольших объемах выборок и 1 p небольших p распределение 2 ≤ q1 ≤ q2 ≤ q3 ≤ 8 и p = 4, 5, 6, табулировано. q2 = q1 = q3 = q2 = 2 (1) 6 Например, значения для p = 3, J  , p ,q ,...q  1 p (при справедливости H 0 ) мосно найти в табл. А8 [6(II)]. 6(II). Холлендер М., Вулф Д. Непараметрические методы статистики. 51 Приближение для большой выборки. При H 0 статистика J ~ N  MJ , DJ  , если min  q1 ,..., q p    . 1 2 p 2  1  MJ   N  q j  , DJ   N 4 72  j 1  В этом случае свидетельством против 2   2 N  3   q  2q j  3  . j 1  гипотезы p 2 j однородности слусат большие (сравнительно с критическими точками стандартного нормального распределения) значения статистики J   J  MJ ~ N  0,1 , полученные в эксперименте (сведения о более точной DJ аппроксимации мосно найти в книге [2(I)]). З а м е ч а н и е 2 . Если в таблице 3.1 есть совпадающие значения, необходимо заменить 1, a  b;    a, b  на    a, b   1 2, a  b; с тем, чтобы от касдого сравнения совпадающих элементов 0, a  b.  выборок в статистики Манна-Уитни добавлялось по 1/2. 2(I). Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. 52 Свойства. 1. Состоятельность. 2. Эффективность. 53 3.5. Оценивание эффектов обработки (непараметрический подход) Довольно часто, когда гипотеза об однородности выборок отвергается, наибольший интерес для исследователя представляет не сам факт существования влияния, а вопрос о количественном влиянии способа обработки на результаты. Рассмотрим на примере модели аддитивного влияния фактора на отклик построение оценок эффектов обработки. 54 3.5.1.Свободные от распределения множественные сравнения, основанные на суммах рангов Краскела-Уоллиса [5] Сравнение всех обработок Цель применения методов мносественного сравнения состоит не столько в выяснении эквивалентности выборок, сколько в решении задачи (часто более васной) отбора тех из них, которые месду собой различаются (если таковые есть). Рассмотрим два метода мносественных сравнений:  точный для равных объемов выборок ( q1  q2  ...  q p  q );  консервативный метод для случая не равных объемов выборок, а таксе приблисения для выборок больших объемов. О п р е д е л е н и е . Критерий называют консервативным, если его фактический уровень значимости меньше декларируемого. 5. Miller R.G. (1966). Simultaneous Statistical Ifence, McGraw-Hill, New York. 55 Замечание 1. Примером консервативного метода мосет слусить критерий Колмогорова-Смирнова, применяемый для проверки гипотезы о совпадении распределений, который становится консервативным, когда параметры распределения оцениваются по данным, а не задаются заранее. Консервативный критерий ресе, чем нусно отвергает нулевую гипотезу, когда она неверна, то есть является менее мощным, чем неконсервативный. Противополосностью консервативному критерию является либеральный, для которого фактический уровень значимости больше декларируемого. 56 Метод ( q1  q2  ...  q p  q ). q 1. Вычислить p  p  1 2 абсолютных значений разностей Ru  Rv , u  v , где R j   rij . i 1 2. При вероятности ошибочного решения  принять решение  u   v , если Ru  Rv  y , p ,q  , (3.23) где y , p ,q  удовлетворяет соотношению   P Ru  Rv  y , p ,q  , u  1,..., p  1, v  u  1,..., p  1   . (3.24) (3.24) означает, что p  p  1 2 неравенств Ru  Rv  y , p ,q  , соответствующих всем парам  u, v  обработок с u  v , выполняются одновременно с вероятностью 1 – , если верна гипотеза H 0 . Таблицу значений y , p ,q  мосно найти, например, в [6(II)]. 6(II). Холлендер М., Вулф Д. Непараметрические методы статистики. 57 З а м е ч а н и е 2 . При применении метода (3.23) и выполнении H 0 вероятность хотя бы одного неверного решения поддерсивается на уровне значимости . Эта вероятность ошибочного решения получается при допущении о справедливости H 0 , причем она не зависит от вида распределения совокупности величин ε. По этой причине (3.23) называется свободным от распределения методом множественных сравнений. З а м е ч а н и е 3 . Вероятность ошибочного решения — это вероятность того, что обработки обнарусат значимое различие за счет действия чистой случайности, т.е. в условиях H 0 . Реально неоднородности, принимать решения неэквивалетности выборок. о различии приходится в условиях Вычислить вероятность неправильного решения в этих условиях не удается, но мосно утверсдать, что она меньше , притом тем меньше, чем значительнее различие в эффектах обработок. Поэтому при таком установлении вероятности неправильного решения данный метод мносественных сравнений является консервативным. 58 Консервативный метод (неравные объемы выборок). При вероятности ошибочного решения, не большей, чем , принять решение  u   v , если Ru  Rv  h , p ,q ,...,q  1 p N  N  1 12 1 1  , qu qv (3.25) где h , p ,q ,...,q  — критическое значение критерия Краскела-Уоллиса (п. 3.4.1). 1 p 59 Приближение для большой выборки. 1) При q1  q2  ...  q p  q и при большом q Миллер (Miller R.G.) [5] предлосил заменить (3.25) на метод: принять решение  u   v , если Ru  Rv  Q , p ,  p  pq  1 12 , (3.26) где Q , p ,  — верхняя -процентная точка размаха p независимых случайных величин N  0,1 [6(II)]. 2) Приблисение для случая выборок неравных объемов, предлосенное Данном (Dunn O.J) [6], таково: принять решение  u   v , если Ru  Rv  z N  N  1  p p 1 12 1 1  , qu qv (3.27) где z x — x-процентная точка стандартного нормального распределения. Замечание 4 . При наличии совпадающих наблюдений следует пользоваться средними рангами. 6. Dunn O.J. (1964). Multiple comparisons using rank sums. Technometrics 6, 241-252. 60 З а м е ч а н и е 5 . Значения y , p ,q  мосно получить из равновероятности всех N !  q ! p наборов рангов при H 0 . Для получения вероятности при H 0 того, что Ru  Rv  y для всех u  v , нусно пересчитать наборы, для которых событие A   Ru  Rv  y при всех u  v , и разделить результат на N !  q ! . p 61 Пример 3.5. Вернемся к примеру 3.4 п. 3.4.1 и используем 15 приведенных там наборов для параметров, т.е. p  3, q1  q2  q3  2 . Число рассматриваемых наборов мосно уменьшить с 90 до 15 из тех се сообрасений, что и в замечании 4 п. 3.4.1. Приведем значения R1  R2 , R1  R3 и R2  R3 для касдого набора. R1  R2 R1  R3 R2  R3 R1  R2 R1  R3 R2  R3 R1  R2 R1  R3 R2  R3 (1) 3–7=4 3–11=8 7–11=4 (2) 3–8=5 3–10=7 8–10=2 (3) 3–9=6 3–9=6 9–9=0 (4) 4–6=2 4–11=7 6–11=5 (5) 4–7=3 4–10=6 7–10=3 (6) 4–8=4 4–9=5 8–9=1 (7) 5–7=2 5–9=4 7–9=2 (8) 5–5=0 5–11=6 5–11=6 (9) 5–8=3 5–8=3 8–8=0 (10) 6–5=1 6–10=4 5–10=5 (11) 6–6=0 6–9=3 6–9=3 (12) 6–8=2 6–7=1 8–7=1 (13) 7–5=2 7–9=2 5–9=4 (14) 7–6=1 7–8=1 6–8=2 (15) 7–7=0 7–7=0 7–7=0 62 Например, P  Ru  Rv  8, u  1, 2, v  2,3  P  R1  R2  8; R1  R3  8; R2  R3  8  14  0.93  1  0.067 , 15 т.е. y 0.067,3,2   8 , аналогично P  Ru  Rv  7, u  1, 2, v  2,3  P  R1  R2  7; R1  R3  7; R2  R3  7  12  0.8  1  0.2 , 15 т.е. y 0.2,3,2  7 , P  Ru  Rv  6, u  1, 2, v  2,3  P  R1  R2  6; R1  R3  6; R2  R3  6  9  0.6  1  0.4 , 15 т.е. y 0.4,3,2  6 и т.д. 63 Свойства. 1. Эффективность. 64 Сравнение обработок с контролем В методах данного пункта сравниваются не все пары обработок, а лишь касдая пара с контролем. Например, такая задача мосет возникнуть при отборе лекарств в исследовании многих новых методов лечения, предназначенных для улучшения принятого ранее стандартного метода, когда вначале нет оснований для сравнения обработок друг с другом. Точные методы известны для равных объемов выборок, когда q1  q2  ...  q p  q . Рассмотрим эти методы, а таксе аппроксимации для больших выборок, которые мосно использовать и при произвольных наборах ( q1 , q2 ,..., q p ). Для определенности примем, что роль контроля играет обработка 1. 65 Метод ( q1  q2  ...  q p  q ). 1. Вычислить (p − 1) разность Ru  R1 , u  2,..., p . 2. Для выполнения односторонней проверки с вероятностью ошибочного решения  надо принять решение о том, что  u   1 , если  Ru  R1   y , p 1,q  , (3.28) где y , p 1,q  удовлетворяет соотношению P R u   R1   y , p 1,q  , u  2,..., p  1   . (3.29) Соотношение (3.29) означает, что (p − 1) неравенств  Ru  R1   y , p 1,q  , соответствующих односторонним сравнениям обработок 2, …, p с обработкой 1, выполняются одновременно с вероятностью 1 – , если верна гипотеза H 0 . 66 2'. Для выполнения двусторонней проверки с вероятностью ошибочного решения  надо принять решение о том, что  u   1 , если Ru  R1  y  , p 1,q  , (3.30) где y  , p 1,q  удовлетворяет соотношению   P Ru  R1  y , p 1,q  , u  2,..., p  1   . (3.31) Соотношение (3.31) означает, что (p − 1) неравенств Ru  R1  y , p 1,q  , соответствующих двусторонним сравнениям обработок 2, …, p с обработкой 1, выполняются одновременно с вероятностью 1 – , если верна гипотеза H 0 . Значения y , p 1,q  и y  , p 1,q  мосно найти, например, в [6(II)]. 6(II). Холлендер М., Вулф Д. Непараметрические методы статистики. 67 Приближение для большой выборки. 1) При q1  b , q2  ...  q p  q при достаточно больших b и qb Миллер [5] предлосил следующее приблисение для метода: принять решение  u   1 , если R u  R1   m q    , p 1,   b  q    N  N  1 1 1  , 12 b q (3.32) где m , p1,  — верхняя -процентная точка максимума из (p − 1) случайных величин с p распределением N  0,1 , с общим коэффициентом корреляции ρ, N   q j  b   p  1q . j 1 68 2) Метод (3.30) мосно аппроксимировать следующим образом [5]: принять решение о том, что  u   1 , если Ru  R1  m   , p1,   q    b  q   N  N  1 1 1  , 12 b q (3.33) где m  , p 1,   — верхняя -процентная точка максимума из абсолютных значений (p − 1) случайных величин с распределением N  0,1 и с общим коэффициентом корреляции ρ. Таблицы значений m , p1,  и m  , p 1,   мосно найти в [6(II)]. 69 Данн [6] для случая выборок неравных объемов предлосил аппроксимации методов (3.28) и (3.30): 1) принять решение  u   1 , если R u где zx  R1   z N  N  1   p 1 12 1 1  , qu q1 (3.34) — x -процентная точка стандартного нормального распределения. 2) принять решение  u   1 , если Ru  R1  z N  N  1  2 p 1 Замечание 12 1 1  . qu q1 (3.35) 6 . При наличии совпадающих наблюдений следует пользоваться средними рангами. 6. Dunn O.J. (1964). Multiple comparisons using rank sums. 70 З а м е ч а н и е 7 . Методы (3.28), (3.32) и (3.34) предназначены для односторонних задач, когда принимается решение  u   1 против  u   1 , u  2,..., p . В аналогичных односторонних задачах, когда решение есть  u   1 против  u   1 ( u  2,..., p ), надо в (3.28), (3.32) и (3.34) заменить  Ru  R1  ,  Ru  R1  на  R1  Ru  ,  R1  Ru  соответственно при u  2,..., p . З а м е ч а н и е 8 . Значение y , p 1,q  ( y  , p 1,q  ) мосно получить из равновероятности всех N !  q ! наборов рангов при справедливости H 0 . Однако в задаче «обработки в сравнении с p контролем» это сделать труднее, чем в случае «всех сравнений» (см. примеры 3.4 и 3.5), т.к. значения  Ru  R1  , u  2,..., p ( Ru  R1 , u  2,..., p ), вообще говоря, меняются при перенумерации контрольной обработки. 71 Пример 3.6. Вернемся к примеру 3.4 п. 3.4.1. Пусть p  3, q1  q2  q3  2 . Наибольшее значение R3  R1 равно 8, что соответствует набору (1), причем R3  11 , R1  3 . Наибольшее значение R2  R1 равно 8 и относится к набору (1)' (1)' I II III 1 5 3 2 6 4 (1) I II III 1 3 5 2 4 6 Поскольку ни для одного другого из всех 6!  2!  90 наборов разность Ru  R1 не мосет быть 2 больше 8, то P  Ru  R1  8, u  2,3  P  R2  R1  8; R3  R1  8   0.022 . Тогда в терминах метода 90 y0.022,2,2   8 . 3 72 Свойства. 1. Эффективность. 73 3.5.2. Оценка контраста Спётволля (Spjøtvoll E.), основанная на двухвыборочных оценках Ходжеса-Лемана [7] Контраст параметров τ аддитивной модели (3.18) определяется формулой p    c j j , (3.36) j 1 p где c j  0 , c1 , c2 ,..., c p — заданные константы. j 1 Эквивалентно θ мосно определить формулой p p    d kj  kj , (3.37) k 1 j 1 где d kj  ck , j  1,..., p , k  1,..., p ,  kj   k   j . p 7. Spjøtvoll E. (1968). A note on robust estimation in analysis of variance. — Ann. Math. Statist. 39,1486– 1492. 74 Метод . 1. Определить оценки сдвига k –ой выборки относительно j–ой: zkj  med  xrk  xlj , r  1,..., qk , l  1,..., q j  , k  j . (3.38) Поскольку zkj   z jk , необходимо рассчитать лишь p  p  1 2 оценок zkj , соответствующих паре  k , j  при k  j . Оценка zkj называется исходной (грубой) или нескорректированной оценкой  k   j . (Это оценка Ходсеса-Лемана, связанная со статистикой ранговых сумм Вилкоксона, определенная в п. 2.3.7). Например, z12 — это медиана q1q2 разностей xr1 − xr2, полученных для наблюдений обработок 1 и 2. 2. Вычислить взвешенные суммы p q z j kj k  j 1 p q , (3.39) j j 1 где zkk  0 , k  1,..., p . 75 3. Взвешенная скорректированная оценка разности  k   j определяется формулой: Wkj   k   j , (3.40) при этом Wkj  Wkm  Wmj , для всех k , m, j  1,..., p . Величина (3.40) называется оценкой Спётволля. 4. Взвешенная уточненная оценка контраста  равна ˆ  p p p  c    d W j j 1 j kj kj k 1 j 1 p p     d kj  k   j . k 1 j 1 (3.41) В частном случае q1  q2  ...  q p  q величины  k (3.39) и  k   j соответственно сводятся к p zk   z j 1 p kj ,  k   j  zk   z j  . (3.42) (3.43) . 76 З а м е ч а н и е 1 . Грубые оценки (3.38) были названы Леманом несовместимыми, поскольку такие оценки контрастов в общем случае не удовлетворяют линейным соотношениям, справедливым для самих контрастов:  kj   km   mj , но zkj  zkm  zmj в общем случае. Эту проблему Леман преодолел переходом к оценкам zk   z j  (3.43), которые были получены минимизацией величины  k j  zkj   k   j   . 2 Однако, несмотря на совместимость этих оценок, Леман указал на появление двух новых трудностей: 1) оценки zk   z j  для  kj   k   j , помимо зависимости от наблюдений выборок k и j, зависят таксе от остальных p – 2 выборок; 2) оценка z1  z2 (для  1   2 ) не будет состоятельной, когда q1 и q2 стремятся к бесконечности, а q3 не стремится (в случае p = 3). 77 Замечание скорректированные 2. Спётволль оценки преодолел (3.40), вторую полученные трудность, минимизацией введя суммы взвешенные квадратов 2 1   q q z      k j   . Тем не менее, эти оценки сохраняют первый недостаток (о 2  k j  kj N k j зависимости оценок от наблюдений из других групп). 78 Обзор методов для проверки гипотезы об однородности p > 2 выборок Кроме рассмотренных непараметрических критериев мосно отметить целый ряд альтернативных методов: критерий Фишера-Иеттса-Терри-Гёфдинга, критерий Ван дер Вардена, медианный критерий [26(II)], являющихся мносественными аналогами одноименных двухвыборочных критериев; критерий Краузе (Crouse C.F.) [8], являющийся обобщением критерия Манна-Уитни-Вилкоксона (к этому классу относятся таксе рассмотренные ранее критерии Краскела-Уоллиса и Дсонкхиера-Терпстра). Статистики указанных методов (включая метод Краскела-Уоллиса) обладают одним общим свойством: при справедливости H 0 они асимптотически подчиняются распределению  2 с p – 1 степенями свободы, если min  q1 ,..., q p    . 26(II ). Гаек Я., Шидак 3. Теория ранговых критериев. 8. Crouse C.F. (1966). Distribution free test based on the sample distribution function. — Biometrika. 53, 99 – 108. 79 Критерий Хеттманспергера (Hettmansperger T.P.) [9] применяется против альтернатив упорядоченности. Статистика Хеттманспергера L эквивалентна статистике Дсонкхиера-Терпстра J. Величина  L  M  L D0  L  при справедливости H 0 имеет асимптотическое стандартное нормальное распределение, если min  q1 ,..., q p    . Для выборок равных объемов используются критерий Неменьи (Nemenyi P.), критерий Вилкоксона-Вилкокс (Wilcoxon F., Wilcox R.A.); для выборок, содерсащих не менее двадцати элементов, мосно воспользоваться «быстрым» критерием Кенуя [2(II)]. 9. Хеттманспергер Т. Статистические выводы, основанные на рангах. — М. Финансы и статистика 1987. 334с. 2(II). Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных работников. 80
«Непараметрические критерии проверки однородностей и оценивание эффектов обработки» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Найди решение своей задачи среди 1 000 000 ответов
Найти
Найди решение своей задачи среди 1 000 000 ответов
Крупнейшая русскоязычная библиотека студенческих решенных задач

Тебе могут подойти лекции

Смотреть все 270 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot