Прикладная математика
  • Регистрация
1 1 1 1 1 1 1 1 1 1 Рейтинг 0.00 (0 Голоса)

Статистический критерий проверки основной гипотезы.

Наблюдаемое значение критерия.

Для проверки основной гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Эта случайная величина имеет нормальное распределение: распределение Фишера-Снедекора, либо распределение Стьюдента, либо распределение. Мы не будем рассматривать конкретный вид распределения и в целях общности обозначим рассматриваемую случайную величину

Статистическим критерием (или просто критерием) называют случайную величину , которая служит для проверки основной гипотезы.

Например, если проверяют гипотезу о равенстве дисперсий двух нормальных генеральных совокупностей, то в качестве критерия принимают отношение исправленных выборочных дисперсий:

Эта величина случайная, потому, что в различных опытах дисперсии будут принимать различные, наперед неизвестные значения и распределена по закону Фишера-Снедекора.

Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин, и таким образом получают частное (наблюдаемое) значение критерия.

Наблюдаемым (эмпирическим) значением называют значение критерия, вычисленное по выборкам.

Например, если по двум выборкам, извлеченных из нормальных генеральных совокупностей, найдены исправленные выборочные дисперсии и то наблюдаемое значение критерия

Критическая область. Область принятия гипотезы. Критические точки.

После выбора определенного критерия, множество всех возможных его значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых основная гипотеза отвергается, а другое – при которых она принимается.

Критической областью называют совокупность значений критерия, при которых основная гипотеза должна быть отвергнута.

Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых основная гипотеза принимается как верная.

Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если же наблюдаемое значение критерия принадлежит области допустимых значений – гипотезу принимают.

Поскольку критерий одномерная случайная величина, все ее значения принадлежат некоторому интервалу. Также и критическая область и область принятия гипотезы являются интервалами. Таким образом, естественно предположить, что существуют и точки, которые их разделяют. Их называют критическими точками и обозначают .

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

Правосторонней называют критическую область, определяемую неравенством , где –положительное число.

 

Левосторонней называют критическую область, определяемую неравенством , где –отрицательное число.

 

Односторонней называют правостороннюю или левостороннюю критическую область.

 

Двусторонней называют критическую область, определяемую неравенствами: где

Замечание: Если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами (в предположении что ):

или равносильным неравенством: .

Отыскание правосторонней критической области.

Для отыскания правосторонней критической области достаточно найти критическую точку. С этой целью зададимся достаточно малой вероятностью – уровнем значимости . Затем найдем критическую точку , исходя из требования, чтобы, при условии справедливости основной гипотезы, вероятность того, что критерий примет значение, больше , была равна принятому уровню значимости:

(IV.9)

Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию.

Замечание 1. Когда критическая точка уже найдена, вычисляют по данным выборок наблюдаемое значение критерия и, если окажется, что , то основную гипотезу отвергают; в противном случае – нет оснований отвергать основную гипотезу (что вовсе не означает, что альтернативная (конкурирующая) гипотеза верна).

Замечание 2. Наблюдаемое значение критерия может оказаться большим не потому, что основная гипотеза ложна, а по другим причинам (малый объем выборки, недостатки методики эксперимента и другие). В этом случае, отвергнув правильную основную гипотезу, совершают ошибку первого рода. Вероятность этой ошибки равна уровню значимости . Таким образом, пользуясь требованием (IV.9), с вероятностью имеет место риск совершить ошибку первого рода.

Заметим, что в книгах по контролю качества продукции, вероятность признать негодной партию годных изделий называют «риском производителя», а вероятность принять негодную партию – «риском потребителя».

Замечание 3. Предположим, что основная гипотеза принята; ошибочно думать, что тем самым она доказана. Действительно, известно, что один пример, подтверждающий справедливость некоторого общего утверждения еще не доказывает его. Поэтому более правильно говорить «данные наблюдений согласуются с основной гипотезой и, следовательно, не дают оснований ее отвергнуть».

На практике для большей уверенности принятия гипотезы, ее проверяют другими способами, или повторяют эксперимент, увеличивая объем выборки.

Отвергают гипотезу более категорично, чем принимают. Действительно, известно, что достаточно привести один пример, противоречащий некоторому общему утверждению, чтобы это утверждение отвергнуть. Если оказалось, что наблюдаемое значение критерия принадлежит критической области, то этот факт и служит примером, противоречащим основной гипотезе, что позволяет ее отклонить.

Отыскание левосторонней и двусторонней критических областей.

Также как и для правосторонней критической области, отыскание левосторонней и двусторонней областей сводится к отысканию критических точек.

Левосторонняя критическая область определяется соотношением:

Критическую точку находят, исходя из требования, чтобы при справедливости основной гипотезы, вероятность того, что критерий примет значение, меньшее , была равна принятому уровню значимости

Двусторонняя критическая область определяется соотношением:

Критические точки находят, исходя из требования, чтобы, при справедливости основной гипотезы, сумма вероятностей того, что критерий примет значение меньшее, чем или большее, чем , была равна принятому уровню значимости:

(IV.10)

Очевидно, что критические точки могут быть выбраны неоднозначно. Если распределение критерия симметрично относительно нуля и имеются основания (например, для увеличения мощности критерия[1]) выбрать симметричные относительно нуля точки и (), то

Учитывая (IV.10), получим:

Это соотношение и служит для отыскания критических точек двусторонней критической области.

Некоторые дополнительные сведения о выборе критической области. Мощность критерия.

Критическая область строилась, исходя из требования, чтобы вероятность попадания в нее критерия была равна , при условии, что основная гипотеза справедлива. Более целесообразно ввести в рассмотрение вероятность попадания критерия в критическую область при условии, что основная гипотеза неверна, а справедлива конкурирующая гипотеза.

Определение 8: Мощностью критерия называют вероятность попадания критерия в критическую область, при условии, что справедлива конкурирующая гипотеза.

Другими словами, мощность критерия есть вероятность того, что основная гипотеза будет отвергнута, если верна конкурирующая гипотеза.

Пусть для проверки гипотезы принят определенный уровень значимости, и выборка имеет определенный фиксированный объем. Наблюдается определенного рода произвол в выборе критической области. Покажем, что ее целесообразно построить так, чтобы мощность критерия была максимальной.

Предварительно убедимся, что, если вероятность ошибки второго рода (принять неверную гипотезу) равна то мощность критерия равна Действительно, если вероятность ошибки второго рода, то есть события «принята основная гипотеза, причем справедлива конкурирующая», то вероятность противоположного события «отвергнута основная гипотеза, причем справедлива конкурирующая», то есть мощность критерия

Пусть мощность критерия возрастает; следовательно, уменьшается вероятность совершить ошибку второго рода, что, конечно, желательно.

Замечание 1. Поскольку вероятность события «ошибка второго рода допущена» равна , то вероятность противоположного события «ошибка второго рода не допущена» равна то есть мощности критерия. Отсюда следует, что мощность критерия есть вероятность того, что не будет допущена ошибка второго рода.

Замечание 2. Ясно, что, чем меньше вероятность ошибок первого и второго рода, тем критическая область «лучше». Однако, при заданном объеме выборки уменьшить одновременно и и невозможно: если уменьшать , то будет возрастать. Например, если принять , то будут приниматься все гипотезы, в том числе и неправильные, то есть возрастает вероятность (ошибки второго рода).

Тогда естественно задавать вопрос: «Как выбрать значение наиболее целесообразно?» Ответ на этот вопрос зависит от «тяжести последствий» ошибок для каждой конкретной задачи. Например, если ошибка первого рода повлечет большие потери, а второго – малые, то следует принять, возможно, меньшее значение .

Если уже выбрано, то, пользуясь известной теоремой Неймана-Пирсона, можно построить критическую область, для которой будет минимальным и, следовательно, мощность критерия максимальной.

Замечание 3. Единственный способ одновременного уменьшения вероятности ошибок первого и второго рода состоит в увеличении объема выборки.

[1] Определение мощности критерия см. далее.

Добавить комментарий


Защитный код
Обновить