Уровень значимости и мощность
При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок. Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна.
Вероятность ошибки первого рода называется уровнем значимости и обозначается α. Таким образом, α = P{UΨ |H0}, т.е. уровень значимости α – это вероятность события {UΨ}, вычисленная в предположении, что верна нулевая гипотезаН0.
Уровень значимости однозначно определен, если Н0 – простая гипотеза. Если же Н0 – сложная гипотеза, то уровень значимости, вообще говоря, зависит от функции распределения результатов наблюдений, удовлетворяющей Н0. Статистику критерия Uобычно строят так, чтобы вероятность события {UΨ} не зависела от того, какое именно распределение (из удовлетворяющих нулевой гипотезеН0) имеют результаты наблюдений. Для статистик критерия U общего вида под уровнем значимости понимают максимально возможную ошибку первого рода. Максимум (точнее, супремум) берется по всем возможным распределениям, удовлетворяющим нулевой гипотезе Н0, т.е. α = sup P{UΨ |H0}.
Если критическая область имеет вид, указанный в формуле, то P{U > C | H0} = α. Если С задано, то из последнего соотношения определяют α. Часто поступают по иному - задавая α (обычно α = 0,05, иногда α = 0,01 или α = 0,1, другие значения α используются гораздо реже), определяют С из уравнения (10), обозначая его Сα, и используют критическую область Ψ = {U > Cα} с заданным уровнем значимости α.
Вероятность ошибки второго рода есть P{UΨ |H1}. Обычно используют не эту вероятность, а ее дополнение до 1, т.е. P{UΨ | H1} = 1 - P{UΨ |H1}. Эта величина носит название мощности критерия. Итак, мощность критерия – это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.
Понятия уровня значимости и мощности критерия объединяются в понятии функции мощности критерия – функции, определяющей вероятность того, что нулевая гипотеза будет отвергнута. Функция мощности зависит от критической области Ψ и действительного распределения результатов наблюдений. В параметрической задаче проверки гипотез распределение результатов наблюдений задается параметром θ. В этом случае функция мощности обозначается М(Ψ,θ) и зависит от критической области Ψ и действительного значения исследуемого параметра θ. Если
Н0: θ = θ0,
Н1: θ = θ1, то
М(Ψ,θ0) = α,
М(Ψ,θ1) = 1 – β,
где α – вероятность ошибки первого рода, β - вероятность ошибки второго рода. В статистическом приемочном контроле α – риск изготовителя, β – риск потребителя. При статистическом регулировании технологического процесса α – риск излишней наладки, β – риск незамеченной разладки.
Функция мощности М(Ψ,θ) в случае одномерного параметра θ обычно достигает минимума, равного α, при θ = θ0, монотонно возрастает при удалении от θ0 и приближается к 1 при | θ - θ0 | → ∞.
В ряде вероятностно-статистических методов принятия решений используется оперативная характеристика L(Ψ,θ) - вероятность принятия нулевой гипотезы в зависимости от критической области Ψ и действительного значения исследуемого параметра θ. Ясно, что L(Ψ,θ) = 1 - М(Ψ,θ).
- 3. Этапы научного исследования.
- 4. Принципы научного исследования.
- 5. Типы научного исследования.
- 6. Отличия критического исследования от поискового и воспроизводящего.
- 7 Вопрос. Научная теория, ее структура и функции.
- 8 Вопрос. Проблема и гипотеза.
- 9 Вопрос. Выбор темы научного исследования
- 10 Вопрос. Изучение научной литературы
- 11 Вопрос. Методологические аспекты исследования малой группы
- 12 Вопрос. Логика научного исследования.
- Вопрос 13 Проблема и тема исследования
- Вопрос 14 Объект и предмет исследования
- Вопрос 15 Цели и задачи исследования
- Вопрос 16 Гипотеза
- Вопрос 17 Этапы исследования
- Вопрос 18 Личностные качества психолога-практика
- 19. Классификация методов психологического исследования Классификация методов психологического исследования.
- 20. Эмпирические методы в психологическом исследовании
- 21. Личность и деятельность эксперементатора.
- 22. Личность испытуемого и его деятельность в псих эксперименте.
- 24. Планирование эксперимента.
- 25. Основные эксперементальные планы
- 26. Взаимодействие независимых переменных, виды взаимодействия.
- 27. Корреляционное исследование и его планирование. Понятие признаков и переменных.
- 28. Шкалы измерения.
- 29. Распределение признака. Параметры распределения. Понятие о нормальном распределении
- 30. Понятие статистических гипотез.
- 31. Статистические критерии: параметрические и непараметрические, их возможности и ограничения.
- Понятие о статистическом критерии
- Уровень значимости и мощность
- Состоятельность и несмещенность критериев
- 32. Понятие уровней статистической значимости.
- 36. Представление результатов исследования
- 37. Использование таблиц, графиков, диаграмм эмпирического исследования в области практической психологии