![]() |
Одной из часто встречающихся статистических проблем является проверка гипотез относительно математического ожидания исследуемых выборок. Существует целый ряд статистических тестов, называемых t-тестами Стьюдента, проверяющих различные гипотезы относительно математического ожидания.
Этот тест используется для проверки гипотезы о том, что математическое ожидание случайной величины X, представленной выборкой xS , имеет заданное значение μ. Тест требует, чтобы переданная в него выборка являлась выборкой нормальной случайной величины.
В процессе своей работы тест вычисляет t-статистику

Если величина X распределена нормально, то статистика t будет иметь распределение Стьюдента с N-1 степенями свободы. Это позволяет нам использовать распределение Стьюдента для определения уровня значимости, соответствующего полученному значению t-статистики.
Замечание #1
В случае, если X не является нормальной случайной величиной, то величина t будет иметь другое, неизвестное распределение, и, строго говоря, t-тест Стьюдента нельзя применять. Однако в соответствии с центральной предельной теоремой при росте размера выборки распределение t будет стремиться к распределению Стьюдента. Таким образом, если размер выборки достаточно велик, то мы можем использовать t-тест, даже если требование нормальности распределения не выполняется. Однако не существует простого способа определить, какое N достаточно велико. В каждом конкретном случае есть своя граница, зависящая от того, насколько исследуемое распределение отклоняется от нормального. Некоторые источники приводят в качестве "достаточно большого N" 30, но даже этот размер выборки может оказаться недостаточен. Альтернативой в этом случае может являться непараметрический тест - критерий знаков или W-критерий Уилкоксона.
Этот тест проверяет гипотезу о том, что математические ожидания двух случайных величин X и Y, представленных выборками xS и yS , совпадают. Для корректной работы теста требуется выполнение следующих условий:
В процессе своей работы тест вычисляет t-статистику

Если величины X и Y распределены нормально, то статистика t будет иметь распределение Стьюдента с NX +NY -2 степенями свободы. Это позволяет нам использовать распределение Стьюдента для определения уровня значимости, соответствующего полученному значению t-статистики.
Замечание #2
В случае, если X или Y не является нормальной случайной величиной, то величина t будет иметь другое, неизвестное распределение, и, строго говоря, t-тест Стьюдента нельзя применять. Вместе с тем, в соответствии с центральной предельной теоремой при росте размера выборок распределение t будет стремиться к распределению Стьюдента. Таким образом, если размер выборок достаточно велик, то мы можем использовать t-тест, даже если требование нормальности распределений не выполняется. Однако не существует простого способа определить, какие NX и NY достаточно велики. В каждом конкретном случае есть своя граница, зависящая от того, насколько исследуемые распределения отклоняются от нормального. Некоторые источники приводят в качестве критерия NX +NY > 40, но даже настолько большие выборки могут оказаться недостаточными. Если вы не уверены в нормальности исследуемых распределений, имеет смысл обратиться к непараметрическому тесту - U-критерию Манна-Уитни.
Этот тест проверяет гипотезу о том, что математические ожидания двух случайных величин X и Y, представленных выборками xS и yS , совпадают. Для корректной работы теста требуется выполнение следующих условий (при этом равенство дисперсий не требуется):
В процессе своей работы тест вычисляет t-статистику

Если величины X и Y распределены нормально, то статистика t будет иметь распределение, близкое к распределению Стьюдента с числом степеней свободы DF:

Это позволяет нам использовать распределение Стьюдента для определения уровня значимости, соответствующего полученному значению t-статистики.
Замечание #3
В случае, если X или Y не является нормальной случайной величиной, то величина t будет иметь другое, неизвестное распределение, и, строго говоря, t-тест Стьюдента нельзя применять. Однако в соответствии с центральной предельной теоремой при росте размера выборок распределение t будет стремиться к распределению Стьюдента. Таким образом, если размер выборок достаточно велик, то мы можем использовать t-тест, даже если требование нормальности распределений не выполняется. Однако не существует простого способа определить, какие NX и NY достаточно велики. В каждом конкретном случае есть своя граница, зависящая от того, насколько исследуемые распределения отклоняются от нормального. Некоторые источники приводят в качестве критерия NX +NY > 40, но даже настолько большие выборки могут оказаться недостаточными. Если вы не уверены в нормальности исследуемых распределений, имеет смысл обратиться к непараметрическому тесту - U-критерию Манна-Уитни.
| C++ | studentttests subpackage | |
| C# | studentttests subpackage |
This article is intended for personal use only.
Исходный код на C#
Исходный код на C++
Исходный код на C++, использующий библиотеки MPFR/GMP.
Исходный код GMP доступен на сайте gmplib.org. Исходный код MPFR доступен на сайте www.mpfr.org.
Исходный код на Free Pascal.
Исходный код на Delphi.
Исходный код на VB.NET.
Исходный код на VBA.
Исходный код на Python (CPython и IronPython).
|
ALGLIB® - numerical analysis library, 1999-2012. |