Главная       Скачать       Коммерческая поддержка       FAQ       Forum       О нас       Английская версия

t-тесты Стьюдента

Одной из часто встречающихся статистических проблем является проверка гипотез относительно математического ожидания исследуемых выборок. Существует целый ряд статистических тестов, называемых t-тестами Стьюдента, проверяющих различные гипотезы относительно математического ожидания.

t-тест для одной выборки

Этот тест используется для проверки гипотезы о том, что математическое ожидание случайной величины X, представленной выборкой x, имеет заданное значение μ. Тест требует, чтобы переданная в него выборка являлась выборкой нормальной случайной величины.

В процессе своей работы тест вычисляет t-статистику

Если величина X распределена нормально, то статистика t будет иметь распределение Стьюдента с N-1 степенями свободы. Это позволяет нам использовать распределение Стьюдента для определения уровня значимости, соответствующего полученному значению t-статистики.

Замечание #1
В случае, если X не является нормальной случайной величиной, то величина t будет иметь другое, неизвестное распределение, и, строго говоря, t-тест Стьюдента нельзя применять. Однако в соответствии с центральной предельной теоремой при росте размера выборки распределение t будет стремиться к распределению Стьюдента. Таким образом, если размер выборки достаточно велик, то мы можем использовать t-тест, даже если требование нормальности распределения не выполняется. Однако не существует простого способа определить, какое N достаточно велико. В каждом конкретном случае есть своя граница, зависящая от того, насколько исследуемое распределение отклоняется от нормального. Некоторые источники приводят в качестве "достаточно большого N" 30, но даже этот размер выборки может оказаться недостаточен. Альтернативой в этом случае может являться непараметрический тест - критерий знаков или W-критерий Уилкоксона.

Подпрограмма StudentTTest1 возвращает три p-значения:

t-тест для двух выборок с равными дисперсиями

Этот тест проверяет гипотезу о том, что математические ожидания двух случайных величин X и Y, представленных выборками x и y, совпадают. Для корректной работы теста требуется выполнение следующих условий:

В процессе своей работы тест вычисляет t-статистику

Если величины X и Y распределены нормально, то статистика t будет иметь распределение Стьюдента с N+N-2 степенями свободы. Это позволяет нам использовать распределение Стьюдента для определения уровня значимости, соответствующего полученному значению t-статистики.

Замечание #2
В случае, если X или Y не является нормальной случайной величиной, то величина t будет иметь другое, неизвестное распределение, и, строго говоря, t-тест Стьюдента нельзя применять. Вместе с тем, в соответствии с центральной предельной теоремой при росте размера выборок распределение t будет стремиться к распределению Стьюдента. Таким образом, если размер выборок достаточно велик, то мы можем использовать t-тест, даже если требование нормальности распределений не выполняется. Однако не существует простого способа определить, какие N и N достаточно велики. В каждом конкретном случае есть своя граница, зависящая от того, насколько исследуемые распределения отклоняются от нормального. Некоторые источники приводят в качестве критерия N+N > 40, но даже настолько большие выборки могут оказаться недостаточными. Если вы не уверены в нормальности исследуемых распределений, имеет смысл обратиться к непараметрическому тесту - U-критерию Манна-Уитни.

Подпрограмма StudentTTest2 возвращает три p-значения:

t-тест для двух выборок с неравными дисперсиями

Этот тест проверяет гипотезу о том, что математические ожидания двух случайных величин X и Y, представленных выборками x и y, совпадают. Для корректной работы теста требуется выполнение следующих условий (при этом равенство дисперсий не требуется):

В процессе своей работы тест вычисляет t-статистику

Если величины X и Y распределены нормально, то статистика t будет иметь распределение, близкое к распределению Стьюдента с числом степеней свободы DF:

Это позволяет нам использовать распределение Стьюдента для определения уровня значимости, соответствующего полученному значению t-статистики.

Замечание #3
В случае, если X или Y не является нормальной случайной величиной, то величина t будет иметь другое, неизвестное распределение, и, строго говоря, t-тест Стьюдента нельзя применять. Однако в соответствии с центральной предельной теоремой при росте размера выборок распределение t будет стремиться к распределению Стьюдента. Таким образом, если размер выборок достаточно велик, то мы можем использовать t-тест, даже если требование нормальности распределений не выполняется. Однако не существует простого способа определить, какие N и N достаточно велики. В каждом конкретном случае есть своя граница, зависящая от того, насколько исследуемые распределения отклоняются от нормального. Некоторые источники приводят в качестве критерия N+N > 40, но даже настолько большие выборки могут оказаться недостаточными. Если вы не уверены в нормальности исследуемых распределений, имеет смысл обратиться к непараметрическому тесту - U-критерию Манна-Уитни.

Подпрограмма UnequalVarianceTTest возвращает три p-значения:

Ссылки по теме

  1. 'Hypothesis testing', Wikipedia
  2. 'P-value', Wikipedia
  3. 'T-test', Wikipedia

Manual entries

C++ studentttests subpackage   
C# studentttests subpackage   

This article is intended for personal use only.

Скачать ALGLIB

C#

Исходный код на C#

Downloads page

 

C++

Исходный код на C++

Downloads page

 

C++, арифметика высокой точности

Исходный код на C++, использующий библиотеки MPFR/GMP.

Исходный код GMP доступен на сайте gmplib.org. Исходный код MPFR доступен на сайте www.mpfr.org.

Downloads page

 

FreePascal

Исходный код на Free Pascal.

Downloads page

 

Delphi

Исходный код на Delphi.

Downloads page

 

VB.NET

Исходный код на VB.NET.

Downloads page

 

VBA

Исходный код на VBA.

Downloads page

 

Python

Исходный код на Python (CPython и IronPython).

Downloads page

 

 

ALGLIB® - numerical analysis library, 1999-2017.
ALGLIB is registered trademark of the ALGLIB Project.