Курсовая работа по математической статистике

Оглавление:

Введение

В основе научных знаний лежат наблюдения за изучаемыми объектами и процессами, присущими данным объектам. Однако, ясно, что единичное наблюдение вряд ли позволит сразу установить свойства наблюдаемого объкта. Поэтому для установления свойств и связей изучаемого объекта его приходится наблюдать многократно, а затем результаты наблюдений обрабатывать и лишь после этого делать выводы.

В математической статистике изучаются случайные величины и системы случайных величин при помощи наблюдений. В связи с этим в математической статистике (которая достаточно долго развивалась независимо от теории вероятностей) случайные величины принято называть наблюдаемыми признаками.

Возможно эта страница вам будет полезна:

Предмет теория вероятностей и математическая статистика

Первичная обработка результатов измерений

К оглавлению…

Пусть рассматривается некоторый наблюдаемый признак Х. Назовем генеральной совокупностью наблюдаемого признака Х множество значений, которые может принимать этот наблюдаемый признак.

Набор значений Курсовая работа по математической статистике, являющихся результатами наблюдений (измерений) наблюдаемого признака Х, назовем выборкой объема п из генеральной совокупности.

Отметим, что на выборку можно смотреть с двух точек зрения:

1. Курсовая работа по математической статистике -результаты измерений (конкретные числа),

2. Курсовая работа по математической статистике — совокупность п случайных величин, имеющих такие же распределения как и наблюдаемый признак.

Разумеется, первой точки зрения на выборку придерживаются после проведения измерений, а второй – до проведения измерений.

В этом пункте мы будем рассматривать выборку как результаты наблюдений. Как правило, объем выборки весьма велик и это мешает увидеть закономерности, присущие наблюдаемому признаку. В связи с этим возникает задача о выборе сравнительно небольшого числа представителей выборки так, чтобы были сохранены основные закономерности, описываемые исходной выборкой. Процедура решения этой задачи называется первичной обработкой результатов измерений.

Первичная обработка проводится по-разному в зависимости от типа наблюдаемого признака:

1. Ранжирование.

Пусть наблюдаемый признак Х является дискретной СВ. В этом случае, как известно, генеральная совокупность представляет собой не более чем счетное множество. В таком случае, всякая выборка есть конечное подмножество этого множества. Под ранжированием понимают расположение в порядке возрастания значений, упомянутых в выборке, с указанием количества повторов каждого значения.

Поясним сказанное примером.

Курсовая работа с примером решения № 1.

Пусть Х – количество сбоев станка в течении смены. В результате проведения наблюдений получены следующие данные: 5,1,3,2,4,1,2,3,4,5,3,2,2,1,2,5,4,4,4,3,1,2,3,4,5. Требуется провести первичную обработку результатов измерений.

В данном случае, очевидно, что наблюдаемый признак является ДСВ, поэтому первичная обработка есть ранжирование:

Курсовая работа по математической статистике

Значения 1,2,3,4,5, встречающиеся в приведенной таблице, называют вариантами, числа 4,6,5,6,4 – их частотами соответственно, а саму таблицу — вариационным рядом частот.

Отметим, что сумма частот Курсовая работа по математической статистикесовпадает с объемом выборки: 4+6+5+6+4=25.

Иногда вместо вариационного ряда частот используют вариационный ряд относительных частот, который отличается от вариационного ряда частот тем, что вместо частот Курсовая работа по математической статистикеиспользуются относительные частоты Курсовая работа по математической статистике. Ясно, что сумма относительных частот обязательно равна 1: Курсовая работа по математической статистике

В приведенном выше примере вариационный ряд относительных частот имеет вид:

Курсовая работа по математической статистике

2. Интервальная обработка выборки.

В этом пункте мы рассматриваем случай, когда генеральная совокупность не является дискретным множеством. Нашей целью является построение вариационных рядов, аналогичных рассмотренным выше. Достигается поставленная цель при помощи, описываемого ниже эмпирического алгоритма, называемого интервальной обработкой выборки.

По выборке Курсовая работа по математической статистике объема n строят, так называемый интервальный ряд частот:

Курсовая работа по математической статистике

гдеКурсовая работа по математической статистике

При этом число интервалов расчитывается по эмпирической формуле СтерджесаКурсовая работа по математической статистике шаг h определяется по формуле Курсовая работа по математической статистике а через Курсовая работа по математической статистике обозначают число наблюдений, попавших в интервал Курсовая работа по математической статистике. В качестве Курсовая работа по математической статистикерекомендуют выбирать Курсовая работа по математической статистике

После построения интервального ряда частот вариационный ряд частот получают из него, заменяя каждый из интервалов его одним представителем.

Как правило, в качестве представителя интервала берут его середину.

Курсовая работа с примером решения № 2.

Построить вариационный ряд частот и относительных частот по результатам измерений:

2,3; 2,5; 2,7; 2,35; 2,71; 2,32; 2,36; 2,44; 2,61; 2,67; 2,83; 2,86; 3,01; 3,12; 3,14; 2,61;2,49; 2,57; 2,52; 2,54; 3,03; 3,05.

Очевидно, в рассматриваемом случае Курсовая работа по математической статистикепоэтому

Курсовая работа по математической статистике

Руководствуясь изложенными выше соображениями, строим интервальный ряд частот:

Курсовая работа по математической статистике

Заменяя интервалы их серединами, получаем вариационный ряд частот, а затем вариационный ряд относительных частот:

Курсовая работа по математической статистике

Всюду ниже мы считаем, что первичная обработка результатов измерений произведена и выборка представлена в виде вариационного ряда частот или относительных частот.

Графическое изображение результатов измерений. Гистограмма. Полигон распределения

К оглавлению…

Гистограмма служит для графического изображения интервальных рядов и строится следующим образом: на оси абсцисс наносятся интервалы, в которых принимает значения наблюдаемый признак, а на оси ординат – частоты (относительные частоты) попадания наблюдаемого признака в соответствующий интервал. Гистограммой является ступенчатая фигура, ограничиваемая построенными таким образом прямоугольниками.

Для определенности будем считать, что задан интервальный ряд частот.

Курсовая работа по математической статистике

Тогда, согласно определению, данному выше, гистограмма этого интервального ряда имеет следующий вид:

Курсовая работа по математической статистике

Вариационные ряды геометрически изображают при помощи полигонов частот или относительных частот. Пусть, для определенности, задан вариационный ряд частот

63

Курсовая работа по математической статистике

На плоскость наносят точки с координатами Курсовая работа по математической статистике и соединяют их ломаной. Крайние левую и правую точки соединяют с ближайшими точками вида Курсовая работа по математической статистике где h – шаг. Таким образом, полигон имеет следующий вид:

Курсовая работа по математической статистике

Замечание. Иногда для графического изображения вариационных рядов используют не полигоны, а, так называемые, куммулятивные кривые. Например, куммулятивная кривая частот есть ломанная, соединяющая точки Курсовая работа по математической статистикеАналогичным образом определяется куммулятивная кривая относительных частот.

Эмпирическая функция распределения. Эмпирические числовые характеристики

К оглавлению…

Пусть наблюдаемый признак задан вариационным рядом относительных частот

Курсовая работа по математической статистике

Поскольку Курсовая работа по математической статистикето вариационный ряд относительных частот является законом распределения для некоторой дискретной случайной величины Курсовая работа по математической статистике . Случайную величину Курсовая работа по математической статистике называют эмпирической СВ, соответствующей рассматриваемой выборке наблюдаемого признака Х. Разумеется при изменении выборки эмпирическая СВ также меняется. Обозначим через Курсовая работа по математической статистике функцию распределения СВ Курсовая работа по математической статистике , построенную по выборке объема n. Эту функцию называют эмпирической функцией распределения СВ Х. Эмпирическая функция распределения при неограниченном увеличении объема выборки в некотором смысле приближается к функции распределения наблюдаемого признака Х. Точнее, имеет место следующее утверждение.

Теорема Гливенко-Кантелли. Эмпирическая функция распределения при неограниченном увеличении объема выборки сходится к функции распределения наблюдаемого признака по вероятности равномерно по х, то есть Курсовая работа по математической статистике

Определение. Числовые характеристики эмпирической СВ называются эмпирическими числовыми характеристиками. Это означает, что определены эмпирическое математическое ожидание, эмпирическая дисперсия, эмпирическое среднее квадратическое отклонение. Условимся в обозначениях эмпирических числовых характеристик употреблять в качестве нижнего индекса букву «э». Таким образом, по определению:

Курсовая работа по математической статистике

при этом, как обычно,Курсовая работа по математической статистике

Теорема Гливенко-Кантелли наводит на мысль о том, что эмпирические числовые характеристики должны быть приближенно равны соответствующим числовым характеристикам наблюдаемого признака.

Понятие о точечном оценивании параметров

К оглавлению…

Пусть Х – наблюдаемый признак с известным видом функции (плотности, закона) распределения. Будем предполагать, что функция распределения зависит от параметров: Курсовая работа по математической статистике.

Назовем точечной оценкой параметра Курсовая работа по математической статистике всякую формулу, которая по результатам выборки позволяет расчитывать приближенное значение параметра: Курсовая работа по математической статистике

Отметим, что точечную оценку, как и выборку, можно рассматривать с двух точек зрения: как расчетную формулу или как случайную величину.

Курсовая работа с примером решения № 3.

Как известно, нормально распределенная СВ задается плотностью распределения

Курсовая работа по математической статистике

зависящей от двух параметров a и Курсовая работа по математической статистике . Поскольку при этом a является математическим ожиданием, а Курсовая работа по математической статистике— средним квдратическим отклонением, то учитывая теорему Гливенко-Кантелли, естественно предположить, что Курсовая работа по математической статистикеЭти соображения приводят к следующей паре точечных оценок

Курсовая работа по математической статистике

Замечание. Разумеется, для одного и того же параметра, как правило, существует много оценок. Например, в предыдущем примере в качестве оценки математического ожидания можно выбрать первое из производимых измерений наблюдаемого признака.

В связи с этим, среди оценок следует выбирать наилучшие. Для отбора используют следующие критерии:

1. Несмещенность. Точечная оценка параметра называется несмещенной, если математическое ожидание оценки совпадает с истинным значением этого параметра: Курсовая работа по математической статистике

2. Состоятельность. Точечная оценка параметра называется состоятельной, если при неограниченном увеличении объема выборки Курсовая работа по математической статистике сходится по вероятности к истинному значению этого параметра, т.е. если Курсовая работа по математической статистикекаково бы ни было Курсовая работа по математической статистике

3. Эффективность. Несмещенная точечная оценка параметра называется эффективной, если она имеет наименьшую дисперсию среди всех несмещенных оценок рассматриваемого параметра.

Замечание. При формулировке критериев, предъявляемых к точечным оценкам мы рассматривали последние как случайные величины.

Точечная оценка математического ожидания

К оглавлению…

Пусть задан вариационный ряд частот наблюдаемого признака Х. Назовем выборочным средним и будем обозначать Курсовая работа по математической статистике среднее арифметическое значений, наблюденных в выборке:Курсовая работа по математической статистике Учитывая повторяющиеся значения, последнее выражение можно преобразовать следующим образом:

Курсовая работа по математической статистике

Таким образом, выборочное среднее является эмпирическим математическим ожиданием и, поэтому, во-первых, обладает всеми свойствами математического ожидания, во-вторых, является точечной оценкой математического ожидания наблюдаемого признака.

Более того, эта оценка яляется наилучшей в силу следующей теоремы.

Теорема. Выборочное среднее есть несмещенная, состоятельная, эффективная оценка математического ожидания.

Доказательство. Учитывая, что результаты наблюдений можно рассматривать как случайные величины, имеющие такое же распределение, как и наблюдаемый признак, получаем

Курсовая работа по математической статистике

Таким образом, несмещенность доказана.

С другой стороны, в силу теоремы закона больших чисел

Курсовая работа по математической статистике

каково бы ни было Курсовая работа по математической статистике Последнее означает состоятельность выборочного среднего как точечной оценки математического ожидания. Доказательство эффективности проводится по следующей схеме. Сначала показывают, что минимумом для дисперсий среди всех несмещенных оценок математического ожидания является величина Курсовая работа по математической статистике, а затем замечают, что Курсовая работа по математической статистике

Теорема доказана.

Точечные оценки дисперсии

К оглавлению…

По аналогии с математическим ожиданием в качестве точечной оценки дисперсии будем считать точечной оценкой дисперсии среднюю выборочную дисперсию:

Курсовая работа по математической статистике

Теорема. Оценка Курсовая работа по математической статистике является смещенной, а именноКурсовая работа по математической статистике , где Курсовая работа по математической статистике — дисперсия наблюдаемого признака.

Доказательство. Пусть a –математическое ожидание наблюдаемого признака, тогда

Курсовая работа по математической статистике

Принимая во внимание, что Курсовая работа по математической статистике получим

Курсовая работа по математической статистике

Тогда

Курсовая работа по математической статистике

Следовательно,

Курсовая работа по математической статистике

Теорема доказана.

Следствие. Несмещенной оценкой дисперсии является

Курсовая работа по математической статистике

Эту оценку называют исправленной выборочной дисперсией. Дробь Курсовая работа по математической статистике называют поправкой Бесселя. Очевидно, эта поправка стремится к 1 при увеличении объема выборки и при n>50 разница между исправленной дисперсией и дисперсией выборки практически неощутима. Пользуясь законом больших чисел можно показать, что обе рассмотренные оценки являются состоятельными. Однако, исправленная выборочная дисперсия не является эффективной оценкой дисперсии. Можно показать, что несмещенной, состоятельной, эффективной оценкой дисперсии является следующая оценка Курсовая работа по математической статистикеОднако, эта оценка практически неприменима, ибо для ее построения необходимо знание точного значения математического ожидания.

Методы построения точечных оценок

К оглавлению…

1.Метод максимального правдоподобия.

Пусть Курсовая работа по математической статистике — функция распределения, плотность распределения или вероятность того, что случайная величина Х примет значение х.

Ясно, что первые две функции используют для непрерывных наблюдаемых признаков, а первую и третью – для дискретных наблюдаемых признаков.

Назовем функцией правдоподобия следующую функцию

Курсовая работа по математической статистике

где Курсовая работа по математической статистике — выборка объема и значений Х.

Теорема. Пусть Курсовая работа по математической статистике — точка максимума функции L, тогда Курсовая работа по математической статистикеесть состоятельная оценка параметра Курсовая работа по математической статистике .

Эту теорему мы приводим без доказательства.

Из приведенной теоремы вытекает следующая схема поиска точечных оценок:

1. Составить функцию максимального правдоподобия L.

2. Исследовать функцию L на максимум, для чего составить и решить систему уравнений

Курсовая работа по математической статистике

После чего проверить, что найденные решения этой системы доставляют максимум функции L.

3. Выписать полученные точечные оценки.

Замечание. Если f(x) возрастающая функция, то функция L и f(L) имеют максимумы в одних и тех же точках. Поэтому в пункте 2 схемы можно вместо функции L использовать функцию f(L), что иногда проще при удачном выборе функции f(x).

Курсовая работа с примером решения № 4.

Построить точечные оценки параметров а и Курсовая работа по математической статистикенормально распределенного признака по результатам выборки Курсовая работа по математической статистике

Поскольку плотность распределения в рассматриваемом случае имеет вид: Курсовая работа по математической статистике, то функция правдоподобия имеет вид

Курсовая работа по математической статистике

Будем рассматривать вместо функции L, следую замечанию, функцию lnL: .

Курсовая работа по математической статистике

Тогда

Курсовая работа по математической статистике

Приравнивая к нулю частные производные, получаем

Курсовая работа по математической статистике

Решая эту систему относительно а и Курсовая работа по математической статистике, получаем:

Курсовая работа по математической статистике

Можно проверить, что полученные значения действительно доставляют максимум функции lnL.

Следствие. В рассмотренном примере получены следующие оценки математического ожидания и дисперсии

Курсовая работа по математической статистике

2. Метод моментов.

Пусть Курсовая работа по математической статистике— плотность распределения признака Х, а Курсовая работа по математической статистике — выборка объема n. Представим эту выборку в виде вариационного ряда относительных частот:

Курсовая работа по математической статистике

Этот ряд, как отмечалось выше, определяет эмпирическую случайную величину Х*, которая является некоторым приближением наблюдаемого признака Х. Последнее означает, что моменты произвольных порядков величин Х и Х* должны быть приблизительно равны:

Курсовая работа по математической статистике

Выбирая m уравнений, получаем систему, решения которой дают оценки параметров Курсовая работа по математической статистике

Курсовая работа с примером решения № 5.

Методом моментов построить оценку параметра Курсовая работа по математической статистикедля распределения Пуассона.

Плотность распределения имеет вид

Курсовая работа по математической статистике

где: Курсовая работа по математической статистике

Найдем моменты первого порядка случайных величин Х и Х*:

Курсовая работа по математической статистике

Следовательно, Курсовая работа по математической статистике

Доверительное оценивание параметров

К оглавлению…

Пусть, как и раньше, наблюдаемый признак Х зависит от некоторых параметров. ПустьКурсовая работа по математической статистике — один из этих параметров.

Интервал Курсовая работа по математической статистике назовем доверительным, соответствующим доверительной вероятности Курсовая работа по математической статистике, если вероятность того, что истинное значение параметра Курсовая работа по математической статистике находится на этом интервале есть Курсовая работа по математической статистике:

Курсовая работа по математической статистике

Как правило, в качестве доверительной вероятности выбирают достаточно близкое к единице значение. Стандартными являются следующие значения доверительной вероятности:

Курсовая работа по математической статистике

Такие значения для Курсовая работа по математической статистикевыбираются для того, чтобы получать информацию об изучаемом параметре с вероятностью близкой к единице, т.е. почти наверняка. В связи с этим иногда доверительную вероятность называют надежностью.

Замечание. Иногда вместо доверительной вероятности (надежности) использую величину Курсовая работа по математической статистике, называемую уровнем значимости.

Построение доверительного интервала для математического ожидания нормального распределения при известном Курсовая работа по математической статистике.

К оглавлению…

Пусть наблюдаемый признак Х распределен по нормальному закону и известно его среднее квадратическое отклонение Курсовая работа по математической статистике.

Рассмотрим случайную величину

Курсовая работа по математической статистике

где а — математическое ожидание Х.

Теорема. Случайная величина z распределена по нормальному закону с параметрами 0,1. При доказательстве несмещенности выборочного среднего было показано, что Курсовая работа по математической статистике, поэтому

Курсовая работа по математической статистике

Покажем, что Курсовая работа по математической статистике

В самом деле,

Курсовая работа по математической статистике

Теорема доказана.

Обозначим через Курсовая работа по математической статистикерешение уравнения

Курсовая работа по математической статистике

Функция Курсовая работа по математической статистике задается таблично и решение выписанного уравнения также определяется при помощи таблиц. При этом следует учитывать, что функция Курсовая работа по математической статистике нечетна, т.е., что Курсовая работа по математической статистике

Найдем теперь вероятность того, что Курсовая работа по математической статистике. Поскольку случайная величина z распределена по нормальному закону с параметрами 0,1, имеем:

Курсовая работа по математической статистике

С другой стороны, неравенство Курсовая работа по математической статистике эквивалентно следующим:

Курсовая работа по математической статистике

Следовательно, Курсовая работа по математической статистике

По определению доверительного интервала имеем, что интервал

Курсовая работа по математической статистике

в является доверительным для математического ожидания с доверительной вероятностью Курсовая работа по математической статистике.

Доверительную вероятность называют иногда надежностью.

Кроме того, вместо надежности Курсовая работа по математической статистикезадают иногда уровень значимости а , связанный с надежностью соотношением Курсовая работа по математической статистике

Курсовая работа с примером решения № 6.

Случайная величина Х имеет нормальное распределение со средним квадратическим отклонением Курсовая работа по математической статистике Найти доверительный интервал по выборке 2,1; 2,3; 2,4; 2,6; 2,8; 2,7; 2,5;2,.4; 2,7; с уровнем значимости 0,05.

Доверительная вероятность (надежность) в рассматриваемом случае такова Курсовая работа по математической статистике= 1 — 0,05 = 0,95.

Найдем Курсовая работа по математической статистике , решив уравнение Курсовая работа по математической статистике

Пользуясь таблицами для функции Ф(x) , получаем Курсовая работа по математической статистике Очевидно объем выборки в рассматриваемом случае n=9. Найдем Курсовая работа по математической статистике:

Курсовая работа по математической статистике

Следовательно, искомый доверительный интервал имеет вид:

Курсовая работа по математической статистике

Построение доверительного интервала для математического ожидания нормального распределения при известном Курсовая работа по математической статистике.

Пусть Курсовая работа по математической статистике — выборка объема из генеральной совокупности признака Х, распределенного по нормальному закону. Случайная величина

Курсовая работа по математической статистике

называется распределенным по закону Стьюдента (t — распределение) c k=n-1 числом степеней свободы.

Для этой случайной величины составлен в виде таблицы закон распределения, который называют t – распределением Стьюдента. При помощи этих таблиц может быть решена задача нахождения по заданному Курсовая работа по математической статистикезначения Курсовая работа по математической статистике, удовлетворяющее уравнению:

Курсовая работа по математической статистике

Величина Курсовая работа по математической статистике оказывается зависящей от Курсовая работа по математической статистикеи числа степеней свободы k=n-1 и, поэтому в дальнейшем, обозначается Курсовая работа по математической статистике. В таблице Курсовая работа по математической статистикенаходится на пересечении столбца соответсвующего Курсовая работа по математической статистике= 0,95; 0,99; 0,995; и строки, указывающей число степеней свободы.

Рассмотрим неравенство Курсовая работа по математической статистике, где Курсовая работа по математической статистике таково, чтоКурсовая работа по математической статистике Это неравенство эквивалентно следующему Курсовая работа по математической статистике, отсюда

Курсовая работа по математической статистике

Поскольку все записанные неравенства эквивалентны, то

Курсовая работа по математической статистике

Последнее означает, что интервал Курсовая работа по математической статистике, является доверительным, соответствующим надежности Курсовая работа по математической статистике.

Курсовая работа с примером решения № 7.

Случайная величина Х имеет нормальное распределение. Найти доверительный интервал для математического ожидания по выборке: 5, 6, 4, 6, 7, 4, 8, 7, 9, 4 с уровнем значимости 0,05.

По выборке находим Курсовая работа по математической статистикеи Курсовая работа по математической статистике

Курсовая работа по математической статистике

Найдем Курсовая работа по математической статистике по таблице

Курсовая работа по математической статистике

Следовательно, искомый интервал имеет вид

Курсовая работа по математической статистике

Проверка статистических гипотез

К оглавлению…

Под статистической гипотезой будем понимать всякое высказывание о наблюдаемом признаке, которое может быть проверено по результатам выборки.

Пусть Курсовая работа по математической статистике — закон распределения наблюдаемого признака Х, зависящий от параметра, истинное значение которого нам неизвестно.

Предположим, что нам необходимо проверить гипотезу Курсовая работа по математической статистике. Назовем эту гипотезу нулевой и будем обозначать через Курсовая работа по математической статистике. Гипотезу Курсовая работа по математической статистике, состоящую в том, что Курсовая работа по математической статистике назовем конкурирующей или альтернативной.

Нашей задачей является по статистическим данным (по выборке) из гипотез Курсовая работа по математической статистике и Курсовая работа по математической статистикепринять какую-либо и, следовательно, отвергнуть альтернативную гипотезу. При этом мы можем совершать следующие ошибки:

1. Гипотеза Курсовая работа по математической статистике отвергается, но является верной. Такую ошибку назовем ошибкой первого рода.

2. Гипотеза Курсовая работа по математической статистике принимается, но является неверной. Такую ошибку назовем ошибкой второго рода..

Схематически решение сформулированной задачи состоит в следующем: в зависимости от вида гипотезы по выборке рассчитывают некоторую величину, называемую статистикой. Это значение называют расчетным значением статистики Курсовая работа по математической статистике С другой стороны, статистику подбирают так, что для нее известно, так называемое, теоретическое значение Курсовая работа по математической статистике определяемое по известному виду распределения. Расчетное и теоретическое значения статистики сравниваются и при этом если, в некотором смысле, они мало отличаются, то нет оснований отвергать гипотезу, а если различия между теоретическим значением статистики и ее расчетным значением существенны, то нулевая гипотеза отвергается. Как правило, сравнение указанных величин состоит в проверке выполнения неравенств: Курсовая работа по математической статистике или Курсовая работа по математической статистике Тем самым множество выборок разбивается на 2 непересекающихся подмножества. Одно из них называется областью допустимых значений и описывается неравенством Курсовая работа по математической статистике , а второе называется критической областью и описывается неравенством расч теор Курсовая работа по математической статистике Область допустимых значений обозначают, как правило, через 0, а критическую область – через W.

Проверка гипотезы о равенстве центров распределения двух нормальных генеральных совокупностей при известных дисперсиях

К оглавлению…

Пусть Х и Y – два наблюдаемых признака, подчиненных нормальному распределению. Будем считать, что дисперсии Курсовая работа по математической статистике и Курсовая работа по математической статистике известны. Будем считать, что выборки Курсовая работа по математической статистике и Курсовая работа по математической статистике независимы. Тогда выборочные средние Курсовая работа по математической статистике и Курсовая работа по математической статистике также независимы и распределены по нормальному закону. Это означает, что и разность Курсовая работа по математической статистике распределена по нормальному закону. Найдем параметры распределения этой случайной величины, предполагая, что гипотеза Курсовая работа по математической статистике, состоящая в том, что Курсовая работа по математической статистике верна. Тогда

Курсовая работа по математической статистике

Последние равенства означают, что случайная величина Курсовая работа по математической статистикераспределена по нормальному закону с параметрами (0, 1).

Пользуясь статистикой z, построим критическую область и область допустимых значений для гипотез:

Курсовая работа по математической статистике

Пусть задана вероятность Курсовая работа по математической статистике, с которой мы принимаем решение о совпадении центров, т.е. гипотезу Курсовая работа по математической статистике. При этом величина а называется уровнем значимости.

Рассмотрим уравнение

Курсовая работа по математической статистике

Решением этого уравнения будет Курсовая работа по математической статистикенаходится по таблицам для нормального распределения.

Последнее означает, что область допустимых значений описывается неравенством:

Курсовая работа по математической статистике

Следовательно, в рассматриваемом случае критическая область задается неравенством:

Курсовая работа по математической статистике

Курсовая работа с примером решения № 8.

По результатам выборок двух наблюдаемых признаков, распределенных по нормальному закону с дисперсиями Курсовая работа по математической статистикепроверить гипотезу о совпадении центров, приняв уровень значимости Курсовая работа по математической статистике
X: 2,1; 2,2; 2,3; 2,15; 2,4; 2,5; 2,4; 2,3; 2,1; 2,2
Y: 2,3; 2,4; 2,8; 2,0; 2,0; 2,6; 2,7; 2,8; 2,9; 3,0; 2,9

Выполним необходимые расчеты:

Курсовая работа по математической статистике

Поэтому Курсовая работа по математической статистике аКурсовая работа по математической статистике

Так как 0,375<3,14, то выборка принадлежит области допустимых значений и нет оснований отвергать гипотезу о равенстве центров наблюдаемых признаков.

Проверка гипотез о законе распределения. Критерий согласия Курсовая работа по математической статистике .

Пусть Х – наблюдаемый признак и требуется проверить гипотезу Курсовая работа по математической статистике, состоящую в том, что Х подчиняется закону распределения F(x).

Произведем выборку объема n; Курсовая работа по математической статистике и построим по этой выборке эмпирическую функцию распределения F*(х).

Проверка гипотезы Курсовая работа по математической статистике:состоит в сравнении законов F(х) и F*(х) при помощи, так называемого, критерия согласия. Существует много различных критериев согласия. Мы рассматриваем один из них – критерий согласия Курсовая работа по математической статистике .

Разобьем генеральную совокупность признака Х на l интервалов Курсовая работа по математической статистике и подсчитаем число элементов, попавших на каждый из этих интервалов.

Предполагая, что гипотеза Курсовая работа по математической статистикеимеет место, можно найти вероятности Курсовая работа по математической статистикепопадания случайной величины в интервал Курсовая работа по математической статистике . Тогда теоретическое значение числа элементов, попавших в интервал Курсовая работа по математической статистике , есть Курсовая работа по математической статистике. Результаты расчетов помещаем в следующую таблицу:

Курсовая работа по математической статистике

По построению Курсовая работа по математической статистике

Рассмотрим следующую статистику

Курсовая работа по математической статистике

Можно показать, что эта статистика имеет распределение Курсовая работа по математической статистикес k=l-r-i числом степеней свободы. Здесь r – число параметров, входящих в функцию F(x).

Значение Курсовая работа по математической статистике может быть найдено при помощи таблицы по числу степеней свободы k и заданному уровню значимости а.

С другой стороны, может быть найдено расчетное значение Курсовая работа по математической статистике по приведенной выше формуле.

Область допустимых значений в рассматриваемом случае описывается неравенством: Курсовая работа по математической статистике, а критическая область – неравенством Курсовая работа по математической статистике .

Курсовая работа с примером решения № 9.

При уровне значимости 0,05, проверить гипотезу о нормальном распределении генеральной совокупности, если выборка представлена интервальным рядом частот.

Курсовая работа по математической статистике

Для проверки о нормальном распределении с помощью критерия согласия Курсовая работа по математической статистике , необходимо найти теоретические частоты.

1.Перейдем от интервального распределения к статистическому ряду распределения частот признака Х. В качестве представителя каждого интервала берем значение Курсовая работа по математической статистике

Курсовая работа по математической статистике

2.Вычисляем Курсовая работа по математической статистике

Курсовая работа по математической статистике

3. Нормируем случайную величину Х, т.е. переходим к величине z

Курсовая работа по математической статистике

и вычисляем концы интервалов Курсовая работа по математической статистике

Курсовая работа по математической статистике

причем, наименьшее значение z полагают равным Курсовая работа по математической статистике а наибольшее Курсовая работа по математической статистике

4.Вычисляем теоретические вероятности Курсовая работа по математической статистикепопадания в интервал по формуле Курсовая работа по математической статистике гдеКурсовая работа по математической статистикефункция Лапласа и находим искомые теоретические частоты Курсовая работа по математической статистике.

5.Вычисляем Курсовая работа по математической статистике . Вычисления удобно проводить с помощью следующих таблиц.

Курсовая работа по математической статистике

№2.

Курсовая работа по математической статистике

Находим Курсовая работа по математической статистике по таблице – число степеней свободы у нас k=6-2-1-3, уровень значимости

Курсовая работа по математической статистике

Так как Курсовая работа по математической статистике — нет оснований отвергать гипотезу о нормальном распределении.

Возможно эти страницы вам будут полезны: