Примеры решения задач по математической статистике

Здравствуйте на этой странице я собрала примеры решения задач по предмету математическая статистика с решением по каждой теме, чтобы вы смогли освежить знания!

Если что-то непонятно вы всегда можете написать мне в воцап и я вам помогу!

Основные понятия и задачи математической статистики

К оглавлению…

Математическая статистика — это наука, изучающая методы сбора, систематизации и интерпретации числовых (случайных) данных,

В этом определении интерпретация и систематизация данных рассматривается как существенный аспект.

Главная цель статистики — получение осмысленных заключений из несогласованных (подверженных разбросу) данных.

Действительно, исключая тривиальные ситуации, реальные данные всегда являются несогласованными, что требует применения статистических методов. Рассогласованность (разброс) между индивидуальными наблюдениями может быть, например, обусловлена ошибкой при считывании позиции стрелки прибора, когда она расположена между двумя делениями шкалы стрелочного прибора. Изменчивость может быть также следствием нестабильности работы электронного оборудования при передаче сообщений по радио или телеграфу. (В последнем случае для характеристики ситуации используется термин «шум»).

Чем же конкретно занимается математическая статистика? Какие задачи решает?

Возможно эта страница вам будет полезна:

Предмет теория вероятностей и математическая статистика

Выборочные распределения

К оглавлению…

Статистика должна получить свои выводы, используя наличную выборку. Каждое наблюдение является реализацией некоторой случайной величины. Известно множество значений, которые может принимать случайная величина; некоторые из них имеют большую возможность появления, чем другие.

Значение, которое наблюдалось, представляет собой реализацию. Вероятности возможных реализаций характеризуются распределением вероятностей случайных величин (СБ). Обычно функции распределения вероятностей бывают заданы с точностью до одного, двух параметров значений некоторых неизвестных. Это приводит к проблеме поиска таких комбинаций выборочных значений, которые бы давали наилучшее приближение для неизвестных параметров. Каждая такая комбинация и есть статистика. Выборочное распределение статистики поволяет судить, может ли предложенная статистика служить оценкой интересующего нас параметра,

Оценки, тесты (критерии значимости), решения Проблема оценивания была схематично рассмотрена выше. Ясно, что разумная процедура оценивания не должна ограничиваться лишь выбором приближенного численного значения для неизвестного параметра; она должна что-то говорить и о надежности этого приближения. Обычно говорят о точечном оценивании и об интервальном оценивании.

Существуют различные методы конструирования точечных оценок и определения их надежности. Наиболее полезным из них является метод максимального правдоподобия (ММП). Другой известный метод, который можно рассматривать либо как специальный случай ММП, либо как независимую процедуру подгонки, — метод наименьших квадратов.

Интервальное оценивание связано с определением «доверительных интервалов», правдоподобных интервалов, байесовских интервалов.

Поскольку статистика в целом основана на случайной изменчивости, каждая оценка подвержена ошибке. Так, если получены две различные оценки параметра — одна при одном наборе условий, а другая -при другом, непосредственно неясно, соответствует ли имеющееся между ними различие различию между параметрами. Вопрос об их различии решается с помощью статистического критерия (теста) или критерия значимости.

Один из подходов к статистическим критериям (проверки гипотез) связан с именем Р.А. Фишера, который рассматривает проверку гипотезы как пробный шаг в проведении научного исследования, позволяющий получить ученому объективный критерий, с помощью которого можно судить об истинности гипотезы.

Другой подход связан в основном с именами Дж. Неймана и Э. Пирсона, которые рассматривают процедуру проверки гипотезы как правило, с помощью которого должен быть сделан выбор либо принято решение об истинности одной гипотезы в противоречие другой.

Одна из частных проблем теории проверки статистических гипотез -оценка пригодности модели, предложенной для объяснения (интерпретации) данных, При этом необходимо решить: насколько предложенная модель соответствует выборке? И являются ли выборочные значения действительно близкими к тем, которые можно ожидать, используя подогнанную модель? Наиболее широко для решения подобных вопросов применяется процедура, предложенная Карлом Пирсоном и использующая критерий, основанный на ее выборочном распределении. Это пирсоновский критерий согласия хи-квадрат.

Генеральной совокупностью случайной величины

К оглавлению…

Статистическая устойчивость случайных явлений проявляется лишь при большом (в пределе — бесконечно большом) числе наблюдений. Однако на практике реальное число наблюдений ограничено. Поэтому характеристики случайных величин (СВ), определенные по малому числу наблюдений, в принципе не должны совпадать с величинами тех же характеристик, определенными по большому числу наблюдений (условия опыта остаются неизменными). Чтобы провести различие между характеристиками СВ, найденными по достаточно большому и малому числу наблюдений, в математической статистике введены понятия абстрактной генеральной совокупности и выборки.

Генеральной совокупностью случайной величины называется множество всех значений, которые может принимать случайная величина .

Выпорка представляет собой совокупность ограниченного числа наблюдений.

В соответствии с этим различают выборочные характеристики СВ, найденные по ограниченному числу наблюдений (выборке) и зависящие от числа наблюдений, и соответствующие им характеристики в генеральной совокупности, не зависящие от числа наблюдений. При этом выборочные характеристики рассматриваются как оценки соответствующих характеристик в генеральной совокупности.

На практике во многих случаях функция распределения рассматриваемой случайной величины неизвестна; ее определяют по результатам наблюдений или, как говорят, по выборке.

Выборкой объемом для данной случайной величины называется последовательность независимых наблюдений этой величины.

Пусть из генеральной совокупности извлечена выборка, причем

Объем выборки:

Наблюдаемые значения называют вариантами, а последовательность вариантов, записанных в возрастающем порядке, — вариационным рядом.

Число наблюдений называют частотами, а их отношение к объему выборки: — относительными частотами (частостями).

В статистике различают малые и большие выборки.

Малой выборкой считают такую выборку, при обработке которой методами, основанными на группировании наблюдений, нельзя достичь заданных точности и достоверности.

Больший считают такую выборку, при обработке которой можно перейти к группированию наблюдений без ощутимой потери информации и достижению заданных значений точности и достоверности.

Если выборка достаточно велика, то построенный на ее основе вариационный ряд неудобен для дальнейшего статистического анализа. В Этом случае строится гак называемый группированный статистический ряд.

Группирование данных, гистограмма, полигон

К оглавлению…

При группировании данных необходимо соблюдать определенные правила. Рассмотрим наиболее важные из них:

  1. Объем выборки должен быть достаточно велик .
  2. Число интервалов группирования (число групп) должно находиться в интервале . При выборе в каждом конкретном случае следует помнить, что при малом числе групп определение вида теоретической кривой распределения по эмпирическим данным может быть затруднено из-за маскировки (утраты) резких изменений кривой распределения, если они фактически имели место. При большом числе групп и незначительном объеме выборки будет наблюдаться большое количество пропусков (ноль попаданий в группу), что будет обусловлено не столько видом распределения, сколько недостатком статистики, кроме того, в этом случае даже небольшие случайные колебания приводят к искажению кривой распределения.
  3. Необходимо, по возможности, охватывать всю область данных, так как при неизвестных предельных значениях невозможно вычислить некоторые числовые характеристики выборки.
  4. Интервалы не должны перекрываться. Не должно возникать никаких сомнений относительно того, в какой интервал попадает любое значение.
  5. Если заведомо известно, что теоретическая кривая может быть двумодальной, число групп может быть увеличено в 1,5-2 раза по сравнению с оптимальным числом .

Оптимальное число групп выборки объемом рассчитывается по формулам:

• при известном значении

• при неизвестном значении , но известно, что

• согласно формуле Стерджесса:

Из (8.3) видно, что для увеличения оптимального количества интервалов на единицу необходимо увеличить объем выборки вдвое, Шаг группирования (ширина интервала) определяется по формуле:

Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма и кумулятивная кривая.

Гистограммой распределения, или просто гистограммой называется чертеж в прямоугольной системе координат, горизонтальная ось которого разбивается на равных интервалов (групп) шириной . На каждом отрезке, как на основании, строится прямоугольник с высотой, равной частоте (частости) соответствующего интервала.

Полигоном распределения. или просто полигоном называется ломаная линия, соединяющая середины верхних оснований каждого столбца гистограммы. За пределами гистограммы как слева, так и справа размещают пустые интервалы, в которых точки, соответствующие их серединам, лежат на оси абсцисс.

Кумулятивная кривая (кумулята) — кривая накопления частот (час-гостей). Для дискретного ряда кумулята представляет ломаную, соединяющую точки

Для интервального вариационного ряда ломаная начинается с точки, абсцисса которой равна началу первого интервала, а ордината — накопленной частоте (частости), равной нулю. Остальные точки этой ломаной соответствуют концам интервалов.

Пример № 1

Построить полигон, гистограмму и кумуляту по выборке объема . Сгруппированные данные приведены в таблице.

Статистическая (эмпирическая) функция распределения

К оглавлению…

Статистическим распределением выборки называют перечень вариантов и соответствующих им частот или относительных частот (частосгпей).

В теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике — соответствие между наблюдаемыми значениями и их частотами или относительными частотами.

Пример № 2

Задана выборка объемом с соответствующими частотами. Необходимо найти частости (относительные частоты).

Контроль:

Пусть исследуется статистическое распределение частот количественного признака (случайной величины) . Введем обозначение:

— число наблюдений, при которых отслеживалось значение признака меньшее ;

— общее число наблюдений (объем выборки). Очевидно, что относительная частота (частость) события равна .

Статистической функцией распределения случайной величины называется функция, определяющая для каждого значения относительную частоту события :

Сравним статистическую и интегральную функции распределения. Вспомним (теорема Бернулли), что относительная частота события , то есть стремится по вероятности к вероятности этого события.

Функция обладает теми же свойствами, что и :

  1. Значения .
  2. Эмпирическая функция распределения — неубывающая.
  3. Если — наименьшая варианта, то при .
  4. Если — наибольшая варианта, то при .

Пример № 3

Построить эмпирическую функцию по данной выборке:

Решение:

Найдем объем выборки = 12 + 18 + 30 = 60. Теперь найдем статистическую функцию распределения:

Представим в аналитическом и графическом виде:

Выборочные значения и оценка параметров

К оглавлению…

Рассмотрим один из возможных методов оценивания среднего значения и дисперсии случайной величины по независимым наблюдениям:

Здесь и — выборочное среднее и выборочная дисперсия соответственно. Индекс в формуле (см. 8.7) указывает на смещенность оценки дисперсии. Наряду с вышеприведенными характеристиками, при обработке результатов наблюдений обычно находят следующие оценки:

• выборочная дисперсия (несмещенная)

♦ среднее квадратическое отклонение

• выборочный коэффициент асимметрии

выборочный коэффициент эксцесса

Для установления качества или «правильности» любой оценки используются свойства (требования) «хороших оценок».

Требования «хороших оценок»

К оглавлению…

1 Несмещенность.

Во-первых, желательно, чтобы математическое ожидание оценки равнялось оцениваемому параметру:

где — оценка параметра . Если свойство (8.12) имеет место, то оценка называется несмещенной.

2, Эффективность,

Во-вторых, желательно, чтобы среднеквадратическая ошибка данной оценки была наименьшей среди всех возможных оценок, то есть:

где — исследуемая оценка, a — любая другая оценка. Если по свойство имеет место, то оценка называется эффективной.

3* Состоятельность,

В-третьих, желательно, чтобы оценка сходилась к оцениваемому параметру с вероятностью, стремящейся к единице по мере увеличения размера выборки, то есть для любого

Если выполнено условие (8,14), то оценка называется состоятельной. Из неравенства Чебышева следует, что достаточным для выполнения (8.14) является условие:

В качестве примера «хорошей оценки» рассмотрим оценку среднего значения (8.6). Математическое ожидание выборочного среднего равно:

Следовательно, согласно (8.12), оценка несмещенная.

Среднеквадратическая ошибка выборочного среднего равна:

Поскольку наблюдения , независимы, то математическое ожидание членов, содержащих смешанные произведения, равны нулю. Поэтому из (8.17) получим:

Таким образом, согласно (8.15) оценка — состоятельная. Можно показать, что эта оценка эффективна.

Рассмотрим оценку дисперсии по формуле (8.7).

Однако

Поскольку

то, подставив получим:

Следовательно, оценка — смещенная.

Хотя оценка (выборочная дисперсия) и является смещенной, она состоятельна и эффективна. Из (8.21) понятно, что для получения несмещенной оценки следует взять несколько видоизмененную выборочную дисперсию (8.8).

Интервальное оценивание

К оглавлению…

Ранее мы обсудили использование выборочных значений в качестве оценок параметров случайных величин. Однако такие процедуры дают только точечные оценки интересующих нас параметров и не позволяют судить о степени близости выборочных значений к оцениваемому параметру. Более предпочтительная процедура — построения интервала, который накрывает оцениваемый параметр с известной степенью достоверности, Такой подход называется «интервальным оцениванием».

Сразу отметим следующее: чем больше уверенность в том, что оцениваемый параметр лежит в интервале, тем шире интервал.

Так что искать интервал, накрывающий параметр с вероятностью, равной единице, бессмысленно. Это вся область , то есть.

Пусть для параметра получена несмещенная оценка . Мы хотим оценить возможную при этом ошибку. Назначим некоторую достаточно большую вероятность (например: …)„ такую, что событие с вероятностью можно считать практически достоверным, и найдем такое значение , для которого выполняется соотношение

Тогда диапазон практически возможных значений ошибки, возникающей при замене на будет равен Ошибки, большие по абсолютной величине будут появляться с малой вероятностью . Запишем (9.1) в другом виде:

То есть неизвестное значение параметра с вероятностью попадает в интервал

Ранее (в теории вероятностей) мы рассматривали вероятность попадания случайной величины на некоторый интервал. У нас же а не случайная величина, а интервал случаен, здесь корректно говорить о вероятности накрыть точку а.

Вероятность принято называть доверительной вероятностью, а интервал — доверительным интервалом.

Рассмотрим задачу нахождения доверительных границ и параметра , имеющего несмещенную оценку . Если бы нам был известен закон распределения величины , то из выражения (9.1) нахождение при заданной не представляло бы затруднений. Однако, как правило, мы не знаем закон распределения случайной величины .

Пусть теперь распределение случайной величины отлично от нормального. Применяя центральную предельную теорему, получаем следующий результат.

С увеличением объема выборки выборочное распределение выборочного среднего стремится к нормальному распределению независимо от вида распределения исходной случайной величины.

Практически во многих случаях выборочное можно считать нормальным уже при , а при приближение будет хорошим.

В качестве примера рассмотрим задачу нахождения доверительного интервала математического ожидания, Пусть произведено независимых опытов над случайной величиной с неизвестными .

Для этих параметров выберем оценки:

Необходимо построить доверительный интервал соответствующий доверительной вероятности :

Интервальная оценка математического ожидания при известной дисперсии

К оглавлению…

Пусть СВ имеет гауссово распределение с параметрами причем неизвестно значение известно. Тогда эффективной оценкой параметра будет .

При этом имеет нормальное распределение

Статистика (оценка) СВ

имеет распределение , независимо от параметра , и как функция — непрерывна и монотонна. Вспомним, что . Тогда, с учетом (9.2), запишем:

где ~ квантили стандартного нормального распределения , причем Подставим в явном виде в (9.6):

Запишем это неравенство относительно :

Квантили стандартного нормального распределения определяются по таблицам, тогда окончательно получим:

Искомый доверительный интервал математического ожидания нормально распределенной СВ с известной дисперсией равен:

На рис. 9.1 представлена плотность распределения стандартного нормального распределения с отмеченными квантилями .

Интервальная оценка математического ожидания при неизвестной дисперсии

К оглавлению…

На практике почти всегда генеральная дисперсия (как и оцениваемое математическое ожидание ) неизвестна. Итак, имеется нормально распределенная СВ

с неизвестными параметрами и случайной выборке найдем несмещенные, эффективные оценки

Построение интервальной оценки основано на статистике:

Вспомним, что

и подставим в (9.11):

Числитель выражения (9.12), как было показано выше, имеет стандартное нормальное распределение . Показано, что величина имеет распределение с степенями свободы. А статистика имеет распределение Стыодснта с степенями свободы. Распределение Стьюдента не зависит от неизвестных параметров распределения случайной величины , а зависит лишь от числа .

Следует отметить, что распределение Стьюдента напоминает нормальное распределение, и при сколь угодно близко приближается к нему.

Число степеней свободы определяется как общее число наблюдений (вариантов) случайной величины минус число уравнений, связывающих эти наблюдения, то есть

Так, например, для распределения статистики число степеней свободы , поскольку одна степень свободы «теряется» при определении выборочного среднего ( наблюдений связаны одним уравнением).

Таким образом, по аналогии с (9.6) запишем:

Ha рис. 9,2 представлена плотность распределения Стьюдента с пятнадцатью степенями свободы.

Доверительный интервал математического ожидания нормально распределенной СB с неизвестной дисперсией равен:

Интервальная оценка выборочной дисперсии

К оглавлению…

Доверительный интервал для оценки дисперсии по выборочной дисперсии для СВ

строится аналогичным образом.

Естественно, что в качестве математического ожидания и дисперсии гауссовой СВ мы возьмем их несмещенные и эффективные оценки:

Исходя из вышесказанного, запишем:

Это интервал, который с вероятностью накрывает неизвестную дисперсию. Из статистики известно, что если СВ имеет гауссово распределение

то справедливо соотношение:

Здесь хи-квадрат распределения с степенями свободы. Теперь, задавая или что равносильно , можно найти квантили (соответствующие) . При этом следует учесть, что распределение не симметрично (рис. 9.3).

Как же решить эту задачу однозначно? Ведь сдвигая интервал влево или вправо соответствующим образом, можно для заданной доверительной вероятности найти бесконечное множество решений (интервалов).

Для обеспечения единообразия условились выбирать такие квантили (интервал), чтобы площадь под кривой, лежащая левее левой квантили, равнялась площади под кривой, расположенной правее правой квантили:

Тогда из (9.19), учитывая (9.20), получим соответствующие границы интервала:

Пример № 4

Дана выборка СВ объемом . Предполагается, что СВ распределена нормально с неизвестными параметрами .

Необходимо найти доверительные интервалы для математического ожидания и дисперсии при доверительной вероятности, равной 0,97,

Решение:

В качестве несмещенных и эффективных оценок вычислим:

a) Вычислим доверительный интервал для математического ожидания, если дисперсия известна (полагаем, что ). Тогда из таблицы нормального распределения получим

Подставим значения квантилий в (9.9) и (9.10):

b) Вычислим доверительный интервал для математического ожидания, при неизвестной дисперсии. Воспользуемся таблицей распределения Стьюдснта с числом степеней свободы

Соответствующие квантили равны

Подставим полученные значения в (9.15) и (9.16):

c) Вычислим доверительный интервал для дисперсии. Воспользуемся таблицей распределения Симметричный 97 % вероятностный интервал с

числом степеней свободы: (2,33; 20,5). Подставив полученные значения в (9.21), получим:

Статистические критерии

К оглавлению…

Прежде чем перейти к рассмотрению понятия статистической гипотезы, сформулируем так называемый принцип практической уверен-посты, лежащий в основе применения выводов и рекомендаций, полученных с помощью теории вероятностей и математической статистики.

Если вероятность события А в данном испытании очень мала, то при однократном испытании можно быть уверенным в том, что событие А не произойдет, и в практической деятельности вести себя так, как будто событие А вообще невозможно.

Вопрос о том, насколько малой должна быть вероятность а события А, чтобы его можно было считать практически невозможным, выходит за рамки математической теории и решается в каждом отдельном случае с учетом важности последствий, вытекающих из наступления события А. В ряде случаев можно пренебречь событиями, вероятность которых меньше 0,05, а в других, когда речь идет, например, о разрушении сооружений, гибели судна и т. п., нельзя пренебрегать событиями, которые могут появиться с вероятностью, равной 0,00К

Статистическим критерием (или просто критерием) называют случайную величину Кщ которая служит для проверки гипотезы.

Критерии значимости (критерии проверки гипотез, иногда просто тесты) — это простейшие, но наиболее широко используемые стати сти ч ее к и е средства.

Критерий значимости дает возможность статистику найти разумный ответ на вопрОС, подобный следующим;

• Сталь, произведенная разными методами, имеет неодинаковые пределы прочности. «Указывает ли это на то, что производимая разными методами сталь имеет различную прочность или же выявленное различие можно объяснить выборочными флуктуация ми?»

• «Превосходит ли по эффективности одно противогриппозное средство другое?»

• «Способствует ли отказ от курения снижению вероятности раковых заболеваний?»

• «Превосходит ли по воздействию одно удобрение другое приращивании овощей ? »

Проверка гипотез

К оглавлению…

Статистически называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Рассмотрим простейший вид статистической процедуры, называемой проверкой гипотез. Пусть дана некоторая оценка построенная по выборке из я независимых наблюдений СВ . Предположим, что есть основания считать истинное значение оцениваемого параметра равным .

Однако, даже если истинное значение параметра равно выборочное значение , вероятно, не будет в точности равняться из-за выборочной изменчивости, присущей . Поэтому сформулируем следующий вопрос. Если предположить, что = то при каком отклонении от эта гипотеза должна быть отвергнута как несостоятельная? На этот вопрос ответ можно дать в статистических терминах, вычислив вероятность любого значимого отклонения от по выборочному распределению . Если вероятность такого отличия мала, то отличие следует считать значимым и гипотеза = должна быть отвергнута. Если же вероятность такого отличия велика, то отклонение следует приписать естественной статистической изменчивости и гипотеза = может быть принята.

Проиллюстрируем общий подход, предположив, что выборочное значение , являющееся оценкой параметра имеет плотность вероятности нормального распределения . Теперь, если гипотеза , верна, то должна иметь среднее значение (рис. ЮЛ).

Вероятность использованная при испытании гипотез, называется уровнем значимости критерия.

Вероятность того, что окажется меньше нижней границы , равна вероятности того, что превзойдет верхнюю границу и каждая из них равна . Следовательно, вероятность того, что окажется вне интервала, заключенного между этими границами, равна а. Область значений , при которых гипотеза принимается, называется областью принятия гипотезы

Нулевой (основной) называют выдвинутую гипотезу . В данном

примере : .

Область значений при которых гипотеза должна быть отверг нута, называется областью отклонения гипотезы, или критической областью,

Конкурирующей (альтернативной) называют гипотезу, которая противоречит нулевой.

В данном примере

Рассмотренный нами простой критерий испытания гипотез называется двусторонним критерием, так как, когда гипотеза неверна, значение может быть либо больше, либо меньше .

В ряде случаев достаточно бывает односторонних критериев (рис. 10.2). Например, пусть основная гипотеза

Тогда альтернативная гипотеза:

Следовательно, в критерии должна использоваться только нижняя (левая} граница определяемая по плотности вероятности .

Кстати готовые на продажу задачи тут, и там же теория из учебников может быть вам поможет она.

Ошибки проверки гипотез

К оглавлению…

При проверке гипотезы возможны два типа ошибок.

  • Во-первых, гипотеза может быть отклонена, хотя фактически она верна. Такая ошибка называется ошибкой первого рода.
  • Во-вторых, гипотеза может быть принята, хотя фактически она неверна. Такая ошибка называется ошибкой второго рода.

Проиллюстрируем эти понятия графически (рис, 10.3).

Из рисунка видно, что ошибка первого рода происходит в том случае, когда при справедливости гипотезы значение попадает в область ее отклонения (критическую область). Следовательно„ вероятность ошибки первого рода равна — уровню значимости критерия.

Для определения вероятности ошибки второго рода предположим, к примеру, что истинный параметр равен либо

либо

(см. рис. 10.3), Если гипотеза состоит в том, что

тогда как на самом деле

то вероятность того, что попадает в область принятия гипотезы, заключенную между

равна Следовательно, вероятность ошибки второго рода равна при выявлении отклонения величиной ±d от гипотетического значения .

Вероятность называется мощностью критерия Следует отмстить, что вероятности ошибок первого и второго рода вычисляются при разных предположениях о распределении (если верна гипотеза и если верна гипотеза ), так что никаких раз и навсегда фиксированных соотношений (например , независимо от вида гипотезы и вида критерия) между ними нет. Таким образом, при фиксированном объеме выборки мы можем сколь угодно уменьшать ошибку первого рола, уменьшая уровень значимости . При этом, естественно, возрастает вероятность — ошибки второго рода (уменьшается мощность критерия). Единственный способ одновременно уменьшить ошибки первого и второго рода — увеличить размер выборки .

Именно такие соображения лежат в основе выбора нужного размера выборки в статистических экспериментах.

Пример № 5

Построение критерия проверки гипотез,

Предположим, что среднее значение СВ равно

также предположим, что дисперсия известна и равна

Необходимо найти объем выборки, позволяющий построить критерий проверки гипотезы

с 5%-м уровнем значимости и 5%-й ошибкой второго рода для выявления 10%-х отклонений от гипотетического значения. Построим также область принятия гипотезы .

Решение:

Выборочное среднее определяемое формулой (8.6), является несмещенной оценкой . Соответствующее выборочное распределение определяется из соотношения (9.7):

где имеет распределение Верхняя и нижняя границы области принятия гипотезы соответственно равны:

Если теперь истинное среднее значение равно

то с вероятностью произойдет ошибка второго рода, если выборочное среднее окажется меньше (левее) верхней границы и больше (правее) нижней. В терминах выборочного распределения со средним

или

для верхней и нижней границ (рис. 10,3);

Итак, справедливы следующие равенства:

Вспомним, что благодаря симметричности распределения справедливы равенства:

Теперь из (10.4) с учетом (10.5) найдем требуемый объем выборки:

Для конкретных значений данного примера:

Подставим эти значения в (10.6) и получим значение необходимою объема выборки . Таким образом, объем выборки должен быть равен или больше пятидесяти двух. Область принятия гипотезы определяется соответствующими границами (верхней и нижней (10.2)):

Возможно эти страницы вам будут полезны: