Примеры решения задач по математической статистике

Примеры решения задач по математической статистике

Здравствуйте на этой странице я собрала примеры решения задач по предмету математическая статистика с решением по каждой теме, чтобы вы смогли освежить знания!

Если что-то непонятно вы всегда можете написать мне в воцап и я вам помогу!

Математическая статистика

Математическая статистика – раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений.

Статистическое описание применяют к таким физическим процессам, для которых результат отдельного измерения не может быть предсказан с необходимой точностью. Тем не менее, при проведении достаточто большого числа повторных измерений может быть с достаточно хорошей точностью предсказана некоторая величина, являющаяся функцией результатов измерений.

При построении моделей в математической статистике предполагают вероятностную природу наблюдаемых явлений и используют математический аппарат теории вероятностей. Хотя математическая статистика и опирается на методы и понятия теории вероятностей, но можно сказать, что в каком-то смысле математическая статистика решает обратные задачи.

Основные понятия и задачи математической статистики

Математическая статистика — это наука, изучающая методы сбора, систематизации и интерпретации числовых (случайных) данных,

В этом определении интерпретация и систематизация данных рассматривается как существенный аспект.

Главная цель статистики — получение осмысленных заключений из несогласованных (подверженных разбросу) данных.

Действительно, исключая тривиальные ситуации, реальные данные всегда являются несогласованными, что требует применения статистических методов. Рассогласованность (разброс) между индивидуальными наблюдениями может быть, например, обусловлена ошибкой при считывании позиции стрелки прибора, когда она расположена между двумя делениями шкалы стрелочного прибора. Изменчивость может быть также следствием нестабильности работы электронного оборудования при передаче сообщений по радио или телеграфу. (В последнем случае для характеристики ситуации используется термин «шум»).

Чем же конкретно занимается математическая статистика? Какие задачи решает?

Возможно эта страница вам будет полезна:

Предмет теория вероятностей и математическая статистика

Выборочные распределения

Статистика должна получить свои выводы, используя наличную выборку. Каждое наблюдение является реализацией некоторой случайной величины. Известно множество значений, которые может принимать случайная величина; некоторые из них имеют большую возможность появления, чем другие.

Значение, которое наблюдалось, представляет собой реализацию. Вероятности возможных реализаций характеризуются распределением вероятностей случайных величин (СБ). Обычно функции распределения вероятностей бывают заданы с точностью до одного, двух параметров значений некоторых неизвестных. Это приводит к проблеме поиска таких комбинаций выборочных значений, которые бы давали наилучшее приближение для неизвестных параметров. Каждая такая комбинация и есть статистика. Выборочное распределение статистики поволяет судить, может ли предложенная статистика служить оценкой интересующего нас параметра,

Оценки, тесты (критерии значимости), решения Проблема оценивания была схематично рассмотрена выше. Ясно, что разумная процедура оценивания не должна ограничиваться лишь выбором приближенного численного значения для неизвестного параметра; она должна что-то говорить и о надежности этого приближения. Обычно говорят о точечном оценивании и об интервальном оценивании.

Существуют различные методы конструирования точечных оценок и определения их надежности. Наиболее полезным из них является метод максимального правдоподобия (ММП). Другой известный метод, который можно рассматривать либо как специальный случай ММП, либо как независимую процедуру подгонки, — метод наименьших квадратов.

Интервальное оценивание связано с определением «доверительных интервалов», правдоподобных интервалов, байесовских интервалов.

Поскольку статистика в целом основана на случайной изменчивости, каждая оценка подвержена ошибке. Так, если получены две различные оценки параметра — одна при одном наборе условий, а другая -при другом, непосредственно неясно, соответствует ли имеющееся между ними различие различию между параметрами. Вопрос об их различии решается с помощью статистического критерия (теста) или критерия значимости.

Один из подходов к статистическим критериям (проверки гипотез) связан с именем Р.А. Фишера, который рассматривает проверку гипотезы как пробный шаг в проведении научного исследования, позволяющий получить ученому объективный критерий, с помощью которого можно судить об истинности гипотезы.

Другой подход связан в основном с именами Дж. Неймана и Э. Пирсона, которые рассматривают процедуру проверки гипотезы как правило, с помощью которого должен быть сделан выбор либо принято решение об истинности одной гипотезы в противоречие другой.

Одна из частных проблем теории проверки статистических гипотез -оценка пригодности модели, предложенной для объяснения (интерпретации) данных, При этом необходимо решить: насколько предложенная модель соответствует выборке? И являются ли выборочные значения действительно близкими к тем, которые можно ожидать, используя подогнанную модель? Наиболее широко для решения подобных вопросов применяется процедура, предложенная Карлом Пирсоном и использующая критерий, основанный на ее выборочном распределении. Это пирсоновский критерий согласия хи-квадрат.

Генеральной совокупностью случайной величины

Статистическая устойчивость случайных явлений проявляется лишь при большом (в пределе — бесконечно большом) числе наблюдений. Однако на практике реальное число наблюдений ограничено. Поэтому характеристики случайных величин (СВ), определенные по малому числу наблюдений, в принципе не должны совпадать с величинами тех же характеристик, определенными по большому числу наблюдений (условия опыта остаются неизменными). Чтобы провести различие между характеристиками СВ, найденными по достаточно большому и малому числу наблюдений, в математической статистике введены понятия абстрактной генеральной совокупности и выборки.

Генеральной совокупностью случайной величины Примеры решения задач по математической статистике называется множество всех значений, которые может принимать случайная величина Примеры решения задач по математической статистике.

Выпорка представляет собой совокупность ограниченного числа наблюдений.

В соответствии с этим различают выборочные характеристики СВ, найденные по ограниченному числу наблюдений (выборке) и зависящие от числа наблюдений, и соответствующие им характеристики в генеральной совокупности, не зависящие от числа наблюдений. При этом выборочные характеристики рассматриваются как оценки соответствующих характеристик в генеральной совокупности.

На практике во многих случаях функция распределения рассматриваемой случайной величины Примеры решения задач по математической статистике неизвестна; ее определяют по результатам наблюдений или, как говорят, по выборке.

Выборкой объемом Примеры решения задач по математической статистике для данной случайной величины Примеры решения задач по математической статистике называется последовательность Примеры решения задач по математической статистике независимых наблюдений этой величины.

Пусть из генеральной совокупности извлечена выборка, причем

Примеры решения задач по математической статистике

Объем выборки:

Примеры решения задач по математической статистике

Наблюдаемые значения Примеры решения задач по математической статистике называют вариантами, а последовательность вариантов, записанных в возрастающем порядке, — вариационным рядом.

Число наблюдений называют частотами, а их отношение к объему выборки: Примеры решения задач по математической статистике — относительными частотами (частостями).

В статистике различают малые и большие выборки.

Малой выборкой считают такую выборку, при обработке которой методами, основанными на группировании наблюдений, нельзя достичь заданных точности и достоверности.

Больший считают такую выборку, при обработке которой можно перейти к группированию наблюдений без ощутимой потери информации и достижению заданных значений точности и достоверности.

Если выборка достаточно велика, то построенный на ее основе вариационный ряд неудобен для дальнейшего статистического анализа. В Этом случае строится гак называемый группированный статистический ряд.

Группирование данных, гистограмма, полигон

При группировании данных необходимо соблюдать определенные правила. Рассмотрим наиболее важные из них:

  1. Объем выборки должен быть достаточно велик Примеры решения задач по математической статистике.
  2. Число интервалов группирования Примеры решения задач по математической статистике (число групп) должно находиться в интервале Примеры решения задач по математической статистике. При выборе Примеры решения задач по математической статистике в каждом конкретном случае следует помнить, что при малом числе групп определение вида теоретической кривой распределения по эмпирическим данным может быть затруднено из-за маскировки (утраты) резких изменений кривой распределения, если они фактически имели место. При большом числе групп и незначительном объеме выборки будет наблюдаться большое количество пропусков (ноль попаданий в группу), что будет обусловлено не столько видом распределения, сколько недостатком статистики, кроме того, в этом случае даже небольшие случайные колебания приводят к искажению кривой распределения.
  3. Необходимо, по возможности, охватывать всю область данных, так как при неизвестных предельных значениях невозможно вычислить некоторые числовые характеристики выборки.
  4. Интервалы не должны перекрываться. Не должно возникать никаких сомнений относительно того, в какой интервал попадает любое значение.
  5. Если заведомо известно, что теоретическая кривая может быть двумодальной, число групп может быть увеличено в 1,5-2 раза по сравнению с оптимальным числом Примеры решения задач по математической статистике.

Оптимальное число групп Примеры решения задач по математической статистике выборки объемом Примеры решения задач по математической статистике рассчитывается по формулам:

• при известном значении

Примеры решения задач по математической статистике
Примеры решения задач по математической статистике

• при неизвестном значении Примеры решения задач по математической статистике, но известно, что

Примеры решения задач по математической статистике
Примеры решения задач по математической статистике

• согласно формуле Стерджесса:

Примеры решения задач по математической статистике

Из (8.3) видно, что для увеличения оптимального количества интервалов на единицу необходимо увеличить объем выборки вдвое, Шаг группирования (ширина интервала) Примеры решения задач по математической статистике определяется по формуле:

Примеры решения задач по математической статистике

Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма и кумулятивная кривая.

Гистограммой распределения, или просто гистограммой называется чертеж в прямоугольной системе координат, горизонтальная ось которого разбивается на Примеры решения задач по математической статистике равных интервалов (групп) шириной Примеры решения задач по математической статистике. На каждом отрезке, как на основании, строится прямоугольник с высотой, равной частоте (частости) Примеры решения задач по математической статистике соответствующего интервала.

Полигоном распределения. или просто полигоном называется ломаная линия, соединяющая середины верхних оснований каждого столбца гистограммы. За пределами гистограммы как слева, так и справа размещают пустые интервалы, в которых точки, соответствующие их серединам, лежат на оси абсцисс.

Кумулятивная кривая (кумулята) — кривая накопления частот (час-гостей). Для дискретного ряда кумулята представляет ломаную, соединяющую точки

Примеры решения задач по математической статистике

Для интервального вариационного ряда ломаная начинается с точки, абсцисса которой равна началу первого интервала, а ордината — накопленной частоте (частости), равной нулю. Остальные точки этой ломаной соответствуют концам интервалов.

Пример № 1

Построить полигон, гистограмму и кумуляту по выборке объема Примеры решения задач по математической статистике. Сгруппированные данные приведены в таблице.

Примеры решения задач по математической статистике
Примеры решения задач по математической статистике

Статистическая (эмпирическая) функция распределения

Статистическим распределением выборки называют перечень вариантов и соответствующих им частот или относительных частот (частосгпей).

В теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике — соответствие между наблюдаемыми значениями и их частотами или относительными частотами.

Пример № 2

Задана выборка объемом Примеры решения задач по математической статистике с соответствующими частотами. Необходимо найти частости (относительные частоты).

Примеры решения задач по математической статистике

Контроль:

Примеры решения задач по математической статистике

Пусть исследуется статистическое распределение частот количественного признака (случайной величины) Примеры решения задач по математической статистике. Введем обозначение:

Примеры решения задач по математической статистике — число наблюдений, при которых отслеживалось значение признака меньшее Примеры решения задач по математической статистике;

Примеры решения задач по математической статистике — общее число наблюдений (объем выборки). Очевидно, что относительная частота (частость) события Примеры решения задач по математической статистике равна Примеры решения задач по математической статистике.

Статистической функцией распределения случайной величины Примеры решения задач по математической статистике называется функция, определяющая для каждого значения Примеры решения задач по математической статистике относительную частоту события Примеры решения задач по математической статистике:

Примеры решения задач по математической статистике

Сравним статистическую и интегральную функции распределения. Вспомним (теорема Бернулли), что относительная частота события Примеры решения задач по математической статистике, то есть Примеры решения задач по математической статистике стремится по вероятности к вероятности Примеры решения задач по математической статистике этого события.

Функция Примеры решения задач по математической статистике обладает теми же свойствами, что и Примеры решения задач по математической статистике:

  1. Значения Примеры решения задач по математической статистике.
  2. Эмпирическая функция распределения Примеры решения задач по математической статистике— неубывающая.
  3. Если Примеры решения задач по математической статистике — наименьшая варианта, то Примеры решения задач по математической статистике при Примеры решения задач по математической статистике.
  4. Если Примеры решения задач по математической статистике — наибольшая варианта, то Примеры решения задач по математической статистике при Примеры решения задач по математической статистике.

Пример № 3

Построить эмпирическую функцию по данной выборке:

Примеры решения задач по математической статистике

Решение:

Найдем объем выборки Примеры решения задач по математической статистике = 12 + 18 + 30 = 60. Теперь найдем статистическую функцию распределения:

Примеры решения задач по математической статистике

Представим Примеры решения задач по математической статистике в аналитическом и графическом виде:

Примеры решения задач по математической статистике
Примеры решения задач по математической статистике

Выборочные значения и оценка параметров

Рассмотрим один из возможных методов оценивания среднего значения и дисперсии случайной величины Примеры решения задач по математической статистике по Примеры решения задач по математической статистике независимым наблюдениям:

Примеры решения задач по математической статистике

Здесь Примеры решения задач по математической статистике и Примеры решения задач по математической статистике — выборочное среднее и выборочная дисперсия соответственно. Индекс в формуле Примеры решения задач по математической статистике (см. 8.7) указывает на смещенность оценки дисперсии. Наряду с вышеприведенными характеристиками, при обработке результатов наблюдений обычно находят следующие оценки:

• выборочная дисперсия (несмещенная)

Примеры решения задач по математической статистике

♦ среднее квадратическое отклонение

Примеры решения задач по математической статистике

• выборочный коэффициент асимметрии

Примеры решения задач по математической статистике

выборочный коэффициент эксцесса

Примеры решения задач по математической статистике

Для установления качества или «правильности» любой оценки используются свойства (требования) «хороших оценок».

Требования «хороших оценок»

1 Несмещенность.

Во-первых, желательно, чтобы математическое ожидание оценки равнялось оцениваемому параметру:

Примеры решения задач по математической статистике

где Примеры решения задач по математической статистике — оценка параметра Примеры решения задач по математической статистике. Если свойство (8.12) имеет место, то оценка называется несмещенной.

2, Эффективность,

Во-вторых, желательно, чтобы среднеквадратическая ошибка данной оценки была наименьшей среди всех возможных оценок, то есть:

Примеры решения задач по математической статистике

где Примеры решения задач по математической статистике — исследуемая оценка, a Примеры решения задач по математической статистике — любая другая оценка. Если по свойство имеет место, то оценка Примеры решения задач по математической статистике называется эффективной.

3* Состоятельность,

В-третьих, желательно, чтобы оценка сходилась к оцениваемому параметру с вероятностью, стремящейся к единице по мере увеличения размера выборки, то есть для любого Примеры решения задач по математической статистике

Примеры решения задач по математической статистике

Если выполнено условие (8,14), то оценка называется состоятельной. Из неравенства Чебышева следует, что достаточным для выполнения (8.14) является условие:

Примеры решения задач по математической статистике

В качестве примера «хорошей оценки» рассмотрим оценку среднего значения (8.6). Математическое ожидание выборочного среднего Примеры решения задач по математической статистике равно:

Примеры решения задач по математической статистике

Следовательно, согласно (8.12), оценка Примеры решения задач по математической статистике несмещенная.

Среднеквадратическая ошибка выборочного среднего Примеры решения задач по математической статистике равна:

Примеры решения задач по математической статистике

Поскольку наблюдения Примеры решения задач по математической статистике, независимы, то математическое ожидание членов, содержащих смешанные произведения, равны нулю. Поэтому из (8.17) получим:

Примеры решения задач по математической статистике

Таким образом, согласно (8.15) оценка Примеры решения задач по математической статистике — состоятельная. Можно показать, что эта оценка эффективна.

Рассмотрим оценку дисперсии по формуле (8.7).

Примеры решения задач по математической статистике

Однако

Примеры решения задач по математической статистике

Поскольку

Примеры решения задач по математической статистике

то, подставив получим:

Примеры решения задач по математической статистике

Следовательно, оценка Примеры решения задач по математической статистике — смещенная.

Хотя оценка (выборочная дисперсия) Примеры решения задач по математической статистике и является смещенной, она состоятельна и эффективна. Из (8.21) понятно, что для получения несмещенной оценки Примеры решения задач по математической статистике следует взять несколько видоизмененную выборочную дисперсию (8.8).

Интервальное оценивание

Ранее мы обсудили использование выборочных значений в качестве оценок параметров случайных величин. Однако такие процедуры дают только точечные оценки интересующих нас параметров и не позволяют судить о степени близости выборочных значений к оцениваемому параметру. Более предпочтительная процедура — построения интервала, который накрывает оцениваемый параметр с известной степенью достоверности, Такой подход называется «интервальным оцениванием».

Сразу отметим следующее: чем больше уверенность в том, что оцениваемый параметр лежит в интервале, тем шире интервал.

Так что искать интервал, накрывающий параметр с вероятностью, равной единице, бессмысленно. Это вся область Примеры решения задач по математической статистике, то естьПримеры решения задач по математической статистике.

Пусть для параметра Примеры решения задач по математической статистике получена несмещенная оценка Примеры решения задач по математической статистике. Мы хотим оценить возможную при этом ошибку. Назначим некоторую достаточно большую вероятность Примеры решения задач по математической статистике (например: Примеры решения задач по математической статистике …)„ такую, что событие с вероятностью Примеры решения задач по математической статистике можно считать практически достоверным, и найдем такое значение Примеры решения задач по математической статистике, для которого выполняется соотношение

Примеры решения задач по математической статистике

Тогда диапазон практически возможных значений ошибки, возникающей при замене Примеры решения задач по математической статистике на Примеры решения задач по математической статистике будет равен Примеры решения задач по математической статистике Ошибки, большие по абсолютной величине Примеры решения задач по математической статистике будут появляться с малой вероятностью Примеры решения задач по математической статистике. Запишем (9.1) в другом виде:

Примеры решения задач по математической статистике

То есть неизвестное значение параметра Примеры решения задач по математической статистике с вероятностью Примеры решения задач по математической статистике попадает в интервал

Примеры решения задач по математической статистике

Ранее (в теории вероятностей) мы рассматривали вероятность попадания случайной величины на некоторый интервал. У нас же а не случайная величина, а интервал случаен, здесь корректно говорить о вероятности Примеры решения задач по математической статистике накрыть точку а.

Вероятность Примеры решения задач по математической статистике принято называть доверительной вероятностью, а интервал Примеры решения задач по математической статистике — доверительным интервалом.

Рассмотрим задачу нахождения доверительных границ Примеры решения задач по математической статистике и Примеры решения задач по математической статистике параметра Примеры решения задач по математической статистике, имеющего несмещенную оценку Примеры решения задач по математической статистике. Если бы нам был известен закон распределения величины Примеры решения задач по математической статистике, то из выражения (9.1) нахождение Примеры решения задач по математической статистике при заданной Примеры решения задач по математической статистике не представляло бы затруднений. Однако, как правило, мы не знаем закон распределения случайной величины Примеры решения задач по математической статистике.

Пусть теперь распределение случайной величины Примеры решения задач по математической статистике отлично от нормального. Применяя центральную предельную теорему, получаем следующий результат.

С увеличением объема выборки Примеры решения задач по математической статистике выборочное распределение выборочного среднего Примеры решения задач по математической статистике стремится к нормальному распределению независимо от вида распределения исходной случайной величины.

Практически во многих случаях выборочное Примеры решения задач по математической статистике можно считать нормальным уже при Примеры решения задач по математической статистике, а при Примеры решения задач по математической статистике приближение будет хорошим.

В качестве примера рассмотрим задачу нахождения доверительного интервала математического ожидания, Пусть произведено Примеры решения задач по математической статистике независимых опытов над случайной величинойПримеры решения задач по математической статистике с неизвестными Примеры решения задач по математической статистике.

Для этих параметров выберем оценки:

Примеры решения задач по математической статистике

Необходимо построить доверительный интервал Примеры решения задач по математической статистике соответствующий доверительной вероятности Примеры решения задач по математической статистике:

Примеры решения задач по математической статистике

Интервальная оценка математического ожидания при известной дисперсии

Пусть СВ Примеры решения задач по математической статистике имеет гауссово распределение с параметрами Примеры решения задач по математической статистике причем Примеры решения задач по математической статистике неизвестно значение Примеры решения задач по математической статистике известно. Тогда эффективной оценкой параметра Примеры решения задач по математической статистике будет Примеры решения задач по математической статистике.

При этом Примеры решения задач по математической статистике имеет нормальное распределение

Примеры решения задач по математической статистике

Статистика (оценка) СВ

Примеры решения задач по математической статистике

имеет распределение Примеры решения задач по математической статистике, независимо от параметра Примеры решения задач по математической статистике, и как функция Примеры решения задач по математической статистике — непрерывна и монотонна. Вспомним, что Примеры решения задач по математической статистике. Тогда, с учетом (9.2), запишем:

Примеры решения задач по математической статистике

где Примеры решения задач по математической статистике ~ квантили стандартного нормального распределения Примеры решения задач по математической статистике, причем Примеры решения задач по математической статистике Подставим Примеры решения задач по математической статистике в явном виде в (9.6):

Примеры решения задач по математической статистике

Запишем это неравенство относительно Примеры решения задач по математической статистике:

Примеры решения задач по математической статистике

Квантили стандартного нормального распределения определяются по таблицам, тогда окончательно получим:

Примеры решения задач по математической статистике

Искомый доверительный интервал математического ожидания нормально распределенной СВ с известной дисперсией равен:

Примеры решения задач по математической статистике

На рис. 9.1 представлена плотность распределения стандартного нормального распределения с отмеченными квантилями Примеры решения задач по математической статистике.

Примеры решения задач по математической статистике

Интервальная оценка математического ожидания при неизвестной дисперсии

На практике почти всегда генеральная дисперсия Примеры решения задач по математической статистике (как и оцениваемое математическое ожидание Примеры решения задач по математической статистике) неизвестна. Итак, имеется нормально распределенная СВ

Примеры решения задач по математической статистике

с неизвестными параметрами Примеры решения задач по математической статистике и Примеры решения задач по математической статистике случайной выборке найдем несмещенные, эффективные оценки

Примеры решения задач по математической статистике

Построение интервальной оценки основано на статистике:

Примеры решения задач по математической статистике

Вспомним, что

Примеры решения задач по математической статистике

и подставим в (9.11):

Примеры решения задач по математической статистике

Числитель выражения (9.12), как было показано выше, имеет стандартное нормальное распределение Примеры решения задач по математической статистике. Показано, что величина Примеры решения задач по математической статистике имеет Примеры решения задач по математической статистике распределение с Примеры решения задач по математической статистике степенями свободы. А статистика Примеры решения задач по математической статистике имеет распределение Стыодснта с Примеры решения задач по математической статистике степенями свободы. Распределение Стьюдента не зависит от неизвестных параметров распределения случайной величины Примеры решения задач по математической статистике, а зависит лишь от числа Примеры решения задач по математической статистике.

Следует отметить, что распределение Стьюдента напоминает нормальное распределение, и при Примеры решения задач по математической статистике сколь угодно близко приближается к нему.

Число степеней свободы Примеры решения задач по математической статистике определяется как общее число Примеры решения задач по математической статистике наблюдений (вариантов) случайной величины Примеры решения задач по математической статистике минус число уравнений, связывающих эти наблюдения, то есть Примеры решения задач по математической статистике

Так, например, для распределения Примеры решения задач по математической статистике статистики число степеней свободы Примеры решения задач по математической статистике, поскольку одна степень свободы «теряется» при определении выборочного среднего Примеры решения задач по математической статистике (Примеры решения задач по математической статистике наблюдений связаны одним уравнением).

Таким образом, по аналогии с (9.6) запишем:

Примеры решения задач по математической статистике

Ha рис. 9,2 представлена плотность распределения Стьюдента с пятнадцатью степенями свободы.

Доверительный интервал математического ожидания нормально распределенной СB с неизвестной дисперсией равен:

Примеры решения задач по математической статистике

Интервальная оценка выборочной дисперсии

Доверительный интервал для оценки дисперсии по выборочной дисперсии Примеры решения задач по математической статистике для СВ

Примеры решения задач по математической статистике

строится аналогичным образом.

Естественно, что в качестве математического ожидания и дисперсии гауссовой СВ мы возьмем их несмещенные и эффективные оценки:

Примеры решения задач по математической статистике

Исходя из вышесказанного, запишем:

Примеры решения задач по математической статистике

Это интервал, который с вероятностью Примеры решения задач по математической статистике накрывает неизвестную дисперсию. Из статистики известно, что если СВ Примеры решения задач по математической статистике имеет гауссово распределение

Примеры решения задач по математической статистике

то справедливо соотношение:

Примеры решения задач по математической статистике

Здесь Примеры решения задач по математической статистике хи-квадрат распределения с Примеры решения задач по математической статистике степенями свободы. Теперь, задавая Примеры решения задач по математической статистике или что равносильно Примеры решения задач по математической статистике, можно найти квантили (соответствующие) Примеры решения задач по математической статистике. При этом следует учесть, что распределение не симметрично (рис. 9.3).

Примеры решения задач по математической статистике

Как же решить эту задачу однозначно? Ведь сдвигая интервал влево или вправо соответствующим образом, можно для заданной доверительной вероятности найти бесконечное множество решений (интервалов).

Для обеспечения единообразия условились выбирать такие квантили (интервал), чтобы площадь под кривой, лежащая левее левой квантили, равнялась площади под кривой, расположенной правее правой квантили:

Примеры решения задач по математической статистике

Тогда из (9.19), учитывая (9.20), получим соответствующие границы интервала:

Примеры решения задач по математической статистике

Пример № 4

Дана выборка СВ Примеры решения задач по математической статистике объемом Примеры решения задач по математической статистике. Предполагается, что СВ Примеры решения задач по математической статистике распределена нормально с неизвестными параметрами Примеры решения задач по математической статистике.

Примеры решения задач по математической статистике

Необходимо найти доверительные интервалы для математического ожидания и дисперсии при доверительной вероятности, равной 0,97,

Решение:

В качестве несмещенных и эффективных оценок вычислим:

Примеры решения задач по математической статистике

a) Вычислим доверительный интервал для математического ожидания, если дисперсия известна (полагаем, что Примеры решения задач по математической статистике). Тогда из таблицы нормального распределения получим

Примеры решения задач по математической статистике

Подставим значения квантилий в (9.9) и (9.10):

Примеры решения задач по математической статистике
Примеры решения задач по математической статистике

b) Вычислим доверительный интервал для математического ожидания, при неизвестной дисперсии. Воспользуемся таблицей распределения Стьюдснта с числом степеней свободы

Примеры решения задач по математической статистике

Соответствующие квантили равны

Примеры решения задач по математической статистике

Подставим полученные значения в (9.15) и (9.16):

Примеры решения задач по математической статистике

c) Вычислим доверительный интервал для дисперсии. Воспользуемся таблицей распределения Примеры решения задач по математической статистике Симметричный 97 % вероятностный интервал с

Примеры решения задач по математической статистике

числом степеней свободы: (2,33; 20,5). Подставив полученные значения в (9.21), получим:

Примеры решения задач по математической статистике

Статистические критерии

Прежде чем перейти к рассмотрению понятия статистической гипотезы, сформулируем так называемый принцип практической уверен-посты, лежащий в основе применения выводов и рекомендаций, полученных с помощью теории вероятностей и математической статистики.

Если вероятность события А в данном испытании очень мала, то при однократном испытании можно быть уверенным в том, что событие А не произойдет, и в практической деятельности вести себя так, как будто событие А вообще невозможно.

Вопрос о том, насколько малой должна быть вероятность а события А, чтобы его можно было считать практически невозможным, выходит за рамки математической теории и решается в каждом отдельном случае с учетом важности последствий, вытекающих из наступления события А. В ряде случаев можно пренебречь событиями, вероятность которых меньше 0,05, а в других, когда речь идет, например, о разрушении сооружений, гибели судна и т. п., нельзя пренебрегать событиями, которые могут появиться с вероятностью, равной 0,00К

Статистическим критерием (или просто критерием) называют случайную величину Кщ которая служит для проверки гипотезы.

Критерии значимости (критерии проверки гипотез, иногда просто тесты) — это простейшие, но наиболее широко используемые стати сти ч ее к и е средства.

Критерий значимости дает возможность статистику найти разумный ответ на вопрОС, подобный следующим;

• Сталь, произведенная разными методами, имеет неодинаковые пределы прочности. «Указывает ли это на то, что производимая разными методами сталь имеет различную прочность или же выявленное различие можно объяснить выборочными флуктуация ми?»

  • «Превосходит ли по эффективности одно противогриппозное средство другое?»
  • «Способствует ли отказ от курения снижению вероятности раковых заболеваний?»
  • «Превосходит ли по воздействию одно удобрение другое приращивании овощей ? »

Проверка гипотез

Статистически называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Рассмотрим простейший вид статистической процедуры, называемой проверкой гипотез. Пусть дана некоторая оценка Примеры решения задач по математической статистике построенная по выборке из я независимых наблюдений СВ Примеры решения задач по математической статистике. Предположим, что есть основания считать истинное значение оцениваемого параметра равным Примеры решения задач по математической статистике.

Однако, даже если истинное значение параметра Примеры решения задач по математической статистике равно выборочное значение Примеры решения задач по математической статистике, вероятно, не будет в точности равняться из-за выборочной изменчивости, присущей Примеры решения задач по математической статистике. Поэтому сформулируем следующий вопрос. Если предположить, что Примеры решения задач по математической статистике=Примеры решения задач по математической статистике то при каком отклонении Примеры решения задач по математической статистике от Примеры решения задач по математической статистике эта гипотеза должна быть отвергнута как несостоятельная? На этот вопрос ответ можно дать в статистических терминах, вычислив вероятность любого значимого отклонения Примеры решения задач по математической статистике от Примеры решения задач по математической статистике по выборочному распределению Примеры решения задач по математической статистике. Если вероятность такого отличия мала, то отличие следует считать значимым и гипотезаПримеры решения задач по математической статистике = Примеры решения задач по математической статистике должна быть отвергнута. Если же вероятность такого отличия велика, то отклонение следует приписать естественной статистической изменчивости и гипотеза = может быть принята.

Проиллюстрируем общий подход, предположив, что выборочное значение Примеры решения задач по математической статистике, являющееся оценкой параметра Примеры решения задач по математической статистике имеет плотность вероятности нормального распределения Примеры решения задач по математической статистике. Теперь, если гипотеза Примеры решения задач по математической статистике, верна, то Примеры решения задач по математической статистике должна иметь среднее значение Примеры решения задач по математической статистике (рис. ЮЛ).

Вероятность использованная при испытании гипотез, называется уровнем значимости критерия.

Вероятность того, что Примеры решения задач по математической статистике окажется меньше нижней границы Примеры решения задач по математической статистике, равна вероятности того, что Примеры решения задач по математической статистике превзойдет верхнюю границу Примеры решения задач по математической статистике и каждая из них равна Примеры решения задач по математической статистике. Следовательно, вероятность того, что Примеры решения задач по математической статистике окажется вне интервала, заключенного между этими границами, равна а. Область значений Примеры решения задач по математической статистике, при которых гипотеза принимается, называется областью принятия гипотезы

Нулевой (основной) называют выдвинутую гипотезу Примеры решения задач по математической статистике. В данном

примере Примеры решения задач по математической статистике: Примеры решения задач по математической статистике.

Область значений Примеры решения задач по математической статистике при которых гипотеза должна быть отверг нута, называется областью отклонения гипотезы, или критической областью,

Примеры решения задач по математической статистике

Конкурирующей (альтернативной) называют гипотезу, которая противоречит нулевой.

В данном примере

Примеры решения задач по математической статистике

Рассмотренный нами простой критерий испытания гипотез называется двусторонним критерием, так как, когда гипотеза неверна, значение может быть либо больше, либо меньше Примеры решения задач по математической статистике.

В ряде случаев достаточно бывает односторонних критериев (рис. 10.2). Например, пусть основная гипотеза

Примеры решения задач по математической статистике

Тогда альтернативная гипотеза:

Примеры решения задач по математической статистике

Следовательно, в критерии должна использоваться только нижняя (левая} граница определяемая по плотности вероятности Примеры решения задач по математической статистике.

Примеры решения задач по математической статистике

Кстати готовые на продажу задачи тут, и там же теория из учебников может быть вам поможет она.

Ошибки проверки гипотез

При проверке гипотезы возможны два типа ошибок.

  • Во-первых, гипотеза может быть отклонена, хотя фактически она верна. Такая ошибка называется ошибкой первого рода.
  • Во-вторых, гипотеза может быть принята, хотя фактически она неверна. Такая ошибка называется ошибкой второго рода.

Проиллюстрируем эти понятия графически (рис, 10.3).

Примеры решения задач по математической статистике

Из рисунка видно, что ошибка первого рода происходит в том случае, когда при справедливости гипотезы Примеры решения задач по математической статистике значение Примеры решения задач по математической статистике попадает в область ее отклонения (критическую область). Следовательно„ вероятность ошибки первого рода равна Примеры решения задач по математической статистике — уровню значимости критерия.

Для определения вероятности ошибки второго рода предположим, к примеру, что истинный параметр равен либо

Примеры решения задач по математической статистике

либо

Примеры решения задач по математической статистике

(см. рис. 10.3), Если гипотеза состоит в том, что

Примеры решения задач по математической статистике

тогда как на самом деле

Примеры решения задач по математической статистике

то вероятность того, что Примеры решения задач по математической статистике попадает в область принятия гипотезы, заключенную между

Примеры решения задач по математической статистике

равна Примеры решения задач по математической статистике Следовательно, вероятность ошибки второго рода равна Примеры решения задач по математической статистике при выявлении отклонения величиной ±d от гипотетического значения Примеры решения задач по математической статистике.

Вероятность называется мощностью критерия Следует отмстить, что вероятности ошибок первого и второго рода вычисляются при разных предположениях о распределении (если верна гипотеза Примеры решения задач по математической статистике и если верна гипотеза Примеры решения задач по математической статистике), так что никаких раз и навсегда фиксированных соотношений (например Примеры решения задач по математической статистике, независимо от вида гипотезы и вида критерия) между ними нет. Таким образом, при фиксированном объеме выборки Примеры решения задач по математической статистике мы можем сколь угодно уменьшать ошибку первого рола, уменьшая уровень значимости Примеры решения задач по математической статистике. При этом, естественно, возрастает вероятность Примеры решения задач по математической статистике — ошибки второго рода (уменьшается мощность критерия). Единственный способ одновременно уменьшить ошибки первого и второго рода — увеличить размер выборки Примеры решения задач по математической статистике.

Именно такие соображения лежат в основе выбора нужного размера выборки в статистических экспериментах.

Пример № 5

Построение критерия проверки гипотез,

Предположим, что среднее значение СВ Примеры решения задач по математической статистике равно

Примеры решения задач по математической статистике

также предположим, что дисперсия известна и равна

Примеры решения задач по математической статистике

Необходимо найти объем выборки, позволяющий построить критерий проверки гипотезы

Примеры решения задач по математической статистике

с 5%-м уровнем значимости и 5%-й ошибкой второго рода для выявления 10%-х отклонений от гипотетического значения. Построим также область принятия гипотезы Примеры решения задач по математической статистике.

Решение:

Выборочное среднее Примеры решения задач по математической статистике определяемое формулой (8.6), является несмещенной оценкой Примеры решения задач по математической статистике. Соответствующее выборочное распределение определяется из соотношения (9.7):

Примеры решения задач по математической статистике

где Примеры решения задач по математической статистике имеет распределение Примеры решения задач по математической статистике Верхняя и нижняя границы области принятия гипотезы соответственно равны:

Примеры решения задач по математической статистике

Если теперь истинное среднее значение равно

Примеры решения задач по математической статистике

то с вероятностью Примеры решения задач по математической статистике произойдет ошибка второго рода, если выборочное среднее Примеры решения задач по математической статистике окажется меньше (левее) верхней границы и больше (правее) нижней. В терминах выборочного распределения Примеры решения задач по математической статистике со средним

Примеры решения задач по математической статистике

или

Примеры решения задач по математической статистике

для верхней и нижней границ (рис. 10,3);

Примеры решения задач по математической статистике

Итак, справедливы следующие равенства:

Примеры решения задач по математической статистике

Вспомним, что благодаря симметричности распределения Примеры решения задач по математической статистикесправедливы равенства:

Примеры решения задач по математической статистике

Теперь из (10.4) с учетом (10.5) найдем требуемый объем выборки:

Примеры решения задач по математической статистике

Для конкретных значений данного примера:

Примеры решения задач по математической статистике
Примеры решения задач по математической статистике

Подставим эти значения в (10.6) и получим значение необходимою объема выборки Примеры решения задач по математической статистике. Таким образом, объем выборки должен быть равен или больше пятидесяти двух. Область принятия гипотезы Примеры решения задач по математической статистике определяется соответствующими границами (верхней и нижней (10.2)):

Примеры решения задач по математической статистике

Возможно эти страницы вам будут полезны: