Математическая статистика задачи с решением

Математическая статистика задачи с решением

Прежде чем изучать готовые решения задач по математической статистике, нужно знать теорию, поэтому для вас я подготовила краткую теорию по предмету «математическая статистика», после которой подробно решены задачи.

Эта страница подготовлена для школьников и студентов.

Если что-то непонятно вы всегда можете написать мне в воцап и я вам помогу!

Математическая статистика

Математическая статистика – это раздел математики, изучающий математические методы сбора, систематизации, обработки и интерпретации результатов наблюдений с целью выявления статистических закономерностей.

Статистический материал и его обработка

Результаты наблюдений массовых явлений, случайных величин составляют статистические данные или статистический материал. Выборкой объёма Решение задач по математической статистике называется совокупность Решение задач по математической статистике случайно отобранных объектов. Множество всех объектов, из которых производится выборка, называется генеральной совокупностью (ГС).

Выборочный метод состоит в том, что на основании изучения некоторого количественного признака Решение задач по математической статистике у некоторой части статистической совокупности (выборки), полученной в результате статистического отбора, можно сделать вывод о характере распределения этого признака по всей статистической совокупности (генеральной совокупности).

Результаты наблюдений выборки Решение задач по математической статистике объёма записываются, в частности, в виде статистической совокупности;

Решение задач по математической статистике

При больших значениях Решение задач по математической статистике и различных значениях xt статистическую совокупность подвергают специальным видам статистической обработки.

Расположим значения Решение задач по математической статистике которые назовём вариантами, в порядке возрастания и обозначим Решение задач по математической статистике. Величина Решение задач по математической статистике называется размахом статистической совокупности. Среди значений Решение задач по математической статистике могут быть одинаковые. Пусть значение Решение задач по математической статистике наблюдалось Решение задач по математической статистике раз, Решение задач по математической статистике раз, Решение задач по математической статистике наблюдалось Решение задач по математической статистике раз. Тогда общий объём выборки равен Решение задач по математической статистике. Число Решение задач по математической статистике показывающее, сколько раз встречается варианта (значение) Решение задач по математической статистике называется частотойРешение задач по математической статистике а число Решение задач по математической статистике — относительной частотой варианты Решение задач по математической статистике.

Последовательность Решение задач по математической статистике записанная в порядке возрастания с указанием частот и (или) относительных частот, называется вариационным рядом. Статистическим рядом называется последовательность пар Решение задач по математической статистике. Обычно статистический ряд записывается в виде следующей таблицы:

Решение задач по математической статистике

Геометрическим изображением вариационного ряда является эмпирический полигон распределения, являющийся аналогом плотности распределения случайной величины Решение задач по математической статистике— ломаная с вершинами Решение задач по математической статистике — см. рисунок 1.

Вариационный ряд обозрим при небольших значениях Решение задач по математической статистике. В противном случае его (или первоначальную статистическую совокупность) подвергают интервальной обработке.

Все варианты Решение задач по математической статистике принадлежат отрезку Решение задач по математической статистике. Пусть к некоторое (не больше 20) натуральное число. Отрезок Решение задач по математической статистике разобьём на Решение задач по математической статистике равных частей длины Решение задач по математической статистике.

Обозначим эти промежутки следующим образом: Решение задач по математической статистике. Через Решение задач по математической статистике обозначим число вариант, попавших в интервал Решение задач по математической статистике, при этом будем считать, что каждый промежуток содержит свой левый конец, но лишь последний промежуток содержит и свой правый конец. Пусть Решение задач по математической статистике (числа Решение задач по математической статистике и Решение задач по математической статистике можно также отнести к середине Решение задач по математической статистике. интервала Решение задач по математической статистике). Полученные данные занесём в таблицу, называемую интервальной обработкой ряда, или статистической совокупности.

Решение задач по математической статистике

Количество интервалов Решение задач по математической статистике можно рассчитать по формуле Стерджеса Решение задач по математической статистикеРешение задач по математической статистике либо с помощью таблицы:

Решение задач по математической статистике

Геометрическим изображением интервальной обработки служит гистограмма (см. рисунок 1). Гистограммой частот называется множество прямоугольников с основаниями Решение задач по математической статистике и высотами Решение задач по математической статистике. Площадь гистограммы равна объёму выборки Решение задач по математической статистике.

Нормированная гистограмма (гистограмма относительных частот) представляет собой ступенчатую фигуру из прямоугольников с основаниями равными интервалам значений признака Решение задач по математической статистике и высотами, равными плотности частоты Решение задач по математической статистике. Если соединить прямолинейными отрезками середины верхних оснований прямоугольников, получим полигон распределения. Суммарная площадь всех прямоугольников гистограммы равна 1:

Решение задач по математической статистике
Решение задач по математической статистике

Эмпирической функцией распределении (функцией распределения выборки) называется функция Решение задач по математической статистике, определяющая для каждого значения Решение задач по математической статистике относительную частоту события Решение задач по математической статистике (см. рисунок 2):

Решение задач по математической статистике

где Решение задач по математической статистике — число вариант Решение задач по математической статистике, меньших чем Решение задач по математической статистике — объем выборки.

Решение задач по математической статистике

Функция Решение задач по математической статистике обладает следующими свойствами (здесь Решение задач по математической статистикеРешение задач по математической статистике):

Решение задач по математической статистике

-монотонно неубывающая, непрерывная слева функция.

Функция Решение задач по математической статистике является статистическим аналогом функции распределения Решение задач по математической статистике генеральной совокупности. Функцию распределения Решение задач по математической статистикев математической статистике называют теоретической функцией распределения. Различие между теоретической и эмпирической функциями распределения состоит в том, что Решение задач по математической статистике определяет вероятность события Решение задач по математической статистике, a Решение задач по математической статистике — относительную частоту этого события.

Эмпирическая функция распределения служит для оценки вида теоретической функции распределения случайного признака, полигон и гистограмма — для оценки вида теоретической кривой распределения.

Числовые характеристики законов распределения эмпирических величии

Одна из задач математической статистики состоит в установлении закона распределения случайной величины Решение задач по математической статистике (генеральной совокупности) и оценке параметров этого закона.

Вид закона выбирается из каких-либо теоретических или практических соображений, а параметры следует вычислять, исходя из параметров этого закона.

Важнейшим этапом обработки статистических данных является вычисление оценок числовых характеристик исследуемой случайной величины.

Полученные оценки позволяют в числовой форме описать характерные черты статистического распределения и являются базой для построения математической модели изучаемого случайного явления.

Любая величина Решение задач по математической статистике, определяемая как функция выборочных значений Решение задач по математической статистике = Решение задач по математической статистике, называется выборочной статистикой или просто статистикой. Статистика в, используемая в качестве приближённого значения неизвестного параметра Решение задач по математической статистике, называется статистической оценкой параметра Решение задач по математической статистике.

Существует два вида оценок параметров: точечные и интервальные.

Точечной называется статистическая оценка, которая определяется одним числом.

К точечным статистическим оценкам предъявляется ряд требований.

Если Решение задач по математической статистике — статистическая оценка параметра Решение задач по математической статистике, то она должна удовлетворять следующим условиям:

1) быть несмещенной, что означает, что Решение задач по математической статистике.

2) быть состоятельной, т.е. предел по вероятности при Решение задач по математической статистике последовательности таких оценок должен быть равен искомому параметру, т.е. вероятность того, что Решение задач по математической статистике, стремится к нулю при Решение задач по математической статистике.

3) быть эффективной, т.е. дисперсия Решение задач по математической статистике — наименьшая или быть асимптотически эффективной, что означает, что Решение задач по математической статистике.

Число Решение задач по математической статистике называется точностью оценки, если имеет место равенство Решение задач по математической статистике. Если это неравенство имеет место с некоторой вероятностью Решение задач по математической статистике, то число Решение задач по математической статистике называется надёжностью оценки или уровнем надёжности. Наиболее употребительными уровнями надёжности являются Решение задач по математической статистике 0,999.

Выборочной средней Решение задач по математической статистике называют среднее арифметическое значение случайной величины Решение задач по математической статистике по выборочной совокупности объёма Решение задач по математической статистике:

Решение задач по математической статистике

Выборочная средняя служит несмещенной оценкой математического ожидания признака Решение задач по математической статистике или генеральной совокупности.

Кроме выборочной средней в статистическом анализе применяются структурные средние: медиана и мода.

Модой Мо называют варианту, которая имеет наибольшую частоту. Если распределение интервальное, то определяется модальный интервал Решение задач по математической статистике, которому соответствует наибольшая частота Решение задач по математической статистике, мода вычисляется по формуле:

Решение задач по математической статистике

где Решение задач по математической статистике — величина модального интервала; Решение задач по математической статистике — частоты предмодального и послемодального интервала.

Медианой Me называют варианту, которая делит вариационный ряд на две части, равные по числу вариант. Если Решение задач по математической статистике, а если Решение задач по математической статистике, то Решение задач по математической статистике при вычислении медианы интервального ряда распределения используется формула:

Решение задач по математической статистике

где Решение задач по математической статистике — накопленная частота интервала, предшествующего медианному, включая интервал, предшествующий медианному; Решение задач по математической статистике— — начальное значение интервала, который содержит медиану. Номер медианного интервала определяется из неравенства Решение задач по математической статистике случае выполнения равенства номер медианного интервала равен Решение задач по математической статистике, в противном случае — Решение задач по математической статистике.

Средние величины не отражают изменчивости (вариации) значений признака. Чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения Решение задач по математической статистике вводят свободную характеристику — выборочную дисперсию.

Выборочной дисперсией Решение задач по математической статистике называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения Решение задач по математической статистике:

Решение задач по математической статистике

Выборочным средним квадратическим отклонением (стандартом) называют квадратный корень из выборочной дисперсии:

Решение задач по математической статистике

Выборочная дисперсия является смещённой оценкой генеральной дисперсии, так как

Решение задач по математической статистике

В качестве несмещенной оценки генеральной дисперсии служит «исправленная» выборочная дисперсия:

Решение задач по математической статистике

При достаточно больших Решение задач по математической статистике выборочная и исправленная дисперсии мало отличаются, поэтому на практике исправленной дисперсией пользуются, если Решение задач по математической статистике< 50.

Выборочная средняя и дисперсия вариационного ряда являются частными случаями более общего понятия — выборочных (эмпирических) моментов.

Начальный момент Решение задач по математической статистике — го порядка вариационного ряда определяется по формуле

Решение задач по математической статистике

Центральный момент Решение задач по математической статистике — го порядка вариационного ряда определяется по формуле

Решение задач по математической статистике

В частности

Решение задач по математической статистике

Центральные моменты первых четырёх порядков выборки Решение задач по математической статистике выражаются через начальные моменты Решение задач по математической статистике по формулам:

Решение задач по математической статистике

Коэффициентом асимметрии вариационного ряда называется число

Решение задач по математической статистике

Эксцессом вариационного ряда называется число:

Решение задач по математической статистике

Асимметрия называется также нормированным третьим центральным моментом, а эксцесс — нормированным четвертым центральным моментом признака Решение задач по математической статистике. Знаки асимметрии и эксцесса указывают на отклонения графика закона распределения Решение задач по математической статистике от нормального распределения, для которого Решение задач по математической статистике. При Решение задач по математической статистике большая часть вариант будет расположена слева от Решение задач по математической статистике — имеет место левосторонняя асимметрия распределения, при Решение задач по математической статистике— правосторонняя. Если Решение задач по математической статистике, в этом случае распределение имеет симметричную форму (рисунок 3).

Решение задач по математической статистике

Положительное значение эксцесса указывает на то, что полигон распределения около моды имеет более высокую острую вершину, чем нормальная кривая, с тем же центром и той же дисперсией.

Отрицательное значение эксцесса имеет место для кривых с более низким и более плоским характером вершины по сравнению с нормальной кривой (см. рисунок 4).

Решение задач по математической статистике

Точечные оценки не указывают величину ошибки, которая совершается при замене Решение задач по математической статистике и Решение задач по математической статистике их приближёнными значениями (оценками). Поэтому иногда выгодно пользоваться интервальной оценкой, которая определяется двумя числами Решение задач по математической статистике и Решение задач по математической статистике — концами интервала, накрывающего оцениваемый параметр в с заданной вероятностью (надёжностью).

Пусть Решение задач по математической статистике — точечная оценка параметра Решение задач по математической статистике. Она тем лучше, чем меньше разность Решение задач по математической статистике. Тогда в качестве характеристики точности оценки можно взять некоторое Решение задач по математической статистике, такое, что Решение задач по математической статистике. Но в статистике можно говорить лишь о вероятности (надёжности) Решение задач по математической статистике, с которой выполняется это неравенство. Число Решение задач по математической статистике называется уровнем значимости.

Доверительной вероятностью оценки называется вероятность Решение задач по математической статистике выполнения неравенства Решение задач по математической статистике. Обычно у задаётся заранее и наиболее часто полагают Решение задач по математической статистике и пр. Таким образом:

Решение задач по математической статистике

Доверительный интервал — это интервал Решение задач по математической статистике, который накрывает неизвестный параметр Решение задач по математической статистике с заданной надёжностью Решение задач по математической статистике.

Границы интервала и его величина находятся по выборочным данным и поэтому являются случайными величинами в отличие от оцениваемого параметра Решение задач по математической статистике, поэтому говорят, что Решение задач по математической статистике накрывает, а не содержит истинное значение Решение задач по математической статистике.

Величина доверительного интервала существенно зависит от объёма выборки Решение задач по математической статистике (уменьшается с ростом Решение задач по математической статистике) и значения доверительной вероятности Решение задач по математической статистике (увеличивается с приближением Решение задач по математической статистике к единице).

Интервальной оценкой с надёжностью у математического ожидания а нормально распределённой случайной величины (признака) Решение задач по математической статистике по выборочной средней Решение задач по математической статистике при известном СКО Решение задач по математической статистике генеральной совокупности служит доверительный интервал

Решение задач по математической статистике

где Решение задач по математической статистике — точность оценки, Решение задач по математической статистике — объём выборки, Решение задач по математической статистике — значение аргумента функции ЛапласаРешение задач по математической статистике при котором Решение задач по математической статистике.

При неизвестном Решение задач по математической статистике (в условиях эксперимента Решение задач по математической статистике обычно неизвестно) доверительный интервал для математического ожидания Решение задач по математической статистике нормально распределённой случайной величины Решение задач по математической статистике имеет вид:

Решение задач по математической статистике

где Решение задач по математической статистике — квантиль распределения Стьюдента, определяемый по таблицам, а параметры Решение задач по математической статистике находятся по данным выборки.

При больших выборках Решение задач по математической статистике распределение Стьюдента приближается к нормальному, и тогда можно пользоваться теоремами о нормальном распределении.

Доверительный интервал для Решение задач по математической статистике задаётся неравенствами:

Решение задач по математической статистике

где Решение задач по математической статистике — квантили Решение задач по математической статистике распределения, определяемые по соответствующим таблицам по заданному уровню значимости а и числу степеней свободы Решение задач по математической статистикеРешение задач по математической статистике, либо

Решение задач по математической статистике

Величина Решение задач по математической статистике находится по таблице Решение задач по математической статистике и зависит от надежности и объема выборки.

Статистическая проверка гипотез

Статистической гипотезой называется предположение относительно параметров или вида распределения изучаемой случайной величины.

Статистические гипотезы можно разделить на следующие основные группы:

1 (гипотезы о параметрах распределения;

2)гипотезы о виде распределения.

Выдвинутую гипотезу называют нулевой и обозначают ее через Решение задач по математической статистике. Наряду с Решение задач по математической статистике рассматривают конкурирующую (или альтернативную) гипотезу Решение задач по математической статистике.

Таким образом, ставится задача проверки гипотезы Решение задач по математической статистике относительно конкурирующей гипотезы Решение задач по математической статистике на основе выборки Решение задач по математической статистике объема Решение задач по математической статистике. Правило, по которому принимается или отвергается гипотеза, называется статистическим критерием. Принципы проверки статистических гипотез впервые были сформулированы в работах известных математиков Е. Неймана и Э. Пирсона. Они исходили из того, что принимая или отвергая гипотезу Решение задач по математической статистике, можно допустить ошибки двух видов.

Ошибка первого рода: Решение задач по математической статистике отвергается (принимается Решение задач по математической статистике) в то время как в действительности верна гипотеза Решение задач по математической статистике. Вероятность ошибки первого рода называют уровнем значимости и обозначают Решение задач по математической статистике:

Решение задач по математической статистике

Величину Решение задач по математической статистике, то есть вероятность принять верную гипотезу, называют уровнем доверия (доверительным уровнем).

Ошибка второго рода: Решение задач по математической статистике принимается, в то время как верна гипотеза Решение задач по математической статистике. Вероятность ошибки второго рода обозначается Решение задач по математической статистике.

Вероятность принять гипотезу Решение задач по математической статистике если она верна, называют мощностью критерия.

Суть проверки статистической гипотезы заключается в том, что используется специально составленная выборочная характеристика (статистика) Решение задач по математической статистикеРешение задач по математической статистике, полученная по выборке Решение задач по математической статистике, так, чтобы в случае, если гипотеза Решение задач по математической статистике верна, точное или приближенное распределение Решение задач по математической статистике было бы известным. Построение критерия, в зависимости от вида гипотезы Решение задач по математической статистике, заключается в выборе таких значений Решение задач по математической статистике и Решение задач по математической статистике, что если Решение задач по математической статистике то гипотеза Решение задач по математической статистике принимается. Значения Решение задач по математической статистике и Решение задач по математической статистике называются критическими, а область Решение задач по математической статистике называется областью допустимых значений.

Множество возможных значений статистики Решение задач по математической статистике разбивается на 2 непересекающихся подмножества: критическую область — множество значений Решение задач по математической статистике, при которых Решение задач по математической статистике отвергается — Решение задач по математической статистике, и область допустимых значений — множество значений Решение задач по математической статистике, при которых Решение задач по математической статистике принимается — Решение задач по математической статистике. Если фактически наблюдаемое (полученное по выборке) значение статистики критерия Решение задач по математической статистике попадает в критическую область, то гипотезу Решение задач по математической статистике отвергают, в противном случае принимают.

Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона

Одной из задач математической статистики является установление истинного закона распределения случайной величины на основании экспериментальных данных. Критерии, устанавливающие закон распределения, называются критериями согласия.

Алгоритм применения критерия Пирсона.

1)Из генеральной совокупности образовывается случайная выборка, и на ее основе делается предположение о нормальном законе распределения. Выдвигается гипотеза Решение задач по математической статистике: «генеральная совокупность распределена нормально».

2)Вычисляются выборочные числовые характеристики Решение задач по математической статистике.

3)Вычисляются теоретические частоты:

а) Для дискретного ряда

Решение задач по математической статистике

где Решение задач по математической статистике — объем выборки, Решение задач по математической статистике — шаг (разность между двумя соседними вариантами),

Решение задач по математической статистике

Значения Решение задач по математической статистике определяются из таблицы приложения 1.

б) Для интервального ряда Решение задач по математической статистике, где Решение задач по математической статистике — объем выборки,

Решение задач по математической статистике
Решение задач по математической статистике

теоретические вероятности попадания в интервалы

Решение задач по математической статистике
Решение задач по математической статистике

функция Лапласа, значения которой определяются по таблице

4)Находится наблюдаемое значение критерия Пирсона по формуле

Решение задач по математической статистике

5)По таблице критических точек распределения Решение задач по математической статистике по заданному уровню значимости а и числу степеней свободы Решение задач по математической статистике (Решение задач по математической статистике — число групп для дискретного ряда или число интервалов для интервального ряда) находят критическую точку Решение задач по математической статистике правосторонней критической области.

6)Если Решение задач по математической статистике— нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются незначимо. Если Решение задач по математической статистике — гипотезу отвергают.

Замечание. Малочисленные варианты и интервалы (содержащие малочисленные частоты Решение задач по математической статистике) следует объединить, а соответствующие им частоты сложить. Если производилось объединение частот, то в формуле Решение задач по математической статистике следует в качестве Решение задач по математической статистике принять число групп или интервалов выборки, оставшихся после объединения частот.

Элементы теории регрессионного и корреляционного анализа

Методы теории корреляции позволяют определять зависимость между различными факторами или случайными величинами. Термин «корреляция» происходит от латинского «correlatio» — соотношение, взаимосвязь.

В естественных науках часто речь идёт о функциональной зависимости, когда каждому значению одной величины соответствует вполне определённое значение другой. Случайные величины обычно не связаны функциональной зависимостью. В большинстве случаев между переменными существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определённое, а множество возможных значений другой переменной. Такая зависимость получила название статистической (или стохастической, вероятностной).

В силу неоднозначной статистической зависимости между случайными величинами Решение задач по математической статистике и Решение задач по математической статистике для исследователя представляет интерес усреднённая схема зависимости — зависимость условного математического ожидания Решение задач по математической статистике или его статистического аналога Решение задач по математической статистике от значений Решение задач по математической статистике случайной величины Решение задач по математической статистике, то есть Решение задач по математической статистике или Решение задач по математической статистике. Здесь Решение задач по математической статистике — условная средняя, которая определяется как среднее арифметическое значений Решение задач по математической статистике, то есть Решение задач по математической статистике, соответствующих значению Решение задач по математической статистике. Такая зависимость получила название корреляционной. Корреляционной зависимостью Решение задач по математической статистике от Решение задач по математической статистике называют функциональную зависимость условной средней ух от Решение задач по математической статистике:

Решение задач по математической статистике

Уравнение (14) называют уравнением регрессии Решение задач по математической статистике на Решение задач по математической статистике; функцию Решение задач по математической статистике называют регрессией Решение задач по математической статистике на Решение задач по математической статистике, а её график -линиейрегрессии Решение задач по математической статистике на Решение задач по математической статистике.

Статистические связи между переменными можно изучать методами корреляционного и регрессионного анализа. Основной задачей корреляционного анализа является выявление связи между случайными величинами и оценка ее тесноты. Основной задачей регрессионного анализа — установление и изучение формы зависимости между переменными.

Данные о статистической зависимости удобно представлять в виде корреляционной таблицы:

Решение задач по математической статистике

Здесь

Решение задач по математической статистике

значения случайных величин Решение задач по математической статистике и Решение задач по математической статистике соответственно, а

Решение задач по математической статистике

соответствующие частоты, Решение задач по математической статистике — частота, с которой встречается пара Решение задач по математической статистике.

По направлению корреляционная связь может быть положительной («прямой») и отрицательной («обратной»). При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака — низкие значения другого. При отрицательной корреляции соотношения обратные.

Наличие корреляции приближенно может быть определено с помощью корреляционного поля. Его получим, если нанесем на график в определенном масштабе точки, соответствующие наблюдаемым одновременным значениям двух величин Решение задач по математической статистике — если точки рассеяны хаотично, то связь между Решение задач по математической статистике и Решение задач по математической статистике отсутствует; если точки группируются около какой-то линии, то связь есть, и она тем теснее, чем ближе они группируются (рисунок 5).

Решение задач по математической статистике

Рассмотрим наиболее важный для практики случай линейной зависимости между величинами. В теории вероятностей показателем тесноты линейной зависимости являлся коэффициент корреляции, в математической статистике таким показателем является выборочный коэффициент корреляции.

Выборочным коэффициентом корреляции называется величина, рассчитываемая по формуле:

Решение задач по математической статистике

где

Решение задач по математической статистике

оценка корреляционного момента; Решение задач по математической статистике и Решение задач по математической статистике — исправленные средние квадратические отклонения.

Выборочный коэффициент корреляции обладает некоторыми свойствами:

  1. Решение задач по математической статистике;
  2. Чем ближе значение Решение задач по математической статистике к единице, тем более тесная линейная зависимость между изучаемыми величинами. В зависимости оттого, насколько Решение задач по математической статистике приближается к единице, различают слабую, умеренную, заметную, достаточно тесную и весьма тесную линейную связь.
  3. Если Решение задач по математической статистике, то говорят о прямой связи между изучаемыми величинами (т.е. с увеличением одной случайной величины увеличивается и другая), если же Решение задач по математической статистике, говорят об обратной связи (с увеличением одной случайной величины вторая уменьшается).
  4. Если все значения переменных увеличить (уменьшить) на одно и тоже число или в одно и то же число раз, то величина коэффициента корреляции не изменится. Коэффициент корреляции есть безразмерная характеристика тесноты линейной связи.
  5. При Решение задач по математической статистике корреляционная связь представляет линейную функциональную зависимость, при этом все точки поля корреляции лежат на одной прямой.
  6. При Решение задач по математической статистике или Решение задач по математической статистике близком к нулю линейная корреляционная связь отсутствует, но это не означает отсутствие другой зависимости, например, нелинейная связь может быть очень тесной.

Для ответа на вопрос о значимости коэффициента корреляции проверяют нулевую гипотезу Решение задач по математической статистике о равенстве нулю генерального коэффициента корреляции. Если гипотеза принимается, то говорят, что между Решение задач по математической статистике и Решение задач по математической статистике нет линейной корреляционной зависимости, иначе линейная зависимость признается значимой.

Для того чтобы при уровне значимости Решение задач по математической статистике проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции при конкурирующей Решение задач по математической статистике, надо вычислить наблюдаемое значение критерия:

Решение задач по математической статистике

затем, пользуясь таблицей критических точек распределения Стьюдента, по заданному уровню значимости и числу степеней свободы Решение задач по математической статистике найти критическую точку Решение задач по математической статистике для двухсторонней критической области. Если сравнить данные величины, то можно сделать вывод о степени коррелированности исходных признаков:

•если Решение задач по математической статистике, то верна нулевая гипотеза и, следовательно, величины Решение задач по математической статистике не коррелированны;

•если же Решение задач по математической статистике, то нулевая гипотеза отвергается.

Рассмотрим уравнение парной линейной регрессии Математическая статистика задачи с решением. Найдём формулы расчёта неизвестных параметров Математическая статистика задачи с решением и Математическая статистика задачи с решением по имеющимся статистическим данным Математическая статистика задачи с решением.

Согласно методу наименьших квадратов неизвестные параметры выбираются таким образом, чтобы сумма квадратов отклонений выборочных значений Математическая статистика задачи с решением от значений Математическая статистика задачи с решением, полученных по уравнению регрессии, была минимальна:

Математическая статистика задачи с решением

На основании необходимого условия экстремума, приравнивая нулю частные производные, получим:

Математическая статистика задачи с решением

После преобразования получаем систему нормальных уравнений для определения параметров линейной регрессии:

Математическая статистика задачи с решением

Из последней системы следуют формулы для определения параметров уравнения парной линейной регрессии Математическая статистика задачи с решением на Математическая статистика задачи с решением:

Математическая статистика задачи с решением

Уравнение регрессии Математическая статистика задачи с решением можно с учётом формулы вычисления параметра Математическая статистика задачи с решением записать в виде

Математическая статистика задачи с решением

Коэффициент Математическая статистика задачи с решением показывает, на сколько единиц в среднем изменится переменная Математическая статистика задачи с решением при увеличении переменной Математическая статистика задачи с решением на одну единицу.

Уравнение регрессии может быть использовано для прогнозирования значений Математическая статистика задачи с решением при значениях Математическая статистика задачи с решением, не указанных в корреляционной таблице.

Величину Математическая статистика задачи с решением называют остаточной дисперсией случайной величины Математическая статистика задачи с решением относительно случайной величины Математическая статистика задачи с решением; она характеризует величину ошибки, которая возникает при замене Математическая статистика задачи с решением линейной функцией. При Математическая статистика задачи с решением остаточная дисперсия равна нулю, т.е. при представлении Математическая статистика задачи с решением в виде линейной функции от Математическая статистика задачи с решением не возникает ошибки, a Математическая статистика задачи с решением и Математическая статистика задачи с решением связаны линейной функциональной зависимостью.

Кстати готовые на продажу задачи тут, и там же теория из учебников может быть вам поможет она.

Задачи с решением

Задача № 1

  • Из генеральной совокупности извлечена выборка объёма Математическая статистика задачи с решением:
Математическая статистика задачи с решением

Требуется:

1)Найти и построить эмпирическую функцию распределения;

2)Найти выборочное среднее, «исправленное» СКО, выборочную моду и медиану.

Решение:

1) Согласно определению эмпирической функции распределения её значение при любом Математическая статистика задачи с решением равно Математическая статистика задачи с решением, где Математическая статистика задачи с решением — количество элементов Математическая статистика задачи с решением; выборки, меньших, чем Математическая статистика задачи с решением — объём выборки.

Например, при

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Тогда

Математическая статистика задачи с решением

График эмпирической функции распределения изображён на рисунке 6.

Математическая статистика задачи с решением

2) Определим выборочное среднее выборки по формуле (2):

Математическая статистика задачи с решением

«Исправленную» дисперсию найдём, используя следующую формулу:

Математическая статистика задачи с решением

Так как мода — это варианта, которой соответствует наибольшая частота, то Математическая статистика задачи с решением.

Не сгруппированные данные образуют дискретный вариационный ряд, содержащий нечётное число вариант Математическая статистика задачи с решением:

Математическая статистика задачи с решением

Значит, медиана равна

Математическая статистика задачи с решением

Задача № 2

  • Записать в виде вариационного ряда выборку 20, 19, 12, 13, 16, 17, 17, 14, 16, 14, 13, 19, 18, 16, 14. Представить статистическое распределение выборки. Построить полигон относительных частот для статистического ряда. Вычислить числовые характеристики выборки: выборочное среднее, «исправленную» и выборочную дисперсии, «исправленное» среднеквадратическое отклонение (СКО).

Решение:

Объём выборки Математическая статистика задачи с решением. Упорядочив элементы выборки по возрастанию, получим вариационный ряд:

12, 13, 13, 14, 14, 14, 16, 16, 16, 17, 17, 18, 19, 19, 20.

Статистическое распределение исходной выборки можно записать в виде следующей таблицы:

Математическая статистика задачи с решением

Полигон относительных частот изображён на рисунке 7.

Математическая статистика задачи с решением

Находим выборочное среднее по формуле (2):

Математическая статистика задачи с решением

Для вычисления выборочной дисперсии используем формулу (5):

Математическая статистика задачи с решением

«Исправленная» дисперсия и СКО:

Математическая статистика задачи с решением

Задача № 3

  • Найти выборочное среднее, моду, медиану и выборочное СКО выборки объёмом Математическая статистика задачи с решением, распределение которой задано следующей таблицей:
Математическая статистика задачи с решением

Построить гистограмму и полигон частот.

Решение:

Для построения гистограммы все частоты необходимо разделить на длину интервала, равную 1,02, и откладывать по оси ординат. По оси абсцисс отмечаются границы интервалов (рисунок 8).

Для построения полигона частот найдем середины интервалов и дополним исходную таблицу:

Математическая статистика задачи с решением

Ломаная линия (рисунок 8) будет соединять точки с координатами Математическая статистика задачи с решением.

Математическая статистика задачи с решением

Для расчёта выборочного среднего и выборочного СКО составляем вариационный ряд, принимая в качестве вариант середины соответствующих интервалов:

Математическая статистика задачи с решением

Таким образом:

Математическая статистика задачи с решением

Так как наибольшая частота

Математическая статистика задачи с решением

отвечает интервалу 1,02 — 2,04, то

Математическая статистика задачи с решением

Мода (согласно формуле (3)) равна:

Математическая статистика задачи с решением

Определим номер медианного интервала. Так как Математическая статистика задачи с решением, то номер медианного интервала равен 3, а сам интервал — 2,04 — 3,06. Тогда, по формуле (4), получаем:

Математическая статистика задачи с решением

Задача № 4

Дан статистический ряд признака Математическая статистика задачи с решением:

Математическая статистика задачи с решением

Найти начальные и центральные моменты первых четырёх порядков признака Математическая статистика задачи с решением, а также определить асимметрию и эксцесс.

Решение:

Вычисления проводим по формулам (8) для Математическая статистика задачи с решением и по формулам (10) для Математическая статистика задачи с решением.

Начальные моменты:

Математическая статистика задачи с решением

Центральные моменты

Математическая статистика задачи с решением

Тогда, так как

Математическая статистика задачи с решением

то

Математическая статистика задачи с решением

Задача № 5

Предельная нагрузка для выборки из 50 стальных стержней характеризуется следующим рядом:

Математическая статистика задачи с решением

Считая распределение предельной нагрузки Математическая статистика задачи с решением нормальным, построить доверительные интервалы для оценки с надёжностью Математическая статистика задачи с решением средней предельной нагрузки и СКО предельной нагрузки стальных стержней партии, из которой произведена выборка.

Решение:

Вычислим выборочное среднее и исправленное СКО соответственно по формулам

Математическая статистика задачи с решением

По таблице (см. приложение 3) найдём

Математическая статистика задачи с решением

Точность оценки:

Математическая статистика задачи с решением

Доверительный интервал для средней предельной нагрузки найдём по формуле (13):

Математическая статистика задачи с решением

Доверительный интервал для СКО предельной нагрузки будем искать по формуле

Математическая статистика задачи с решением

так как

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Задача № 6

В результате эксперимента получены данные, представленные в виде статистического ряда:

Математическая статистика задачи с решением

Требуется:

1 )3аписать значения результатов эксперимента в виде вариационного ряда.

2)Представить данную выборку в виде интервального статистического ряда.

3)Найти числовые характеристики выборки:

Математическая статистика задачи с решением

4) Определить доверительные интервалы неизвестного математического ожидания и неизвестного среднего квадратического отклонения. Предполагается, что генеральная совокупность имеет нормальное распределение. Доверительную вероятность принять равной 0,95.

Решение:

1) Расположим значения результатов эксперимента в порядке возрастания, т.е. записываем вариационный ряд:

14 21 28 30 30 32 33 35 38 39 40 41 41 42 42 42 43 44 45 45 46 4747 47 48 48 49 49 50 51 52 53 54 54 56 57 58 58 59 59 60 60 60 60 61 61 65 67 72 77.

2) Объём выборки Математическая статистика задачи с решением. Наибольшая варианта — 77, наименьшая — 14. Найдём длину интервала:

Математическая статистика задачи с решением

Выбираем длину интервала 9. Интервальный статистический ряд примет вид:

Математическая статистика задачи с решением

3) Для вычисления числовых характеристик составляем вариационный ряд, принимая в качестве вариант середины соответствующих интервалов:

Математическая статистика задачи с решением

Таким образом:

Математическая статистика задачи с решением

4) Доверительный интервал для оценки математического ожидания нормально распределённой случайной величины найдём по формуле:

Математическая статистика задачи с решением

Из приложения 3 для Математическая статистика задачи с решением находим Математическая статистика задачи с решением. Далее

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Доверительный интервал для оценки а нормального распределения по несмещённой оценке Математическая статистика задачи с решением определяется из неравенства

Математическая статистика задачи с решением

где величина

Математическая статистика задачи с решением

определяется из таблицы (приложение 4).

Имеем

Математическая статистика задачи с решением

При

Математическая статистика задачи с решением

в таблице приложения находим

Математическая статистика задачи с решением

Следовательно,

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Значит,

Математическая статистика задачи с решением

Задача № 7

  • Требуется при уровне значимости Математическая статистика задачи с решением проверить по критерию согласия Пирсона гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические частоты Математическая статистика задачи с решением и теоретические частоты Математическая статистика задачи с решением:
Математическая статистика задачи с решением

Решение:

Определим наблюдаемое значение критерия Пирсона по формуле

Математическая статистика задачи с решением

В таблице критических точек Математическая статистика задачи с решением (приложение 5) находим при уровне значимости Математическая статистика задачи с решением значение Математическая статистика задачи с решением (имеем Математическая статистика задачи с решениемстепени свободы). Значение Математическая статистика задачи с решениемСледовательно, выдвинутая гипотеза о нормальном распределении генеральной совокупности не отвергается.

Задача № 8

  • Из генеральной совокупности извлечена выборка, представленная в виде ряда.

Требуется проверить, согласуются ли выборочные данные с гипотезой о нормальном распределении случайной величины Математическая статистика задачи с решением с помощью критерия согласия Пирсона при уровне значимости Математическая статистика задачи с решением, разбив отрезок Математическая статистика задачи с решением на Математическая статистика задачи с решением интервалов одинаковой длины. Величину Математическая статистика задачи с решением рассчитать по формуле Стерджеса Математическая статистика задачи с решениемМатематическая статистика задачи с решением.

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Решение:

Подсчитаем количество интервалов разбиения:

Математическая статистика задачи с решением

Из ряда видно, что

Математическая статистика задачи с решением

поэтому

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Границы интервалов будут:

Математическая статистика задачи с решением

Частота Математическая статистика задачи с решением— интервала Математическая статистика задачи с решением подсчитывается с помощью ряда как число наблюдений, попавших в интервал. Так в первый Математическая статистика задачи с решением интервал ) 0,6; 1,11 попало 7 значений, во второй [1,1; 1,6[ — 14 значений. Сведём полученные данные в таблицу:

Математическая статистика задачи с решением

Объем выборки равен

Математическая статистика задачи с решением

Выборочное среднее и дисперсия определяются по формулам:

Математическая статистика задачи с решением

Найдём теоретические вероятности Математическая статистика задачи с решением по формуле

Математическая статистика задачи с решением

где Математическая статистика задачи с решением — функция Лапласа, значения которой даются в приложении 3. Результаты вычислений сведём в таблицу:

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Вычислим наблюдаемое значение критерия Пирсона. Для этого составим следующую расчетную таблицу:

Математическая статистика задачи с решением

По таблице критических точек распределения Математическая статистика задачи с решением, уровню значимости Математическая статистика задачи с решением и числу степеней свободы

Математическая статистика задачи с решением

находим

Математическая статистика задачи с решением

Так как

Математическая статистика задачи с решением

то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности.

Задача № 9

  • По заданной таблице зависимости признаков Математическая статистика задачи с решением и Математическая статистика задачи с решением
Математическая статистика задачи с решением

вычислить выборочный коэффициент корреляции и остаточную дисперсию. Записать уравнения прямой регрессии Математическая статистика задачи с решением на Математическая статистика задачи с решением. Построить корреляционное поле и линию регрессии на корреляционном поле.

Решение:

Вычислим основные выборочные характеристики: Выборочные средние:

Математическая статистика задачи с решением

Найдем оценки для средних квадратичных отклонений и корреляционного момента, для чего составим следующую вспомогательную таблицу:

Математическая статистика задачи с решением

Согласно формуле (15):

Математическая статистика задачи с решением

Найдем методом наименьших квадратов эмпирическую формулу вида Математическая статистика задачи с решениемМатематическая статистика задачи с решением. Составим систему нормальных уравнений (17) для определения параметров линейной регрессии. Так как

Математическая статистика задачи с решением

Уравнение регрессии Математическая статистика задачи с решением наМатематическая статистика задачи с решением имеет вид:

Математическая статистика задачи с решением

Остаточная дисперсия:

Математическая статистика задачи с решением

Корреляционное поле и линия регрессии на корреляционном поле изображены на рисунке 9.

Математическая статистика задачи с решением

Задача № 10

  • Таблица значений признака Математическая статистика задачи с решением при данных значениях признака Математическая статистика задачи с решением имеет вид:
Математическая статистика задачи с решением

Построить корреляционное поле. Найти выборочный коэффициент корреляции, оценить его значимость. Записать уравнения прямой линии регрессии Математическая статистика задачи с решением на Математическая статистика задачи с решением.

Решение:

Корреляционное поле данной двумерной выборки приведено на рисунке 10.

Математическая статистика задачи с решением

По виду поля корреляции можно судить о том, что между величинами существует зависимость.

Для вычисления выборочных числовых характеристик составляем следующую расчётную таблицу:

Математическая статистика задачи с решением

Замечание. Строка

Математическая статистика задачи с решением

получается следующим образом:

Математическая статистика задачи с решением

Столбец

Математическая статистика задачи с решением

Вычислим выборочные средние

Математическая статистика задачи с решением
Математическая статистика задачи с решением

«Исправленные» дисперсии находим по формулам:

Математическая статистика задачи с решением

Оценку корреляционного момента вычисляем по формуле:

Математическая статистика задачи с решением

Рассчитав все нужные величины, можно вычислить выборочный коэффициент корреляции:

Математическая статистика задачи с решением

Для оценки значимости выборочного коэффициента корреляции вычислим наблюдаемое значение критерия, воспользовавшись формулой (16):

Математическая статистика задачи с решением

Затем по таблице критических точек распределения Стьюдента, по заданному уровню значимости Математическая статистика задачи с решением и числу степеней свободы Математическая статистика задачи с решением найдем критическую точку Математическая статистика задачи с решением для двухсторонней критической области:

Математическая статистика задачи с решением

Сравнивая Математическая статистика задачи с решением, получим, что Математическая статистика задачи с решением, следовательно, величиныМатематическая статистика задачи с решением коррелированы.

Оценкой теоретической линии регрессии является эмпирическая линия регрессии, уравнение которой имеет вид

Математическая статистика задачи с решением

Тогда

Математическая статистика задачи с решением

Задача № 11

Из генеральной совокупности извлечена выборка, представленная в виде статистического ряда:

Математическая статистика задачи с решением

Требуется:

1)вычислить выборочное среднее Математическая статистика задачи с решением, выборочную дисперсию Математическая статистика задачи с решением, исправленную выборочную дисперсию Математическая статистика задачи с решением и среднее квадратичное отклонение Математическая статистика задачи с решением;

2)найти размах варьирования; моду и медиану;

3)построить полигон частот и эмпирическую функцию распределения;

4)провсрить, согласуются ли выборочные данные с гипотезой о нормальном распределении случайной величины Математическая статистика задачи с решением графически и с помощью критерия согласия Пирсона при уровне значимости Математическая статистика задачи с решением, представив данную выборку в виде интервального ряда. Количество интервалов рассчитать по формуле Стерджеса Математическая статистика задачи с решением;

5)найти с доверительной вероятностью Математическая статистика задачи с решениемдоверительный интервал для математического ожидания, а также доверительный интервал для Математическая статистика задачи с решением.

Решение:

1) Объем выборки равен

Математическая статистика задачи с решением

Выборочное среднее определим по формуле:

Математическая статистика задачи с решением

Для нахождения выборочной дисперсии составим следующую вспомогательную таблицу:

Математическая статистика задачи с решением

Тогда

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Исправленное среднее квадратичное отклонение будет

Математическая статистика задачи с решением

2) Размах варьирования находится по формуле

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Так как мода — это варианта, которой соответствует наибольшая частота, то

Математическая статистика задачи с решением

Не сгруппированные данные образуют дискретный вариационный ряд, содержащий чётное число вариант Математическая статистика задачи с решением, поэтому Математическая статистика задачи с решениемМатематическая статистика задачи с решением

3) Согласно определению эмпирической функции распределения ее значение при любом Математическая статистика задачи с решением равно Математическая статистика задачи с решением где Математическая статистика задачи с решением — количество элементов Математическая статистика задачи с решением выборки, меньших, чем Математическая статистика задачи с решением.

Математическая статистика задачи с решением

Тогда

Математическая статистика задачи с решением

График эмпирической функции распределения:

Математическая статистика задачи с решением

Полигон частот изображен на рисунке:

Математическая статистика задачи с решением

4) Так как полигон частот по форме напоминает кривую Гаусса, то можно сделать предположение о том, что случайная величина Математическая статистика задачи с решением распределена по нормальному закону. Проверим данное утверждение по критерию Пирсона. Вычислим количество интервалов:

Математическая статистика задачи с решением

Длина интервала

Математическая статистика задачи с решением

Границы интервалов будут:

Математическая статистика задачи с решением

Посчитаем число выборочных значений, попавших в каждый интервал. Частота Математическая статистика задачи с решением интервала Математическая статистика задачи с решением подсчитывается с помощью ряда, как число наблюдений, попавших в интервал. Так, в первый Математическая статистика задачи с решением интервал [4; 5,2] попало 3 значения; во второй Математическая статистика задачи с решением — [5,2; 6,4] попало 7 значений. Аналогично получаем частоты 3-7 интервалов.

Полученные данные сведём в следующую таблицу:

Математическая статистика задачи с решением

Найдем теоретические вероятности Математическая статистика задачи с решением по формуле:

Математическая статистика задачи с решением

Результаты вычислений сведем в таблицу:

Математическая статистика задачи с решением

Так как ожидаемые (эмпирические) частоты первого и седьмого интервалов группировки не удовлетворяют условию Математическая статистика задачи с решением5, объединим эти интервалы (первый со вторым; а седьмой — с шестым).

Вычислим наблюдаемое значение критерия Пирсона. Для этого составим

Математическая статистика задачи с решением

По таблице критических точек распределения Математическая статистика задачи с решением, уровню значимости Математическая статистика задачи с решениемМатематическая статистика задачи с решением и числу степеней свободы Математическая статистика задачи с решением находим Математическая статистика задачи с решением. Так как

Математическая статистика задачи с решением

то гипотеза о нормальном распределении принимается.

5) Доверительный интервал для математического ожидания найдём по формуле

Математическая статистика задачи с решением

Значение Математическая статистика задачи с решением определим по таблице для доверительной вероятности

Математическая статистика задачи с решением

и объёму выборки

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Тогда доверительный интервал имеет вид:

Математическая статистика задачи с решением

Задача № 12

По заданной таблице зависимости признаков Математическая статистика задачи с решением и Математическая статистика задачи с решением:

1}Вычислить выборочный коэффициент корреляции; проверить его на значимость, приняв Математическая статистика задачи с решением.

2)Методом наименьших квадратов выровнять зависимость Математическая статистика задачи с решением от Математическая статистика задачи с решением по прямой Математическая статистика задачи с решением.

3)Вычислить остаточную дисперсию, сделать вывод.

4)Построить корреляционное поле и линию регрессии на корреляционном поле.

Математическая статистика задачи с решением

Решение:

Найдём выборочные средние х, у, а также оценки для средних квадратичсских отклонений и корреляционного момента, для чего составим следующую вспомогательную таблицу:

Математическая статистика задачи с решением

Здесь

Математическая статистика задачи с решением

Тогда

Математическая статистика задачи с решением

Выборочное значение коэффициента корреляции:

Математическая статистика задачи с решением

Проверим значимость полученного выборочного коэффициента корреляции. Найдём наблюдаемое значение критерия:

Математическая статистика задачи с решением

По таблице критических точек распределения Стьюдента, по уровню значимости Математическая статистика задачи с решением и числу степеней свободы Математическая статистика задачи с решением находим критическую точку двусторонней критической области Математическая статистика задачи с решением.

Так как Математическая статистика задачи с решением, то отвергаем гипотезу о равенстве нулю генерального коэффициента корреляции, значит Математическая статистика задачи с решением и Математическая статистика задачи с решением-коррелированы.

Математическая статистика задачи с решением

Запишем нормальную систему уравнений. Так как

Математическая статистика задачи с решением
Математическая статистика задачи с решением

то

Математическая статистика задачи с решением

Решая систему по формулам Крамера, получим:

Математическая статистика задачи с решением

Следовательно, зависимость между величинами Математическая статистика задачи с решением и Математическая статистика задачи с решением выражается приближённой формулой

Математическая статистика задачи с решением

3) Остаточная дисперсия:

Математическая статистика задачи с решением

То сеть величина ошибки, которая возникает при замене Математическая статистика задачи с решением линейной функцией, невелика можно сделать вывод, что между величинами Математическая статистика задачи с решением и Математическая статистика задачи с решением существует приближённая линейная зависимость.

4) Корреляционное поле и линия регрессии на корреляционном поле представлены на следующем рисунке:

Математическая статистика задачи с решением

Возможно эти страницы вам будут полезны: