ИДЗ 3
6
idz3/.gitignore
vendored
Normal file
@@ -0,0 +1,6 @@
|
||||
**/*
|
||||
!.gitignore
|
||||
!report.tex
|
||||
!img
|
||||
!img/**
|
||||
!*.ipynb
|
||||
BIN
idz3/img/table1.png
Normal file
|
After Width: | Height: | Size: 27 KiB |
BIN
idz3/img/table2.png
Normal file
|
After Width: | Height: | Size: 14 KiB |
BIN
idz3/img/table3.png
Normal file
|
After Width: | Height: | Size: 30 KiB |
BIN
idz3/img/table4.png
Normal file
|
After Width: | Height: | Size: 42 KiB |
BIN
idz3/img/table5.png
Normal file
|
After Width: | Height: | Size: 30 KiB |
BIN
idz3/img/table6.png
Normal file
|
After Width: | Height: | Size: 26 KiB |
BIN
idz3/img/task1.png
Normal file
|
After Width: | Height: | Size: 138 KiB |
BIN
idz3/img/task1_1.png
Normal file
|
After Width: | Height: | Size: 31 KiB |
BIN
idz3/img/task1_2.png
Normal file
|
After Width: | Height: | Size: 15 KiB |
BIN
idz3/img/task2.png
Normal file
|
After Width: | Height: | Size: 141 KiB |
BIN
idz3/img/task2_1.png
Normal file
|
After Width: | Height: | Size: 34 KiB |
BIN
idz3/img/task2_2.png
Normal file
|
After Width: | Height: | Size: 27 KiB |
755
idz3/report.tex
Normal file
@@ -0,0 +1,755 @@
|
||||
\documentclass[a4paper, final]{article}
|
||||
%\usepackage{literat} % Нормальные шрифты
|
||||
\usepackage[14pt]{extsizes} % для того чтобы задать нестандартный 14-ый размер шрифта
|
||||
\usepackage{tabularx}
|
||||
\usepackage[T2A]{fontenc}
|
||||
\usepackage[utf8]{inputenc}
|
||||
\usepackage[russian]{babel}
|
||||
\usepackage{amsmath}
|
||||
\usepackage{amssymb}
|
||||
\usepackage[left=15mm, top=15mm, right=15mm, bottom=15mm, footskip=10mm]{geometry}
|
||||
\usepackage{ragged2e} %для растягивания по ширине
|
||||
\usepackage{setspace} %для межстрочно го интервала
|
||||
\usepackage{moreverb} %для работы с листингами
|
||||
\usepackage{indentfirst} % для абзацного отступа
|
||||
\usepackage{moreverb} %для печати в листинге исходного кода программ
|
||||
\usepackage{pdfpages} %для вставки других pdf файлов
|
||||
\usepackage{tikz}
|
||||
\usepackage{graphicx}
|
||||
\usepackage{afterpage}
|
||||
\usepackage{longtable}
|
||||
\usepackage{float}
|
||||
|
||||
|
||||
|
||||
% \usepackage[paper=A4,DIV=12]{typearea}
|
||||
\usepackage{pdflscape}
|
||||
% \usepackage{lscape}
|
||||
|
||||
\usepackage{array}
|
||||
\usepackage{multirow}
|
||||
|
||||
\renewcommand\verbatimtabsize{4\relax}
|
||||
\renewcommand\listingoffset{0.2em} %отступ от номеров строк в листинге
|
||||
\renewcommand{\arraystretch}{1.4} % изменяю высоту строки в таблице
|
||||
\usepackage[font=small, singlelinecheck=false, justification=centering, format=plain, labelsep=period]{caption} %для настройки заголовка таблицы
|
||||
\usepackage{listings} %листинги
|
||||
\usepackage{xcolor} % цвета
|
||||
\usepackage{hyperref}% для гиперссылок
|
||||
\usepackage{enumitem} %для перечислений
|
||||
|
||||
\newcommand{\specialcell}[2][l]{\begin{tabular}[#1]{@{}l@{}}#2\end{tabular}}
|
||||
|
||||
|
||||
\setlist[enumerate,itemize]{leftmargin=1.2cm} %отступ в перечислениях
|
||||
|
||||
\hypersetup{colorlinks,
|
||||
allcolors=[RGB]{010 090 200}} %красивые гиперссылки (не красные)
|
||||
|
||||
% подгружаемые языки — подробнее в документации listings (это всё для листингов)
|
||||
\lstloadlanguages{ SQL}
|
||||
% включаем кириллицу и добавляем кое−какие опции
|
||||
\lstset{tabsize=2,
|
||||
breaklines,
|
||||
basicstyle=\footnotesize,
|
||||
columns=fullflexible,
|
||||
flexiblecolumns,
|
||||
numbers=left,
|
||||
numberstyle={\footnotesize},
|
||||
keywordstyle=\color{blue},
|
||||
inputencoding=cp1251,
|
||||
extendedchars=true
|
||||
}
|
||||
\lstdefinelanguage{MyC}{
|
||||
language=SQL,
|
||||
% ndkeywordstyle=\color{darkgray}\bfseries,
|
||||
% identifierstyle=\color{black},
|
||||
% morecomment=[n]{/**}{*/},
|
||||
% commentstyle=\color{blue}\ttfamily,
|
||||
% stringstyle=\color{red}\ttfamily,
|
||||
% morestring=[b]",
|
||||
% showstringspaces=false,
|
||||
% morecomment=[l][\color{gray}]{//},
|
||||
keepspaces=true,
|
||||
escapechar=\%,
|
||||
texcl=true
|
||||
}
|
||||
|
||||
\textheight=24cm % высота текста
|
||||
\textwidth=16cm % ширина текста
|
||||
\oddsidemargin=0pt % отступ от левого края
|
||||
\topmargin=-1.5cm % отступ от верхнего края
|
||||
\parindent=24pt % абзацный отступ
|
||||
\parskip=5pt % интервал между абзацами
|
||||
\tolerance=2000 % терпимость к "жидким" строкам
|
||||
\flushbottom % выравнивание высоты страниц
|
||||
|
||||
|
||||
% Настройка листингов
|
||||
\lstset{
|
||||
language=python,
|
||||
extendedchars=\true,
|
||||
inputencoding=utf8,
|
||||
keepspaces=true,
|
||||
% captionpos=b, % подписи листингов снизу
|
||||
}
|
||||
|
||||
\begin{document} % начало документа
|
||||
|
||||
|
||||
|
||||
% НАЧАЛО ТИТУЛЬНОГО ЛИСТА
|
||||
\begin{center}
|
||||
\hfill \break
|
||||
\hfill \break
|
||||
\normalsize{МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ\\
|
||||
федеральное государственное автономное образовательное учреждение высшего образования «Санкт-Петербургский политехнический университет Петра Великого»\\[10pt]}
|
||||
\normalsize{Институт компьютерных наук и кибербезопасности}\\[10pt]
|
||||
\normalsize{Высшая школа технологий искусственного интеллекта}\\[10pt]
|
||||
\normalsize{Направление: 02.03.01 <<Математика и компьютерные науки>>}\\
|
||||
|
||||
\hfill \break
|
||||
\hfill \break
|
||||
\hfill \break
|
||||
\hfill \break
|
||||
\large{Индивидуальное домашнее задание №3}\\
|
||||
\large{по дисциплине}\\
|
||||
\large{<<Математическая статистика>>}\\
|
||||
\large{Вариант 27}\\
|
||||
|
||||
% \hfill \break
|
||||
\hfill \break
|
||||
\end{center}
|
||||
|
||||
\small{
|
||||
\begin{tabular}{lrrl}
|
||||
\!\!\!Студент, & \hspace{2cm} & & \\
|
||||
\!\!\!группы 5130201/20102 & \hspace{2cm} & \underline{\hspace{3cm}} &Тищенко А. А. \\\\
|
||||
\!\!\!Преподаватель & \hspace{2cm} & \underline{\hspace{3cm}} & Малов С. В. \\\\
|
||||
&&\hspace{4cm}
|
||||
\end{tabular}
|
||||
\begin{flushright}
|
||||
<<\underline{\hspace{1cm}}>>\underline{\hspace{2.5cm}} 2025г.
|
||||
\end{flushright}
|
||||
}
|
||||
|
||||
\hfill \break
|
||||
% \hfill \break
|
||||
\begin{center} \small{Санкт-Петербург, 2025} \end{center}
|
||||
\thispagestyle{empty} % выключаем отображение номера для этой страницы
|
||||
|
||||
% КОНЕЦ ТИТУЛЬНОГО ЛИСТА
|
||||
\newpage
|
||||
\section {Задание №1}
|
||||
|
||||
\begin{figure}[h!]
|
||||
\centering
|
||||
\includegraphics[width=1\linewidth]{img/task1.png}
|
||||
\label{fig:task1}
|
||||
\end{figure}
|
||||
|
||||
|
||||
\subsection{Пункт a}
|
||||
Вариационный ряд: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 6, 6, 7, 8, 8, 14.
|
||||
|
||||
Эмпирическая функция распределения (ЭФР)
|
||||
$$
|
||||
\hat{F}_n(x) = \frac{1}{n} \sum_{i=1}^{n} \text{\textbf{1}}_{\{X_i \leq x\}},
|
||||
$$
|
||||
где $n$ — объем выборки.
|
||||
|
||||
\begin{figure}[h!]
|
||||
\centering
|
||||
\includegraphics[width=0.55\linewidth]{img/task1_1.png}
|
||||
\label{fig:task1_1}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[h!]
|
||||
\centering
|
||||
\includegraphics[width=0.55\linewidth]{img/task1_2.png}
|
||||
\label{fig:task1_2}
|
||||
\end{figure}
|
||||
|
||||
\subsection{Пункт b}
|
||||
|
||||
\textbf{(i) Выборочное среднее (математическое ожидание)}
|
||||
Выборочное среднее — оценка теоретического математического ожидания.
|
||||
$$
|
||||
\bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i = 1.96
|
||||
$$
|
||||
|
||||
|
||||
\textbf{(ii) Выборочная дисперсия}
|
||||
|
||||
Несмещённая оценка дисперсии:
|
||||
$$
|
||||
s^2 = \frac{1}{n-1} \sum_{i=1}^{n}(X_i-\bar{X})^2 = 7.67
|
||||
$$
|
||||
|
||||
Смещенная оценка дисперсии:
|
||||
$$
|
||||
s^2_{\text{смещенная}} = \frac{1}{n} \sum_{i=1}^{n}(X_i - \bar{X})^2 = 7.52
|
||||
$$
|
||||
|
||||
где:
|
||||
\begin{itemize}
|
||||
\item $ n $ — общее количество наблюдений,
|
||||
\item $X_i$ — каждое отдельное наблюдение,
|
||||
\item $\bar{X}$ — среднее значение выборки.
|
||||
\end{itemize}
|
||||
|
||||
|
||||
\textbf{(iii) Медиана}
|
||||
|
||||
$$
|
||||
\text{Медиана} =
|
||||
\begin{cases}
|
||||
X_{\left(\frac{n}{2}\right)} & \text{если } n \text{ чётно} \\
|
||||
\frac{X_{\left(\frac{n-1}{2}\right)} + X_{\left(\frac{n+1}{2}\right)}}{2} & \text{если } n \text{ нечётно}
|
||||
\end{cases}
|
||||
$$
|
||||
|
||||
Для данных из варианта:
|
||||
$$
|
||||
\text{Медиана} = 1
|
||||
$$
|
||||
|
||||
\textbf{(iv) Ассиметрия}
|
||||
$$
|
||||
Skewness = \frac{\frac{1}{n}\sum_{i=1}^{n}(X_i-\bar{X})^3}{s^3} = 2.25
|
||||
$$
|
||||
|
||||
\textbf{(v) Эксцесс}
|
||||
$$
|
||||
Kurtosis = \frac{\frac{1}{n}\sum_{i=1}^{n}(X_i-\bar{X})^4}{s^4} - 3 = 5.92
|
||||
$$
|
||||
|
||||
\textbf{(vi) Вероятность $P(X \in [0.00, 2.49])$}
|
||||
$$
|
||||
P(X \in [a, b]) = \frac{\text{число элементов выборки} \in [a, b]}{n}.
|
||||
$$
|
||||
|
||||
Для данных из варианта:
|
||||
$$
|
||||
P(X \in [0.0, 2.49]): 0.74
|
||||
$$
|
||||
|
||||
\subsection{Пункт c}
|
||||
\textbf{1. Оценка максимального правдоподобия (ОМП)}
|
||||
Функция правдоподобия для Пуассона:
|
||||
$$
|
||||
L(\lambda) = \prod_{i=1}^{n}\frac{\lambda^{X_i}e^{-\lambda}}{X_i!}.
|
||||
$$
|
||||
|
||||
Логарифмируя, получаем:
|
||||
|
||||
$$
|
||||
\ln L(\lambda) = \sum_{i=1}^{n} \left( X_i \ln \lambda - \lambda - \ln X_i! \right).
|
||||
$$
|
||||
|
||||
Дифференцируя по $\lambda$, приравнивая к нулю:
|
||||
|
||||
$$
|
||||
\frac{d}{d\lambda} \ln L(\lambda) = \frac{1}{\lambda} \sum_{i=1}^{n} X_i - n = 0
|
||||
\Longrightarrow \hat{\lambda}_{\text{ОМП}} = \frac{1}{n} \sum_{i=1}^{n} X_i = \bar{X}.
|
||||
$$
|
||||
|
||||
ОМП для $\lambda$: 1.96
|
||||
|
||||
|
||||
\textbf{Смещение ОМП:}
|
||||
В случае распределения Пуассона оценка максимального правдоподобия (ОМП) параметра $\lambda$ совпадает с выборочным средним:
|
||||
|
||||
$$
|
||||
\hat{\lambda}_{\text{ОМП}} = \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i.
|
||||
$$
|
||||
|
||||
Найдём математическое ожидание этой оценки:
|
||||
|
||||
$$
|
||||
\mathbb{E}[\hat{\lambda}_{\text{ОМП}}] = \mathbb{E} \left[ \frac{1}{n} \sum_{i=1}^{n} x_i \right] = \frac{1}{n} \sum_{i=1}^{n} \mathbb{E}[x_i].
|
||||
$$
|
||||
|
||||
Так как для распределения Пуассона $\mathbb{E}[x_i] = \lambda$, то:
|
||||
|
||||
$$
|
||||
\mathbb{E}[\hat{\lambda}_{\text{ОМП}}] = \frac{1}{n} \cdot n \lambda = \lambda.
|
||||
$$
|
||||
|
||||
Отсюда следует:
|
||||
|
||||
$$
|
||||
\text{Смещение}(\hat{\lambda}_{\text{ОМП}}) = \lambda - \lambda = 0.
|
||||
$$
|
||||
|
||||
\textbf{2. Оценка по методу моментов (ОММ)}
|
||||
Приравниваем теоретическое математическое ожидание к выборочному:
|
||||
$$
|
||||
E[X]=\lambda \Longrightarrow \hat{\lambda}_{\text{MM}} = \bar{X}. \
|
||||
$$
|
||||
|
||||
ОММ для $\lambda$: 1.96
|
||||
|
||||
|
||||
\textbf{Смещение ОММ:}
|
||||
Метод моментов приводит к той же оценке:
|
||||
|
||||
$$
|
||||
\hat{\lambda}_{\text{ММ}} = \bar{x}.
|
||||
$$
|
||||
|
||||
Математическое ожидание:
|
||||
|
||||
$$
|
||||
\mathbb{E}[\hat{\lambda}_{\text{ММ}}] = \lambda \
|
||||
$$
|
||||
|
||||
Смещение этой оценки:
|
||||
|
||||
$$
|
||||
\text{Смещение}(\hat{\lambda}_{\text{ММ}}) = \lambda - \lambda = 0.
|
||||
$$
|
||||
|
||||
Таким образом, обе оценки ($\hat{\lambda}_{\text{ОМП}}$ и $\hat{\lambda}_{\text{ММ}}$) являются несмещёнными.
|
||||
|
||||
|
||||
\subsection{Пункт d}
|
||||
Aсимптотический доверительный интервал уровня значимости $\alpha_{1}=0.02$ для параметра $\lambda$ на базе оценки максимального правдоподобия
|
||||
|
||||
\textbf{Шаги построения}
|
||||
|
||||
\begin{enumerate}
|
||||
\item Оценка $\hat{\lambda}$
|
||||
ОМП параметра $\lambda$ равна выборочному среднему:
|
||||
$$ \hat{\lambda} = \bar{x} = 1.96 $$
|
||||
|
||||
\item Стандартная ошибка
|
||||
Для распределения Пуассона дисперсия равна $\lambda$:
|
||||
$$ SE = \sqrt{\frac{\hat{\lambda}}{n}} = 0.198$$
|
||||
|
||||
\item Квантиль нормального распределения
|
||||
Для уровня значимости $\alpha_{1} = 0.02$:
|
||||
$$ z_{1-\alpha/2} = z_{0.99} $$
|
||||
|
||||
\item Границы интервала
|
||||
$$ \hat{\lambda} \pm z_{0.99} \cdot SE $$
|
||||
|
||||
Доверительный интервал (98\%): $\lambda \in (1.499, 2.421)$
|
||||
\end{enumerate}
|
||||
|
||||
|
||||
\subsection{Пункт e}
|
||||
Критерий $\chi^2$ для проверки гипотезы согласия с распределением Пуассона ($\lambda_0 = 2.00$)
|
||||
Критерий $\chi^2$ проверяет, насколько эмпирические частоты $O_i$ соответствуют теоретическим частотам $E_i$ при заданном распределении.
|
||||
|
||||
\begin{enumerate}
|
||||
\item Расчёт наблюдаемых и теоретических частот:
|
||||
$O_i$ - наблюдаемые частоты для каждого интервала,
|
||||
|
||||
$$
|
||||
E_i = n \cdot P(X = k\ |\ \lambda = \lambda_0),
|
||||
$$
|
||||
где $P(X=k)$ — вероятность по распределению Пуассона.
|
||||
|
||||
\item Группировка данных: Объединить значения так, чтобы $E_i \geq 5$.
|
||||
|
||||
\item Статистика $\chi^2$:
|
||||
$$
|
||||
\chi^2 = \sum_{i=1}^{k}\frac{(O_i - E_i)^2}{E_i}.
|
||||
$$
|
||||
|
||||
\item Степени свободы:
|
||||
$$
|
||||
df = k - 1 - m,
|
||||
$$
|
||||
где $k$ — число категорий, $m=0$.
|
||||
\end{enumerate}
|
||||
|
||||
\textbf{Критическое значение:} Сравнение с $\chi_{\text{крит}}^2(df, \alpha)$.
|
||||
|
||||
\textbf{p-значение:} Вероятность $P(\chi^2 \geq \chi_{\text{набл}}^2)$.
|
||||
|
||||
\begin{figure}[h!]
|
||||
\centering
|
||||
\includegraphics[width=1\linewidth]{img/table1.png}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[h!]
|
||||
\centering
|
||||
\includegraphics[width=0.5\linewidth]{img/table2.png}
|
||||
\end{figure}
|
||||
|
||||
\newpage
|
||||
\textbf{Интерпретация}
|
||||
\begin{itemize}
|
||||
\item Наблюдаемые частоты $O_i$ — количество раз, когда значение $k$ встречается в выборке.
|
||||
\item Теоретическая вероятность $P(X=k)$ — вероятность по распределению Пуассона с $\lambda=2.0$.
|
||||
\item Теоретическая частота $E_i$ — ожидаемое количество значений $k$ при условии, что данные следуют распределению Пуассона ($E_i = n \cdot P(X = k)$).
|
||||
\end{itemize}
|
||||
|
||||
После группировки категорий (чтобы $E_i \geq 5$) таблица принимает вид:
|
||||
|
||||
\begin{figure}[h!]
|
||||
\centering
|
||||
\includegraphics[width=1\linewidth]{img/table3.png}
|
||||
\end{figure}
|
||||
|
||||
$\chi^2$ наблюдаемое: 29.022
|
||||
|
||||
Критическое значение ($\alpha=0.02$): 11.668
|
||||
|
||||
p-значение: 0.0000077
|
||||
|
||||
Отвергаем гипотезу на уровне $\alpha=0.02$
|
||||
|
||||
Наибольший уровень значимости, на котором ещё нет оснований отвергнуть гипотезу: 0.0000077
|
||||
|
||||
Это означает, что гипотеза отвергается на любом уровне значимости $\alpha \geq 0.0000077$
|
||||
|
||||
|
||||
\subsection{Пункт f}
|
||||
Критерий $\chi^2$ для проверки сложной гипотезы согласия с распределением Пуассона
|
||||
|
||||
\textbf{Оценка параметра $\lambda$}
|
||||
Если параметр $\lambda$ неизвестен, его оценивают по выборке (например, через выборочное среднее):
|
||||
|
||||
$$
|
||||
\hat{\lambda} = \frac{1}{n} \sum_{i=1}^n x_i,
|
||||
$$
|
||||
|
||||
где $x_i$ — значения выборки, $n$ — объем выборки.
|
||||
|
||||
\textbf{Степени свободы}
|
||||
Число степеней свободы для критерия $\chi^2$:
|
||||
|
||||
$$
|
||||
df = k - 1 - m,
|
||||
$$
|
||||
|
||||
где:
|
||||
- \( k \) — количество интервалов,
|
||||
- \( m \) — количество оцененных параметров (в данном случае \( m = 1 \), так как оценивается $\lambda$).
|
||||
|
||||
\textbf{Критическое значение:} Сравнение с $\chi_{\text{крит}}^2(df, \alpha)$.
|
||||
\textbf{p-значение:} Вероятность $P(\chi^2 \geq \chi_{\text{набл}}^2)$.
|
||||
|
||||
\begin{figure}[h!]
|
||||
\centering
|
||||
\includegraphics[width=0.8\linewidth]{img/table4.png}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[h!]
|
||||
\centering
|
||||
\includegraphics[width=1\linewidth]{img/table5.png}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[h!]
|
||||
\centering
|
||||
\includegraphics[width=1\linewidth]{img/table6.png}
|
||||
\end{figure}
|
||||
|
||||
Хи-квадрат статистика: 27.3903
|
||||
|
||||
Критическое значение ($\alpha=0.02$): 9.8374
|
||||
|
||||
p-value: 0.000005
|
||||
|
||||
Вывод: Отвергаем нулевую гипотезу
|
||||
|
||||
|
||||
\subsection{Пункт g}
|
||||
|
||||
Наиболее мощный критерий проверки гипотезы $H_0 : \lambda = \lambda_0 = 2.0$ против $H_1 : \lambda = \lambda_1 = 4.0$
|
||||
|
||||
\textbf{Логарифм отношения правдоподобия}
|
||||
|
||||
Функция правдоподобия для распределения Пуассона:
|
||||
|
||||
$$
|
||||
L(\lambda) = \prod_{i=1}^n \frac{\lambda^{X_i} e^{-\lambda}}{X_i!}
|
||||
$$
|
||||
|
||||
Логарифм отношения правдоподобия:
|
||||
|
||||
$$
|
||||
\ln \left( \frac{L(\lambda_1)}{L(\lambda_0)} \right) = \sum_{i=1}^n \left( X_i \ln \left( \frac{\lambda_1}{\lambda_0} \right) - (\lambda_1 - \lambda_0) \right).
|
||||
$$
|
||||
|
||||
\textbf{Критерий отношения правдоподобия}
|
||||
|
||||
Для проверки $H_0$ против $H_1$ используется сумма наблюдений $T = \sum_{i=1}^n X_i$. Критерий принимает $H_1$, если:
|
||||
|
||||
$$
|
||||
T > k,
|
||||
$$
|
||||
|
||||
где $k$ определяется как:
|
||||
|
||||
$$
|
||||
k = \text{qpois}(1 - \alpha, n\lambda_0).
|
||||
$$
|
||||
|
||||
\textbf{Смена гипотез}
|
||||
|
||||
Если поменять местами гипотезы, новая нулевая гипотеза $H_0 : \lambda = \lambda_1$, а альтернатива $H_1 : \lambda = \lambda_0$. В этом случае критерий принимает $H_0$, если:
|
||||
|
||||
$$
|
||||
T < k',
|
||||
$$
|
||||
|
||||
где $k'$ определяется как:
|
||||
|
||||
$$
|
||||
k' = \text{qpois}(\alpha, n\lambda_1).
|
||||
$$
|
||||
|
||||
Сумма наблюдений: $T_{obs} = 98$
|
||||
|
||||
Порог для $H_0: \lambda = 2.00$: $k = 121$
|
||||
|
||||
Порог для $H_0: \lambda = 4.00$: $k' = 172$
|
||||
|
||||
Проверка $H_0: \lambda = 2.00$ vs $H_1: \lambda = 4.00$:
|
||||
|
||||
Не отклоняем $H_0: T_{obs} = 98 \leq 121$
|
||||
|
||||
Проверка $H_0: \lambda = 4.00$ vs $H_1: \lambda = 2.00$:
|
||||
|
||||
Отклоняем $H_0: T_{obs} = 98 < 172$
|
||||
|
||||
\newpage
|
||||
\section{Задание 2}
|
||||
|
||||
\begin{figure}[h!]
|
||||
\centering
|
||||
\includegraphics[width=1\linewidth]{img/task2.png}
|
||||
\end{figure}
|
||||
|
||||
\subsection{Пункт a}
|
||||
|
||||
\textbf{1. Вариационный ряд}
|
||||
|
||||
Вариационный ряд: 0.0, 0.03, 0.06, 0.06, 0.07, 0.1, 0.11, 0.12, 0.12, 0.15, 0.17, 0.18, 0.24, 0.24, 0.29, 0.31, 0.36, 0.49, 0.49, 0.5, 0.53, 0.57, 0.59, 0.67, 0.85, 1.02, 1.11, 1.17, 1.31, 1.31, 2.37, 2.44, 2.58, 2.77, 2.98, 3.03, 3.13, 3.34, 3.57, 3.96, 4.55, 6.5, 6.72, 6.84, 8.33, 9.25, 11.4, 11.83, 14.94, 15.68
|
||||
|
||||
\textbf{2. Эмпирическая функция распределения (ЭФР)}
|
||||
$$
|
||||
\hat{F}_n(x) = \frac{1}{n} \sum_{i=1}^{n} \text{\textbf{1}}_{\{X_i \leq x\}},
|
||||
$$
|
||||
где $n$ — объем выборки.
|
||||
|
||||
\begin{figure}[h!]
|
||||
\centering
|
||||
\includegraphics[width=1\linewidth]{img/task2_1.png}
|
||||
\end{figure}
|
||||
|
||||
\newpage
|
||||
\textbf{3. Гистограмма частот}
|
||||
|
||||
\begin{figure}[h!]
|
||||
\centering
|
||||
\includegraphics[width=1\linewidth]{img/task2_2.png}
|
||||
\end{figure}
|
||||
|
||||
\newpage
|
||||
\subsection{Пункт b}
|
||||
|
||||
\textbf{1. Выборочное среднее (математическое ожидание)}
|
||||
Выборочное среднее — оценка теоретического математического ожидания.
|
||||
|
||||
$$
|
||||
\bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i = 2.79
|
||||
$$
|
||||
|
||||
\textbf{2. Выборочная дисперсия}
|
||||
Несмещённая оценка дисперсии:
|
||||
$$
|
||||
s^2 = \frac{1}{n-1} \sum_{i=1}^{n}(X_i-\bar{X})^2 = 15.59
|
||||
$$
|
||||
|
||||
Смещенная оценка дисперсии:
|
||||
$$
|
||||
s^2_{\text{смещенная}} = \frac{1}{n} \sum_{i=1}^{n}(X_i - \bar{X})^2 = 15.28
|
||||
$$
|
||||
|
||||
где:
|
||||
- $ n $ — общее количество наблюдений,
|
||||
- $X_i$ — каждое отдельное наблюдение,
|
||||
- $\bar{X}$ — среднее значение выборки.
|
||||
|
||||
\textbf{3. Медиана}
|
||||
Значение, разделяющее выборку на две равные части.
|
||||
|
||||
$$
|
||||
\text{Медиана} = 0.94
|
||||
$$
|
||||
|
||||
\textbf{4. Ассиметрия}
|
||||
$$
|
||||
Skewness = \frac{\frac{1}{n}\sum_{i=1}^{n}(X_i-\bar{X})^3}{s^3} = 1.85
|
||||
$$
|
||||
|
||||
\textbf{5. Эксцесс}
|
||||
$$
|
||||
Kurtosis = \frac{\frac{1}{n}\sum_{i=1}^{n}(X_i-\bar{X})^4}{s^4} - 3 = 2.66
|
||||
$$
|
||||
|
||||
\textbf{6. Вероятность $P(X \in [0.00, 4.62])$}
|
||||
Эмпирическая оценка вероятности:
|
||||
$$
|
||||
P(X \in [c, d]) = \frac{\text{число элементов выборки} \in [c, d]}{n}.
|
||||
$$
|
||||
|
||||
$$
|
||||
P(X \in [0.0, 4.62]): 0.82
|
||||
$$
|
||||
|
||||
\subsection{Пункт c}
|
||||
\textbf{1. Оценка максимального правдоподобия (ОМП)}
|
||||
|
||||
|
||||
Функция правдоподобия для показательного распределения:
|
||||
$$
|
||||
L(\lambda) = \prod_{i=1}^{n} \lambda e^{-\lambda x_i} = \lambda^n e^{-\lambda \sum_{i=1}^{n} x_i}
|
||||
$$
|
||||
Логарифмируя, получаем:
|
||||
$$
|
||||
\ln L(\lambda) = n \ln \lambda - \lambda \sum_{i=1}^{n} x_i
|
||||
$$
|
||||
Дифференцируя по $\lambda$ и приравнивая к нулю:
|
||||
$$
|
||||
\frac{d}{d\lambda} \ln L(\lambda) = \frac{n}{\lambda} - \sum_{i=1}^{n} x_i = 0
|
||||
$$
|
||||
Отсюда получаем ОМП:
|
||||
$$
|
||||
\hat{\lambda}{\text{ОМП}} = \frac{n}{\sum{i=1}^{n} x_i} = \frac{1}{\bar{X}}
|
||||
$$
|
||||
|
||||
ОМП для $\lambda$: 0.3586
|
||||
|
||||
|
||||
\textbf{2. Оценка по методу моментов (ОММ)}
|
||||
Для показательного распределения математическое ожидание равно $E[X] = \frac{1}{\lambda}$. Приравнивая теоретическое математическое ожидание к выборочному:
|
||||
$$
|
||||
\frac{1}{\lambda} = \bar{X} \Rightarrow \hat{\lambda}{\text{ММ}} = \frac{1}{\bar{X}}
|
||||
$$
|
||||
ОММ для $\lambda$: 0.3586
|
||||
|
||||
|
||||
\textbf{3. Смещение оценок}
|
||||
Для показательного распределения ОМП и ОММ совпадают. Найдём смещение:
|
||||
$$
|
||||
\text{Смещение}(\hat{\lambda}) = E[\hat{\lambda}] - \lambda
|
||||
$$
|
||||
Для показательного распределения:
|
||||
$$
|
||||
E[\hat{\lambda}_{\text{ОМП}}] = E\left[\frac{1}{\bar{X}}\right] \neq \frac{1}{E[\bar{X}]} = \lambda
|
||||
$$
|
||||
Оценка $\hat{\lambda}_{\text{ОМП}}$ является смещённой, но асимптотически несмещённой.
|
||||
|
||||
Смещение MLE: 0.0073
|
||||
|
||||
|
||||
\subsection{Пункт d}
|
||||
|
||||
Для построения асимптотического доверительного интервала используем тот факт, что ОМП асимптотически нормальна с дисперсией:
|
||||
$$
|
||||
\text{Var}(\hat{\lambda}) = \frac{\lambda^2}{n}
|
||||
$$
|
||||
Доверительный интервал уровня значимости $\alpha_2$ имеет вид:
|
||||
$$
|
||||
\hat{\lambda} \pm z_{1-\alpha_2/2} \cdot \frac{\hat{\lambda}}{\sqrt{n}}
|
||||
$$
|
||||
где $z_{1-\alpha_2/2}$ — квантиль стандартного нормального распределения.
|
||||
|
||||
Квантиль $z_{1-\alpha_2/2} = 1.6449$
|
||||
|
||||
Доверительный интервал (90.0\%): (0.2752, 0.4420)
|
||||
|
||||
\subsection{Пункт e}
|
||||
Критерий Колмогорова основан на статистике:
|
||||
$$
|
||||
D_n = \sup_x |F_n(x) - F(x)|
|
||||
$$
|
||||
где $F_n(x)$ — эмпирическая функция распределения, $F(x)$ — теоретическая функция распределения.
|
||||
Для показательного распределения с параметром $\lambda_0$:
|
||||
$$
|
||||
F(x) = 1 - e^{-\lambda_0 x}, \quad x \geq 0
|
||||
$$
|
||||
|
||||
Критерий Колмогорова-Смирнова:
|
||||
|
||||
Статистика $D_n$: 0.2831, Критическое значение: 0.1725
|
||||
|
||||
P-value: 0.0005
|
||||
|
||||
Гипотеза отвергается
|
||||
|
||||
\subsection{Пункт f}
|
||||
Критерий $\chi^2$ основан на сравнении наблюдаемых и ожидаемых частот в интервалах:
|
||||
$$
|
||||
\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}
|
||||
$$
|
||||
где $O_i$ — наблюдаемая частота в $i$-м интервале, $E_i$ — ожидаемая частота.
|
||||
|
||||
$\chi^2$ статистика: 14.4669
|
||||
|
||||
Критическое значение ($\alpha=0.1$): 6.2514
|
||||
|
||||
p-значение: 0.002334
|
||||
|
||||
Степени свободы: 3
|
||||
|
||||
Гипотеза отвергается на уровне 0.1
|
||||
|
||||
|
||||
\subsection{Пункт g}
|
||||
Критерий $\chi^2$ для проверки сложной гипотезы
|
||||
|
||||
При проверке сложной гипотезы параметр $\lambda$ оценивается по выборке:
|
||||
Оценка $\lambda$: 0.3586
|
||||
|
||||
Критерий $\chi^2$ для сложной гипотезы:
|
||||
|
||||
Статистика $\chi^2$: 10.9186
|
||||
|
||||
Критическое значение ($\alpha=0.1$): 4.6052
|
||||
|
||||
p-значение: 0.0043
|
||||
|
||||
Степени свободы: 2
|
||||
|
||||
Гипотеза отвергается на уровне 0.1
|
||||
|
||||
Таблица частот:
|
||||
|
||||
[0.00, 1.40): O=30, E=19.74
|
||||
|
||||
[1.40, 2.80): O=4, E=11.95
|
||||
|
||||
[2.80, 4.20): O=6, E=7.23
|
||||
|
||||
[4.20, 16.80): O=10, E=10.97
|
||||
|
||||
\subsection{Пункт h}
|
||||
Для проверки простой гипотезы $H_0: \lambda = \lambda_0$ против альтернативы $H_1: \lambda = \lambda_1$ наиболее мощный критерий основан на отношении правдоподобия:
|
||||
$$
|
||||
\Lambda = \frac{L(\lambda_0)}{L(\lambda_1)} = \frac{\lambda_0^n e^{-\lambda_0 \sum_{i=1}^{n} x_i}}{\lambda_1^n e^{-\lambda_1 \sum_{i=1}^{n} x_i}} = \left(\frac{\lambda_0}{\lambda_1}\right)^n e^{-(\lambda_0-\lambda_1) \sum_{i=1}^{n} x_i}
|
||||
$$
|
||||
Логарифмируя:
|
||||
$$
|
||||
\ln \Lambda = n \ln\left(\frac{\lambda_0}{\lambda_1}\right) - (\lambda_0-\lambda_1) \sum_{i=1}^{n} x_i
|
||||
$$
|
||||
Критическая область имеет вид $\ln \Lambda < c$, где $c$ определяется уровнем значимости $\alpha_2$.
|
||||
|
||||
Критическая область: $sum \, data > 179.54$
|
||||
|
||||
Сумма данных: 139.43
|
||||
|
||||
Решение: Не отвергаем $H_0$
|
||||
|
||||
При замене гипотез местами:
|
||||
|
||||
Критическая область: $sum \, data < 294.14$
|
||||
|
||||
Решение: Отвергаем $H_0$
|
||||
\end{document}
|
||||