Дилемма заключённого матописание
This commit is contained in:
@@ -171,7 +171,7 @@
|
||||
|
||||
|
||||
\subsection{Папоротник Барнсли}
|
||||
Папоротник Барнсли — фрактал, названый в честь британского математика Майкла Барнсли, впервые описан в его книге <<Fractals Everywhere>>~\cite{barnsley}. Для его построения используется четыре простых трансформации, которые применяются случайным образом с определёнными вероятностями. Каждое преобразование масштабирует, поворачивает и смещает точки, начиная с одного начального положения. На каждом шаге, в зависимости от случайно выбранной трансформации, новая точка генерируется на основе предыдущей, и этот процесс повторяется многократно. Результатом становится изображение, напоминающее настоящие папоротники, с характерным ветвящимся и самоподобным узором.
|
||||
Папоротник Барнсли — фрактал, названый в честь британского математика Майкла Барнсли, впервые описан в его книге <<Fractals Everywhere>>~\cite{barnsley}. Для его построения используется четыре простых трансформации, которые применяются случайным образом с определёнными вероятностями. Каждое преобразование масштабирует, поворачивает и смещает точки, начиная с одного начального положения. На каждом шаге, в зависимости от случайно выбранной трансформации, новая точка генерируется на основе предыдущей, и этот процесс повторяется многократно. Результатом становится изображение, напоминающее настоящие папоротники.
|
||||
|
||||
\[
|
||||
\begin{aligned}
|
||||
@@ -211,6 +211,80 @@
|
||||
\end{figure}
|
||||
|
||||
|
||||
\subsection{Дилемма заключённого}
|
||||
Дилемма заключённого — фундаментальная проблема в теории игр, согласно которой рациональные игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок (<<заключённый>>) максимизирует свой собственный выигрыш, не заботясь о выгоде других. В классическом варианте дилеммы заключённого два игрока могут выбрать одно из двух действий:
|
||||
|
||||
\begin{itemize}
|
||||
\item \textbf{Сотрудничество}: Игрок решает сотрудничать с другим игроком, не сдавая его властям.
|
||||
\item \textbf{Предательство}: Игрок решает предать другого, сдавая его властям, с целью получения личной выгоды.
|
||||
\end{itemize}
|
||||
|
||||
В зависимости от действий обоих игроков возможны следующие исходы:
|
||||
\begin{itemize}
|
||||
\item Если оба игрока сотрудничают, они оба получают умеренное наказание.
|
||||
\item Если один игрок сотрудничает, а другой предаёт, то предатель получает свободу, а сотрудничающий — максимальное наказание.
|
||||
\item Если оба игрока предают друг друга, оба получают умеренные наказания, однако хуже, чем при сотрудничестве.
|
||||
\end{itemize}
|
||||
|
||||
В таблице \ref{tbl:exodus} представлены варианты исходов дилеммы заключённого, которые рассматривались в этом варианте лабораторной работы.
|
||||
|
||||
\begin{table}[h!]
|
||||
\centering
|
||||
\caption{Исходы дилеммы заключённого}
|
||||
\label{tbl:exodus}
|
||||
\footnotesize
|
||||
\begin{tabularx}{\textwidth}{|p{3.5cm}|p{3.5cm}|X|}
|
||||
\hline
|
||||
\textbf{Действие игрока 1} & \textbf{Действие игрока 2} & \textbf{Наказание игрока 1 / Наказание игрока 2} \\
|
||||
\hline
|
||||
Сотрудничество & Сотрудничество & 1 год / 1 год \\
|
||||
\hline
|
||||
Сотрудничество & Предательство & 10 лет / 0 лет \\
|
||||
\hline
|
||||
Предательство & Сотрудничество & 0 лет / 10 лет \\
|
||||
\hline
|
||||
Предательство & Предательство & 5 лет / 5 лет \\
|
||||
\hline
|
||||
\end{tabularx}
|
||||
\end{table}
|
||||
|
||||
В повторяющейся дилемме заключённого игра происходит периодически, и каждый игрок может «наказать» другого за несотрудничество ранее.
|
||||
|
||||
\subsection{Равновесие Нэша}
|
||||
Равновесие Нэша — одно из ключевых понятий теории игр. Так называется набор стратегий в игре для двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив свою стратегию, если другие участники своих стратегий не меняют.
|
||||
|
||||
Определить стратегию, при которой наступает равновесие можно с помощью формулы:
|
||||
|
||||
\[
|
||||
u_i(s_i^*, s_{-i}) \geq u_i(s_i, s_{-i}) \quad \text{для всех} \ s_i,
|
||||
\]
|
||||
|
||||
где:
|
||||
\begin{itemize}
|
||||
\item $u_i(s_i^*, s_{-i})$ — выигрыш игрока $i$, если он выбирает стратегию $s_i^*$, а остальные игроки выбирают стратегии $s_{-i}$;
|
||||
\item $s_{-i}$ — набор стратегий всех игроков, кроме игрока $i$;
|
||||
\item $s_i$ — стратегия игрока $i$.
|
||||
\end{itemize}
|
||||
|
||||
В случае с дилеммой заключённого равновесие Нэша достигается, когда оба игрока выбирают стратегию предательства (П). Если игрок 1 выбирает сотрудничество (С), то игрок 2, выбирая предательство (П), получает 0 лет (лучший результат для него), а игрок 1 — 10 лет. Если игрок 1 выбирает предательство (П), то игрок 2, также выбирая предательство (П), получает 5 лет, а игрок 1 — 5 лет.
|
||||
|
||||
\subsection{Прощающая стратегия}
|
||||
Прощающая стратегия заключается в том, что игрок не предает, пока это не сделает оппонент, далее мстит один ход и снова возвращается к сотрудничеству, если оппонент не продолжает предавать.
|
||||
|
||||
\[
|
||||
s_i(t) =
|
||||
\begin{cases}
|
||||
\text{С}, & \text{если } s_j(t-1) = \text{С}, \\
|
||||
\text{П}, & \text{если } s_j(t-1) = \text{П}.
|
||||
\end{cases}
|
||||
\]
|
||||
где:
|
||||
\vspace{-10pt}
|
||||
\begin{itemize}
|
||||
\item \( s_i(t) \) — стратегия игрока \( i \) на шаге \( t \),
|
||||
\item \( s_j(t-1) \) — стратегия оппонента на шаге \( t-1 \).
|
||||
\end{itemize}
|
||||
|
||||
\newpage
|
||||
\section {Особенности реализации}
|
||||
|
||||
|
||||
Reference in New Issue
Block a user