Prawdopodobieństwo Klasyczne

Podstawowa definicja z rzutem kostką

Definicja klasyczna:

$$P(A) = \frac{|A|}{|\Omega|}$$

Gdzie $|A|$ to liczba zdarzeń sprzyjających, a $|\Omega|$ to liczba wszystkich możliwych (równoprawdopodobnych) zdarzeń elementarnych.

Symulacja: Rzut kością k6

Cel: Wyrzucenie liczby parzystej ($A$).

?

Rzutów ($N$): 0

Parzystych ($|A|$): 0

                  Empiryczne $P(A)$:
                  -
                

Wyprowadzenie teoretyczne

Przestrzeń zdarzeń elementarnych: $\Omega = \{1, 2, 3, 4, 5, 6\}$
Liczba wszystkich możliwych wyników: $|\Omega| = 6$
Zdarzenie $A$ (liczba parzysta): $A = \{2, 4, 6\}$
Liczba zdarzeń sprzyjających: $|A| = 3$
Wynik: $$P(A) = \frac{3}{6} = \frac{1}{2} = 0.5$$

Prawdopodobieństwo Warunkowe

Rzuty wieloma kostkami

Definicja prawdopodobieństwa warunkowego:

$$P(A|B) = \frac{P(A \cap B)}{P(B)} = \frac{|A \cap B|}{|B|}$$

Symulacja: 3x rzut kością k4

Cel: Suma oczek = 5 ($A$), wiedząc, że wypadła przynajmniej jedna 1 ($B$).

?

Rzutów ($N$): 0

Spełnia $B$ ($|B|$): 0

Spełnia $A \cap B$: 0

                  Empiryczne $P(A|B)$:
                  -
                

Wyprowadzenie teoretyczne

Moc przestrzeni: $|\Omega| = 4^3 = 64$
Zdarzenie $B$ (przynajmniej jedna 1): łatwiej policzyć zdarzenie przeciwne $B'$ (żadnej jedynki). $|B'| = 3^3 = 27$. Zatem $|B| = 64 - 27 = 37$.
Zdarzenie $A \cap B$ (suma 5 i przynajmniej jedna 1). Układy: $\{1, 1, 3\}$ i $\{1, 2, 2\}$.
Permutacje: układ $\{1, 1, 3\}$ można ułożyć na 3 sposoby. Układ $\{1, 2, 2\}$ też na 3 sposoby. Razem $|A \cap B| = 6$.
Wynik: $$P(A|B) = \frac{6}{37} \approx 0.162$$

Prawdopodobieństwo Całkowite i Wzór Bayesa

Fałszywe alarmy vs. rzadka choroba

Wzór Bayesa:

$$P(H_i|A) = \frac{P(A|H_i) \cdot P(H_i)}{P(A)}$$

Symulacja: Test na rzadką chorobę

Test wykrywa 90% chorych, ale u 9% zdrowych daje fałszywy alarm. Otrzymałeś wynik (+) — jakie jest prawdopodobieństwo, że naprawdę jesteś chory?

Stan zdrowia

P(H₁) = 1%

H₁: Choroba

P(+|H₁) = 90%

P(H₂) = 99%

H₂: Zdrowy

P(+|H₂) = 9%

Chorzy: 10 / 1000 Zdrowi: 990 / 1000

Chory Zdrowy Wynik (+)

Prawdziwie pozytywni (TP) —

Fałszywie pozytywni (FP) —

                  $P(H_1|+)$ — naprawdę chory
                  —
                

Wyprowadzenie teoretyczne

$H_1$ — osoba chora, $P(H_1) = 0{,}01$
$H_2$ — osoba zdrowa, $P(H_2) = 0{,}99$
$A$ — wynik testu dodatni (+). $P(A|H_1) = 0{,}90$, $P(A|H_2) = 0{,}09$
Prawd. całkowite: $$P(A) = 0{,}01 \cdot 0{,}90 + 0{,}99 \cdot 0{,}09 = 0{,}0981$$
Wzór Bayesa: $$P(H_1|A) = \frac{0{,}009}{0{,}0981} \approx 0{,}092 \approx 9{,}2\%$$

Mimo pozytywnego wyniku testu, prawdopodobieństwo choroby wynosi zaledwie ~9%. Fałszywe alarmy dominują, bo choroba jest bardzo rzadka.

Niezależność Zdarzeń

Rzut kością k10

Definicja niezależności:

$$P(A \cap B) = P(A) \cdot P(B)$$

Symulacja: Rzut kością k10

$A$ - wynik podzielny przez 2, $B$ - wynik podzielny przez 3.

A (Parzyste)

2, 4, 8, 10

B (Podz. przez 3)

3, 9

6

1, 5, 7

?

Sprawdzenie niezależności

$\Omega = \{1, 2, ..., 10\}$.
$A = \{2, 4, 6, 8, 10\} \Rightarrow P(A) = \frac{5}{10} = \frac{1}{2}$
$B = \{3, 6, 9\} \Rightarrow P(B) = \frac{3}{10}$
$A \cap B = \{6\} \Rightarrow P(A \cap B) = \frac{1}{10}$

$$P(A) \cdot P(B) = \frac{1}{2} \cdot \frac{3}{10} = \frac{3}{20}$$ $$\frac{1}{10} \neq \frac{3}{20} \Rightarrow \text{Zdarzenia ZALEŻNE}$$

Prawdopodobieństwo Geometryczne

Wybór punktu z obszaru

Prawdopodobieństwo geometryczne:

$$P(A) = \frac{\text{Pole}(A)}{\text{Pole}(\Omega)}$$

Symulacja: Losowanie punktu

Punkt z prostokąta: $x \in [0, 1]$, $y \in [0, 2]$. Warunek $A$: $y > x^2$.

Wszystkie ($N$): 0

W obszarze $A$: 0

                  $P(A)$ (empir.):
                  -
                

Obliczenia analityczne (Całki)

Cała przestrzeń $\Omega$: prostokąt szerokości 1, wysokości 2. $\text{Pole}(\Omega) = 1 \cdot 2 = 2$.
Zdarzenie $A$: $y > x^2$. Najpierw policzmy pole POD parabolą (odwrotność): $$\int_0^1 x^2 dx = \left[ \frac{x^3}{3} \right]_0^1 = \frac{1}{3}$$
Zatem pole NAD parabolą (nasze $A$) to pole całego prostokąta minus pole pod parabolą: $$\text{Pole}(A) = 2 - \frac{1}{3} = \frac{5}{3}$$
Wynik końcowy: $$P(A) = \frac{5/3}{2} = \frac{5}{6} \approx 0.833$$

Wartość Oczekiwana Zmiennej Ciągłej

Rozkład dany gęstością prawdopodobieństwa

Wzór na $E(X)$:

$$E(X) = \int_{-\infty}^{\infty} x \cdot f(x) \, dx$$

Wizualizacja gęstości $f(x)$ i $x \cdot f(x)$

$f(x) = 0.5$ dla $x \in [0, 1]$, oraz $0.25$ dla $x \in (1, 3]$

Gęstość $f(x)$

Funkcja $x \cdot f(x)$

Pole pod różową krzywą to Wartość Oczekiwana $E(X)$.

Obliczanie całki

$$E(X) = \int_0^1 x \cdot \frac{1}{2} dx + \int_1^3 x \cdot \frac{1}{4} dx$$ $$E(X) = \frac{1}{2} \left[ \frac{x^2}{2} \right]_0^1 + \frac{1}{4} \left[ \frac{x^2}{2} \right]_1^3$$ $$E(X) = \frac{1}{2} \left( \frac{1}{2} - 0 \right) + \frac{1}{4} \left( \frac{9}{2} - \frac{1}{2} \right)$$ $$E(X) = \frac{1}{4} + \frac{1}{4} \cdot 4 = \frac{1}{4} + 1 = \frac{5}{4} = 1.25$$

Suma Wartości Oczekiwanych

Centralne Twierdzenie Graniczne w praktyce

Najbardziej prawdopodobna suma:

$$E(S_n) = n \cdot E(X_1)$$

Wynika to z faktu, że rozkład sumy zbliża się do rozkładu normalnego, w którym maksimum (najbardziej prawdopodobny wynik) pokrywa się ze średnią.

Symulacja: Rzut 100 kostkami k8

Z każdym rzutem będziemy odkładać sumę na histogramie.

Szybkie obliczenia

Pojedyncza kostka k8 ma wyniki $\{1, 2, 3, 4, 5, 6, 7, 8\}$.
Wartość oczekiwana pojedynczej kostki: $$E(X_1) = \frac{1+2+3+4+5+6+7+8}{8} = 4.5$$
Z racji niezależności rzutów, wartość oczekiwana sumy 100 rzutów to: $$E(S_{100}) = 100 \cdot E(X_1) = 100 \cdot 4.5 = 450$$
Krzywa dzwonowa (na histogramie) wycentruje się dokładnie wokół wartości 450.