Prawdopodobieństwo Klasyczne

Podstawowa definicja z rzutem kostką

Definicja klasyczna:
$$P(A) = \frac{|A|}{|\Omega|}$$

Gdzie $|A|$ to liczba zdarzeń sprzyjających, a $|\Omega|$ to liczba wszystkich możliwych (równoprawdopodobnych) zdarzeń elementarnych.

Symulacja: Rzut kością k6

Cel: Wyrzucenie liczby parzystej ($A$).

?
Rzutów ($N$): 0
Parzystych ($|A|$): 0
Empiryczne $P(A)$: -

Wyprowadzenie teoretyczne

  1. Przestrzeń zdarzeń elementarnych: $\Omega = \{1, 2, 3, 4, 5, 6\}$
  2. Liczba wszystkich możliwych wyników: $|\Omega| = 6$
  3. Zdarzenie $A$ (liczba parzysta): $A = \{2, 4, 6\}$
  4. Liczba zdarzeń sprzyjających: $|A| = 3$
  5. Wynik: $$P(A) = \frac{3}{6} = \frac{1}{2} = 0.5$$

Prawdopodobieństwo Warunkowe

Rzuty wieloma kostkami

Definicja prawdopodobieństwa warunkowego:
$$P(A|B) = \frac{P(A \cap B)}{P(B)} = \frac{|A \cap B|}{|B|}$$

Symulacja: 3x rzut kością k4

Cel: Suma oczek = 5 ($A$), wiedząc, że wypadła przynajmniej jedna 1 ($B$).

?
?
?
Rzutów ($N$): 0
Spełnia $B$ ($|B|$): 0
Spełnia $A \cap B$: 0
Empiryczne $P(A|B)$: -

Wyprowadzenie teoretyczne

  1. Moc przestrzeni: $|\Omega| = 4^3 = 64$
  2. Zdarzenie $B$ (przynajmniej jedna 1): łatwiej policzyć zdarzenie przeciwne $B'$ (żadnej jedynki). $|B'| = 3^3 = 27$. Zatem $|B| = 64 - 27 = 37$.
  3. Zdarzenie $A \cap B$ (suma 5 i przynajmniej jedna 1). Układy: $\{1, 1, 3\}$ i $\{1, 2, 2\}$.
  4. Permutacje: układ $\{1, 1, 3\}$ można ułożyć na 3 sposoby. Układ $\{1, 2, 2\}$ też na 3 sposoby. Razem $|A \cap B| = 6$.
  5. Wynik: $$P(A|B) = \frac{6}{37} \approx 0.162$$

Prawdopodobieństwo Całkowite i Wzór Bayesa

Fałszywe alarmy vs. rzadka choroba

Wzór Bayesa:
$$P(H_i|A) = \frac{P(A|H_i) \cdot P(H_i)}{P(A)}$$

Symulacja: Test na rzadką chorobę

Test wykrywa 90% chorych, ale u 9% zdrowych daje fałszywy alarm. Otrzymałeś wynik (+) — jakie jest prawdopodobieństwo, że naprawdę jesteś chory?

Stan zdrowia
P(H₁) = 1%
H₁: Choroba
P(+|H₁) = 90%
P(H₂) = 99%
H₂: Zdrowy
P(+|H₂) = 9%
Chorzy: 10 / 1000 Zdrowi: 990 / 1000 Wynik (+):
Chory Zdrowy Wynik (+)
Prawdziwie pozytywni (TP)
Fałszywie pozytywni (FP)
$P(H_1|+)$ — naprawdę chory

Wyprowadzenie teoretyczne

  • $H_1$ — osoba chora, $P(H_1) = 0{,}01$
  • $H_2$ — osoba zdrowa, $P(H_2) = 0{,}99$
  • $A$ — wynik testu dodatni (+). $P(A|H_1) = 0{,}90$, $P(A|H_2) = 0{,}09$
  • Prawd. całkowite: $$P(A) = 0{,}01 \cdot 0{,}90 + 0{,}99 \cdot 0{,}09 = 0{,}0981$$
  • Wzór Bayesa: $$P(H_1|A) = \frac{0{,}009}{0{,}0981} \approx 0{,}092 \approx 9{,}2\%$$

Mimo pozytywnego wyniku testu, prawdopodobieństwo choroby wynosi zaledwie ~9%. Fałszywe alarmy dominują, bo choroba jest bardzo rzadka.

Niezależność Zdarzeń

Rzut kością k10

Definicja niezależności:
$$P(A \cap B) = P(A) \cdot P(B)$$

Symulacja: Rzut kością k10

$A$ - wynik podzielny przez 2, $B$ - wynik podzielny przez 3.

A (Parzyste)
2, 4, 8, 10
B (Podz. przez 3)
3, 9
6
1, 5, 7
?

Sprawdzenie niezależności

  • $\Omega = \{1, 2, ..., 10\}$.
  • $A = \{2, 4, 6, 8, 10\} \Rightarrow P(A) = \frac{5}{10} = \frac{1}{2}$
  • $B = \{3, 6, 9\} \Rightarrow P(B) = \frac{3}{10}$
  • $A \cap B = \{6\} \Rightarrow P(A \cap B) = \frac{1}{10}$
$$P(A) \cdot P(B) = \frac{1}{2} \cdot \frac{3}{10} = \frac{3}{20}$$ $$\frac{1}{10} \neq \frac{3}{20} \Rightarrow \text{Zdarzenia ZALEŻNE}$$

Prawdopodobieństwo Geometryczne

Wybór punktu z obszaru

Prawdopodobieństwo geometryczne:
$$P(A) = \frac{\text{Pole}(A)}{\text{Pole}(\Omega)}$$

Symulacja: Losowanie punktu

Punkt z prostokąta: $x \in [0, 1]$, $y \in [0, 2]$. Warunek $A$: $y > x^2$.

Wszystkie ($N$): 0
W obszarze $A$: 0
$P(A)$ (empir.): -

Obliczenia analityczne (Całki)

  • Cała przestrzeń $\Omega$: prostokąt szerokości 1, wysokości 2. $\text{Pole}(\Omega) = 1 \cdot 2 = 2$.
  • Zdarzenie $A$: $y > x^2$. Najpierw policzmy pole POD parabolą (odwrotność): $$\int_0^1 x^2 dx = \left[ \frac{x^3}{3} \right]_0^1 = \frac{1}{3}$$
  • Zatem pole NAD parabolą (nasze $A$) to pole całego prostokąta minus pole pod parabolą: $$\text{Pole}(A) = 2 - \frac{1}{3} = \frac{5}{3}$$
  • Wynik końcowy: $$P(A) = \frac{5/3}{2} = \frac{5}{6} \approx 0.833$$

Wartość Oczekiwana Zmiennej Ciągłej

Rozkład dany gęstością prawdopodobieństwa

Wzór na $E(X)$:
$$E(X) = \int_{-\infty}^{\infty} x \cdot f(x) \, dx$$

Wizualizacja gęstości $f(x)$ i $x \cdot f(x)$

$f(x) = 0.5$ dla $x \in [0, 1]$, oraz $0.25$ dla $x \in (1, 3]$

Gęstość $f(x)$
Funkcja $x \cdot f(x)$

Pole pod różową krzywą to Wartość Oczekiwana $E(X)$.

Obliczanie całki

$$E(X) = \int_0^1 x \cdot \frac{1}{2} dx + \int_1^3 x \cdot \frac{1}{4} dx$$ $$E(X) = \frac{1}{2} \left[ \frac{x^2}{2} \right]_0^1 + \frac{1}{4} \left[ \frac{x^2}{2} \right]_1^3$$ $$E(X) = \frac{1}{2} \left( \frac{1}{2} - 0 \right) + \frac{1}{4} \left( \frac{9}{2} - \frac{1}{2} \right)$$ $$E(X) = \frac{1}{4} + \frac{1}{4} \cdot 4 = \frac{1}{4} + 1 = \frac{5}{4} = 1.25$$

Suma Wartości Oczekiwanych

Centralne Twierdzenie Graniczne w praktyce

Najbardziej prawdopodobna suma:
$$E(S_n) = n \cdot E(X_1)$$

Wynika to z faktu, że rozkład sumy zbliża się do rozkładu normalnego, w którym maksimum (najbardziej prawdopodobny wynik) pokrywa się ze średnią.

Symulacja: Rzut 100 kostkami k8

Z każdym rzutem będziemy odkładać sumę na histogramie.

Szybkie obliczenia

  • Pojedyncza kostka k8 ma wyniki $\{1, 2, 3, 4, 5, 6, 7, 8\}$.
  • Wartość oczekiwana pojedynczej kostki: $$E(X_1) = \frac{1+2+3+4+5+6+7+8}{8} = 4.5$$
  • Z racji niezależności rzutów, wartość oczekiwana sumy 100 rzutów to: $$E(S_{100}) = 100 \cdot E(X_1) = 100 \cdot 4.5 = 450$$
  • Krzywa dzwonowa (na histogramie) wycentruje się dokładnie wokół wartości 450.