Matplotlib je výkonná knihovna pro vykreslování používaná v programovacím jazyce Python. Poskytuje objektově orientované API pro vkládání grafů do aplikací, které používají obecné sady nástrojů GUI, jako je Tkinter, wxPython nebo Qt. Jedním z důležitých nástrojů poskytovaných Matplotlibem je schopnost vytvářet graf intervalu spolehlivosti.
Interval spolehlivosti jako statistický termín označuje stupeň jistoty v metodě výběru. Úroveň spolehlivosti vám říká, jak si můžete být jisti, vyjádřená v procentech. Například úroveň spolehlivosti 99 % naznačuje, že každý z vašich odhadů pravděpodobnosti bude pravděpodobně přesný v 99 % případů.
Vytvoření grafu intervalu spolehlivosti pomocí Matplotlib
Vytvoření grafu intervalu spolehlivosti v Matplotlib zahrnuje několik kroků. Pojďme se ponořit do vysvětlení odpovídajícího kódu Pythonu, abychom provedli tyto kroky:
Nejprve musíme importovat potřebné knihovny:
import matplotlib.pyplot as plt import numpy as np from scipy.stats import sem, t from scipy import mean
Nyní můžeme pomocí těchto kroků vypočítat interval spolehlivosti.
1. Určete náhodný soubor dat, pro který budeme počítat interval spolehlivosti.
2. Vypočítejte průměr a směrodatnou chybu souboru dat.
3. Určete meze chyby pro interval spolehlivosti.
4. Nakonec vypočítejte rozsah intervalu spolehlivosti.
Zde je kód Pythonu odpovídající těmto krokům.
confidence = 0.95 data = np.random.rand(100) n = len(data) m = mean(data) std_err = sem(data) h = std_err * t.ppf((1 + confidence) / 2, n - 1) start = m - h end = m + h
Proměnná „spolehlivost“ je úroveň spolehlivosti vyjádřená v procentech a „data“ obsahuje náhodný soubor dat. Střední a standardní chyba jsou vypočítány pomocí funkce 'střední' a 'sem' knihovny SciPy. Mezní chyba 'h' je určena vynásobením standardní chyby t-skóre, které získáme z t-distribuce pomocí funkce 'ppf'. Nakonec vypočítáme rozsah intervalu spolehlivosti.
Vykreslení intervalu spolehlivosti v Matplotlib
V této poslední části kódu používáme Matplotlib k vizualizaci intervalu spolehlivosti.
plt.figure(figsize=(9,6)) plt.bar(np.arange(len(data)), data) plt.fill_between(np.arange(len(data)), start, end, color='b', alpha=0.1) plt.title('Confidence Interval') plt.show()
K zobrazení dat používá sloupcový graf a k vyjádření intervalu spolehlivosti metodu 'fill_between'. Funkce 'figura' inicializuje novou figuru a funkce 'show' představuje graf.
Vytvoření grafu intervalu spolehlivosti v Matplotlib je pohodlný způsob, jak vizuálně analyzovat vaše data, zejména data, která zahrnují statistickou analýzu. Tento výkonný nástroj nabízí snadný a intuitivní způsob prezentovat složitá data ve formě, kterou lze snadno interpretovat, což z ní činí základní sadu nástrojů pro každého analytika nebo vědce dat python. Pochopením toho, jak s tím manipulovat a používat, můžeme proces interpretace dat zefektivnit a zpřesnit.