Vyřešeno: graf intervalu spolehlivosti matplotlib

Matplotlib je výkonná knihovna pro vykreslování používaná v programovacím jazyce Python. Poskytuje objektově orientované API pro vkládání grafů do aplikací, které používají obecné sady nástrojů GUI, jako je Tkinter, wxPython nebo Qt. Jedním z důležitých nástrojů poskytovaných Matplotlibem je schopnost vytvářet graf intervalu spolehlivosti.

Interval spolehlivosti jako statistický termín označuje stupeň jistoty v metodě výběru. Úroveň spolehlivosti vám říká, jak si můžete být jisti, vyjádřená v procentech. Například úroveň spolehlivosti 99 % naznačuje, že každý z vašich odhadů pravděpodobnosti bude pravděpodobně přesný v 99 % případů.

Vytvoření grafu intervalu spolehlivosti pomocí Matplotlib

Vytvoření grafu intervalu spolehlivosti v Matplotlib zahrnuje několik kroků. Pojďme se ponořit do vysvětlení odpovídajícího kódu Pythonu, abychom provedli tyto kroky:

Nejprve musíme importovat potřebné knihovny:

import matplotlib.pyplot as plt
import numpy as np
from scipy.stats import sem, t
from scipy import mean

Nyní můžeme pomocí těchto kroků vypočítat interval spolehlivosti.

1. Určete náhodný soubor dat, pro který budeme počítat interval spolehlivosti.
2. Vypočítejte průměr a směrodatnou chybu souboru dat.
3. Určete meze chyby pro interval spolehlivosti.
4. Nakonec vypočítejte rozsah intervalu spolehlivosti.

Zde je kód Pythonu odpovídající těmto krokům.

confidence = 0.95
data = np.random.rand(100)
n = len(data)
m = mean(data)
std_err = sem(data)
h = std_err * t.ppf((1 + confidence) / 2, n - 1)

start = m - h
end = m + h

Proměnná „spolehlivost“ je úroveň spolehlivosti vyjádřená v procentech a „data“ obsahuje náhodný soubor dat. Střední a standardní chyba jsou vypočítány pomocí funkce 'střední' a 'sem' knihovny SciPy. Mezní chyba 'h' je určena vynásobením standardní chyby t-skóre, které získáme z t-distribuce pomocí funkce 'ppf'. Nakonec vypočítáme rozsah intervalu spolehlivosti.

Vykreslení intervalu spolehlivosti v Matplotlib

V této poslední části kódu používáme Matplotlib k vizualizaci intervalu spolehlivosti.

plt.figure(figsize=(9,6))
plt.bar(np.arange(len(data)), data)
plt.fill_between(np.arange(len(data)), start, end, color='b', alpha=0.1)
plt.title('Confidence Interval')
plt.show()

K zobrazení dat používá sloupcový graf a k vyjádření intervalu spolehlivosti metodu 'fill_between'. Funkce 'figura' inicializuje novou figuru a funkce 'show' představuje graf.

Vytvoření grafu intervalu spolehlivosti v Matplotlib je pohodlný způsob, jak vizuálně analyzovat vaše data, zejména data, která zahrnují statistickou analýzu. Tento výkonný nástroj nabízí snadný a intuitivní způsob prezentovat složitá data ve formě, kterou lze snadno interpretovat, což z ní činí základní sadu nástrojů pro každého analytika nebo vědce dat python. Pochopením toho, jak s tím manipulovat a používat, můžeme proces interpretace dat zefektivnit a zpřesnit.

Související příspěvky:

Zanechat komentář