Histogrammes #

Comment tracer des histogrammes avec Matplotlib.

import matplotlib.pyplot as plt
import numpy as np
from matplotlib import colors
from matplotlib.ticker import PercentFormatter

# Create a random number generator with a fixed seed for reproducibility
rng = np.random.default_rng(19680801)

Générer des données et tracer un histogramme simple #

Pour générer un histogramme 1D, nous n'avons besoin que d'un seul vecteur de nombres. Pour un histogramme 2D, nous aurons besoin d'un deuxième vecteur. Nous allons générer les deux ci-dessous et afficher l'histogramme pour chaque vecteur.

N_points = 100000
n_bins = 20

# Generate two normal distributions
dist1 = rng.standard_normal(N_points)
dist2 = 0.4 * rng.standard_normal(N_points) + 5

fig, axs = plt.subplots(1, 2, sharey=True, tight_layout=True)

# We can set the number of bins with the *bins* keyword argument.
axs[0].hist(dist1, bins=n_bins)
axs[1].hist(dist2, bins=n_bins)
hist
(array([2.0000e+00, 2.1000e+01, 5.1000e+01, 2.3500e+02, 7.8100e+02,
       2.1000e+03, 4.5730e+03, 8.3390e+03, 1.2758e+04, 1.6363e+04,
       1.7345e+04, 1.4923e+04, 1.0920e+04, 6.4830e+03, 3.1070e+03,
       1.3810e+03, 4.5300e+02, 1.2200e+02, 3.6000e+01, 7.0000e+00]), array([3.20889223, 3.38336526, 3.55783829, 3.73231132, 3.90678435,
       4.08125738, 4.25573041, 4.43020344, 4.60467647, 4.7791495 ,
       4.95362253, 5.12809556, 5.30256859, 5.47704162, 5.65151465,
       5.82598768, 6.00046071, 6.17493374, 6.34940677, 6.5238798 ,
       6.69835283]), <BarContainer object of 20 artists>)

Mise à jour des couleurs de l'histogramme #

La méthode histogram renvoie (entre autres) un patchesobjet. Cela nous donne accès aux propriétés des objets dessinés. En utilisant cela, nous pouvons modifier l'histogramme à notre guise. Modifions la couleur de chaque barre en fonction de sa valeur y.

fig, axs = plt.subplots(1, 2, tight_layout=True)

# N is the count in each bin, bins is the lower-limit of the bin
N, bins, patches = axs[0].hist(dist1, bins=n_bins)

# We'll color code by height, but you could use any scalar
fracs = N / N.max()

# we need to normalize the data to 0..1 for the full range of the colormap
norm = colors.Normalize(fracs.min(), fracs.max())

# Now, we'll loop through our objects and set the color of each accordingly
for thisfrac, thispatch in zip(fracs, patches):
    color = plt.cm.viridis(norm(thisfrac))
    thispatch.set_facecolor(color)

# We can also normalize our inputs by the total number of counts
axs[1].hist(dist1, bins=n_bins, density=True)

# Now we format the y-axis to display percentage
axs[1].yaxis.set_major_formatter(PercentFormatter(xmax=1))
hist

Tracer un histogramme 2D #

Pour tracer un histogramme 2D, il suffit de deux vecteurs de même longueur, correspondant à chaque axe de l'histogramme.

fig, ax = plt.subplots(tight_layout=True)
hist = ax.hist2d(dist1, dist2)
hist

Personnaliser votre histogramme #

La personnalisation d'un histogramme 2D est similaire au cas 1D, vous pouvez contrôler les composants visuels tels que la taille du bac ou la normalisation des couleurs.

fig, axs = plt.subplots(3, 1, figsize=(5, 15), sharex=True, sharey=True,
                        tight_layout=True)

# We can increase the number of bins on each axis
axs[0].hist2d(dist1, dist2, bins=40)

# As well as define normalization of the colors
axs[1].hist2d(dist1, dist2, bins=40, norm=colors.LogNorm())

# We can also define custom numbers of bins for each axis
axs[2].hist2d(dist1, dist2, bins=(80, 10), norm=colors.LogNorm())

plt.show()
hist

Références

L'utilisation des fonctions, méthodes, classes et modules suivants est illustrée dans cet exemple :

Durée totale d'exécution du script : (0 minutes 2,108 secondes)

Galerie générée par Sphinx-Gallery