Pandas

bibliothèque logicielle Python

Pandas est une bibliothèque écrite pour le langage de programmation Python permettant la manipulation et l'analyse de données. Elle propose en particulier des structures de données et des opérations de manipulation de tableaux numériques et de séries temporelles.

Pandas
Description de l'image Pandas logo.svg.
Description de l'image Dataframe manipulation.png.
Informations
CréateurWes McKinneyVoir et modifier les données sur Wikidata
Développé parWes McKinney, J. Brock Mendel (d), Joris Van den Bossche (d) et Jeff Reback (d)Voir et modifier les données sur Wikidata
Dernière version 2.2.2 ()[1]Voir et modifier les données sur Wikidata
Dépôtgithub.com/pandas-dev/pandasVoir et modifier les données sur Wikidata
Assurance qualitéIntégration continueVoir et modifier les données sur Wikidata
Écrit en PythonVoir et modifier les données sur Wikidata
Système d'exploitationMultiplateformeVoir et modifier les données sur Wikidata
Type Bibliothèque logicielle Python (d)
Numerical software (d)Voir et modifier les données sur Wikidata
LicenceLicence BSDVoir et modifier les données sur Wikidata
Documentationpandas.pydata.org/docs/user_guide/index.html#user-guideVoir et modifier les données sur Wikidata
Site webpandas.pydata.orgVoir et modifier les données sur Wikidata

Pandas est un logiciel libre sous licence BSD[2]. Son nom est dérivé du terme Panel Data (en français "données de panel", un terme d'économétrie pour les jeux de données qui comprennent des observations sur plusieurs périodes de temps pour les mêmes individus). Son nom est également un jeu de mots sur l'expression "Python Data Analysis".

Entre 2007 à 2010, Wes McKinney a commencé à construire ce qui allait devenir Pandas alors qu'il était chercheur dans la société américaine AQR Capital.

Structures de données

Les principales structures de données gérées par cette bibliothèque sont :

  • Séries : stockage des données selon une dimension - grandeur en fonction d'un index
  • DataFrames : stockage des données selon 2 dimensions - lignes et colonnes
  • Panels : représentation des données selon 3 dimensions
  • Panels4D ou DataFrames avec des index hiérarchiques aussi nommés MultiIndex : représentation des données selon plus de 3 dimensions - hypercube.

Fonctionnalités de la bibliothèque

Les principales fonctionnalités de la bibliothèque sont :

Les voies critiques de la bibliothèque sont écrits en Cython ou C[3].

Exemples

Courbes

import pandas as pdimport matplotlib.pyplot as pltimport numpy as npdf = pd.DataFrame(np.random.randn(100, 5), columns=list('ABCDE'))df=df.cumsum() # Return cumulative sum over a DataFrame or Series axisdf.plot()plt.show()

Diagramme à barres

df = pd.DataFrame(np.random.rand(10, 5), columns=list('ABCDE'))df.plot.bar(stacked=True)plt.show()

Box plot

df = pd.DataFrame(np.random.rand(7, 5), columns=list('ABCDE'))df.plot.box()plt.show()

Histogramme

data = pd.Series(np.random.normal(size=100))data.hist(grid=False)plt.show()

Voir également

Références

Liens externes

🔥 Top keywords: Wikipédia:Accueil principalListe de sondages sur les élections législatives françaises de 2024Spécial:RechercheJordan BardellaChampionnat d'Europe de football 2024N'Golo KantéJodie DevosKylian MbappéÉlections législatives françaises de 2024Marcus ThuramLe Jardin des Finzi-Contini (film)Maria Schneider (actrice)Cookie (informatique)Championnat d'Europe de footballNouveau Front populaireKevin DansoAntoine GriezmannÉric CiottiChampionnat d'Europe de football 2020Dominique SandaMike MaignanWilliam SalibaLionel JospinÉlections législatives de 2024 dans l'EssonneFront populaire (France)Françoise HardyÉlections législatives de 2024 à ParisRassemblement nationalJean-Luc MélenchonFichier:Cleopatra poster.jpgOlivier GiroudSébastien ChenuDidier DeschampsLa Chronique des BridgertonÉlections législatives de 2024 dans les YvelinesLilian ThuramListe de partis politiques en FranceAnne SinclairGabriel Attal