A Tableau Alternative in Python for Data Analysis (in Streamlit & Jupyter) | PyGWalker Tutorial
Summary
TLDRLa vidéo présente une nouvelle bibliothèque Python appelée PyGWalker qui permet de transformer un DataFrame Pandas en une interface utilisateur de style Tableau pour une analyse visuelle. L'installation est simple via pip et l'intégration à Jupyter Notebook ou Streamlit est facile. PyGWalker offre des outils pour explorer les données, créer des visualisations en faisant glisser des champs, ajuster les tailles et les types de graphiques, et appliquer des filtres. Les utilisateurs peuvent également exporter leurs visualisations et leur code, facilitant le partage et la réutilisation de l'analyse.
Takeaways
- 📦 Installer PyGWalker en utilisant la commande 'pip install pygwalker'.
- 📈 Intégrer PyGWalker dans un notebook Jupyter ou une application Streamlit.
- 🔄 Utiliser la fonction 'pyg.walk' pour transformer un dataframe Pandas en interface utilisateur de style Tableau.
- 🎨 Choisir entre les thèmes clair ou sombre pour l'interface.
- 📊 Analyser les données en drag-and-dropping les champs sur les axes x et y.
- 🖼️ Personnaliser les graphiques en changeant de type de charte et en ajustant la taille.
- 🔄 Ajouter des champs supplémentaires pour une analyse plus approfondie.
- 🔒 Appliquer des filtres pour une vision plus ciblée des données.
- 📄 Exporter les graphiques au format scalable vector graphic (SVG).
- 📋 Exporter le code et les configurations pour une utilisation future.
- 🔄 Réutiliser les configurations à travers un fichier 'config.json'.
- 🌐 Intégrer le tableau de bord PyGWalker dans une application Streamlit.
Q & A
Qu'est-ce que PyGWalker et comment l'installer ?
-PyGWalker est une nouvelle bibliothèque Python qui permet de transformer un dataframe Pandas en une interface utilisateur de style Tableau pour l'analyse visuelle. Pour l'installer, il suffit d'exécuter la commande 'pip install pygwalker' dans l'invite de commande ou le terminal.
Comment importer PyGWalker et Pandas dans un notebook Jupyter ou une application Streamlit ?
-Après l'installation, on peut importer PyGWalker ainsi que Pandas en utilisant l'instruction 'import pygwalker' et 'import pandas' respectivement dans le notebook Jupyter ou l'application Streamlit.
Quel est le jeu de données utilisé dans la démonstration ?
-Dans la démonstration, le jeu de données 'tips' est utilisé, qui contient des informations sur le montant total de la facture, les pourboires, le genre, si le client fumait ou non, le jour et l'heure de la visite, ainsi que la taille de la partie.
Comment utiliser PyGWalker pour explorer un dataframe ?
-Pour explorer un dataframe avec PyGWalker, il suffit d'appeler la fonction 'pyg.walk' en passant le dataframe en paramètre. Il est également possible de spécifier si l'on souhaite utiliser un mode sombre ou clair.
Quelles sont les fonctionnalités disponibles dans l'onglet 'Données' de PyGWalker ?
-Dans l'onglet 'Données', on peut inspecter le dataframe et vérifier certaines entrées. PyGWalker étiquete automatiquement les valeurs numériques comme mesures et les autres comme dimensions.
Comment PyGWalker choisit-il les axes x et y pour la visualisation des données ?
-PyGWalker permet de faire glisser et déposer les champs disponibles sur les axes x et y pour créer des visualisations. Par défaut, il choisit un type de graphique pour vous, mais il est possible d'utiliser d'autres types de graphiques comme les graphiques en lignes.
Comment ajouter des champs supplémentaires à un graphique dans PyGWalker ?
-Pour ajouter des champs supplémentaires à un graphique, il suffit de faire glisser les champs souhaités dans les axes y ou x. Par exemple, on peut ajouter les pourboires à l'axe y et regarder la moyenne du montant de la facture.
Comment filtrer les données dans PyGWalker ?
-Pour filtrer les données, on peut faire glisser la colonne correspondante dans le champ de filtre. Par exemple, on peut filtrer les résultats pour n'afficher que les clients masculins en faisant glisser la colonne 'genre' et en sélectionnant 'male'.
Comment exporter les graphiques créés avec PyGWalker ?
-On peut exporter les graphiques créés avec PyGWalker en utilisant la fonctionnalité d'exportation. Par exemple, on peut exporter le graphique sous forme de fichier vectoriel scalable en choisissant l'option appropriée et en cliquant sur 'Copier dans le presse-papiers' pour l'utiliser ailleurs.
Comment PyGWalker facilite-t-il l'analyse exploratoire des données ?
-PyGWalker permet une analyse exploratoire des données de manière très intuitive en permettant de faire glisser et déposer les champs sur les axes x et y, d'ajouter des champs supplémentaires, de filtrer les données et de changer de type de graphique en fonction de l'analyse souhaitée.
Comment exporter et réutiliser le code PyGWalker pour créer un tableaudashboard ?
-On peut exporter le code PyGWalker en utilisant l'option 'Exporter en tant que' et en choisissant 'code'. En copiant le code dans un nouveau cellule et en exécutant 'pyg.walk' avec les spécifications, on obtiendra le même tableau de bord. Alternativement, on peut exporter les paramètres en tant que fichier 'config.json' pour une utilisation ultérieure.
Comment intégrer le tableaudashboard PyGWalker dans une application Streamlit ?
-Pour intégrer le tableaudashboard PyGWalker dans une application Streamlit, il faut d'abord charger le jeu de données et configurer la page. Ensuite, on peut lire le contenu du fichier de configuration et utiliser 'pyg.walk' à nouveau en spécifiant 'Streamlit' dans l'environnement. Avec cette intégration, on peut utiliser le canvas PyGWalker directement dans l'application Streamlit.
Outlines
🚀 Présentation de la bibliothèque PyGWalker
Dans ce paragraphe, l'orateur présente une nouvelle bibliothèque Python appelée PyGWalker, qui permet de transformer un DataFrame de Pandas en une interface utilisateur de style Tableau pour l'analyse visuelle. Il explique que cette bibliothèque peut être intégrée dans un carnet Jupyter ou une application Streamlit. L'orateur commence par expliquer comment installer PyGWalker en utilisant la commande 'pip install pygwalker' dans l'invite de commande ou le terminal. Ensuite, il montre comment importer la bibliothèque avec pandas et charger l'exemple de jeu de données 'tips'. Il décrit les informations contenues dans ce jeu de données et comment les explorer en utilisant PyGWalker. L'orateur montre comment utiliser la fonction 'pyg.walk' pour générer un canvas avec deux onglets, l'onglet 'Données' pour inspecter le DataFrame et l'onglet 'Visualisation' pour créer des graphiques en faisant glisser les champs dans les axes x et y. Il mentionne également la possibilité de choisir entre un mode sombre et un mode clair pour l'interface.
📊 Création et personnalisation de graphiques avec PyGWalker
Dans ce paragraphe, l'orateur se concentre sur la création et la personnalisation de graphiques à l'aide de PyGWalker. Il montre comment tracer des graphiques en choisissant les types de chartes préférés, par exemple, les histogrammes ou les graphiques en lignes. L'orateur explique comment redimensionner les graphiques en mode disposition fixe et comment faire glisser des champs supplémentaires dans les axes pour explorer les données de manière intuitive. Il démontre comment ajouter des données moyennes au graphique et comment enlever des champs en les faisant glisser à nouveau dans la liste des champs. L'orateur insiste sur la facilité d'utilisation de PyGWalker pour l'analyse exploratoire des données et sur la possibilité d'exporter les graphiques sous forme de fichiers vectoriels scalables.
🔍 Application de PyGWalker dans un notebook Jupyter et une application Streamlit
Dans ce paragraphe, l'orateur explique comment utiliser PyGWalker dans un notebook Jupyter et une application Streamlit. Il montre comment exporter le code généré par PyGWalker en utilisant les options 'Exporter en tant que' et 'Copier dans le presse-papiers'. L'orateur crée un exemple d'application Streamlit en utilisant le jeu de données 'tips' et en intégrant le code exporté de PyGWalker. Il montre comment spécifier l'environnement Streamlit lors de l'appel à la fonction 'pyg.walk' et comment utiliser le mode sombre. L'orateur mentionne que l'utilisateur peut jouer avec les données directement dans l'application Streamlit. Enfin, il annonce qu'il téléchargera l'application Streamlit et le notebook Jupyter sur son dépôt GitHub et fournira le lien dans la boîte de description de la vidéo.
Mindmap
Keywords
💡PyGWalker
💡Pandas dataframe
💡Jupyter Notebook
💡Streamlit app
💡Data exploration
💡Visual analysis
💡Charts
💡Filtering
💡Exporting
💡Config file
Highlights
A new Python library called PyGWalker has been introduced, offering a Tableau-style User Interface for Pandas dataframes.
PyGWalker allows for visual data analysis and can be integrated into Jupyter Notebook or Streamlit applications.
To install PyGWalker, simply run 'pip install pygwalker' in the command prompt or terminal.
After installation, PyGWalker is imported alongside pandas for use in data analysis.
The 'tips' dataset is used as a demonstration to showcase the capabilities of PyGWalker.
PyGWalker automatically differentiates between numeric values as measures and other data as dimensions.
Users can interactively explore data by dragging and dropping fields into the x and y axes for visualization.
The library allows for resizing of graphs and the selection of different chart types, such as bar charts and line charts.
Additional fields can be dragged into the chart for a more in-depth data exploration.
Filters can be applied by dragging specific columns into the filter field, allowing for a more targeted analysis.
PyGWalker supports the export of charts in scalable vector graphic format for further use.
The library enables the addition of multiple charts in a Jupyter Notebook for comprehensive data analysis.
PyGWalker's functionality can be exported as code, allowing users to recreate their dashboards.
A 'config.json' file can be exported for saving settings and reusing them in different environments.
PyGWalker can be implemented into a Streamlit app for interactive data analysis within the app interface.
The Streamlit app can utilize the config file to maintain previous settings for consistent user experience.
The presenter plans to share the Streamlit app and Jupyter Notebook on GitHub for further exploration by viewers.
Transcripts
Hey guys, There's a new Python library called PyGWalker,
which lets you turn your Pandas dataframe into a Tableau-style User Interface for visual
analysis.
You can integrate it into your Jupyter Notebook or Streamlit app.
Let me show you how to use it.
First things first, you need to install it.
Just run "pip install pygwalker" in your command prompt or terminal, and you're all set.
Once that's done, you can import it together with pandas.
Next, for demo purposes, let's load the 'tips' dataset, which looks like this.
Here, we can see the total bill amount, along with the tips, gender, whether the customer
was a smoker or not, the day and time of the visit, and the size.
Alright, now let's assume you want to explore this dataset.
Instead of plotting it in different ways, you can simply call "pyg.walk" and pass in
your dataframe.
You could also specify if you want to use a dark or light mode.
After executing this line, you'll get this canvas with two tabs.
Let me first switch to the data tab.
Here, you can inspect your dataframe and check out some entries if you'd like.
You'll also notice that PyGWalker automatically labels the numeric values as measures and
the rest as dimensions.
Now, let's switch back to the visualization tab.
Like in Tableau, you can now drag and drop the available fields into the x and y axes.
So, for example, let me plot the total bill amount by day.
To resize the graph, you can click here and choose the fixed layout mode.
Now you can resize the chart.
By default, PyGWalker picks a chart type for you.
However, you can use other chart types, like a line chart.
But for our analysis, I'll switch back to the bar chart.
The cool thing is, you can drag additional fields into your chart to explore your data
in a very intuitive way.
So, for example, I'll add the tips to the y-axis.
And instead of the total sum, I might want to look at the average bill amount.
If you want to remove a field, you can simply drag it back to the field list.
Likewise, you can add multiple fields to the x-axis.
Let's say, I'm interested to see if smokers spend more money, and I want to see it for
each day.
Additionally, I also want the information if it was during dinner or lunchtime.
To do that, you can use the colour field.
And I'm only interested in this result for male customers.
So you can apply a filter by dragging the column into the filter field.
Now, I'll select only 'male' and confirm my selection.
The values will then be filtered accordingly.
And to remove it, you can either select all again or simply drag it out of the filter
field.
I think it's a very interesting tool for quick exploratory data analysis.
However, you can also export the charts.
So, for example, I'll export it to a scalable vector graphic, and this is what it looks
like.
Alright, now back in my Jupyter Notebook, you can add additional charts by clicking
up here.
And now you have a second canvas, where you can again explore your data.
There are actually a couple more options in PyGWalker, but I would encourage you to play
around with it yourself.
But one important feature is to export your code.
So, if you click the "Export As" button, you'll have different options.
First, let me export it as "code".
Next, I'll hit the 'Copy to Clipboard' button.
Now, if I paste it into a new cell, you'll see the spec of my dashboard.
If I run "pyg.walk" and specify my specs, we'll get back the same dashboard.
Alternatively, you could also export your settings as a file.
If you do so, you'll get a "config.json".
Let me grab this config file from my downloads folder and paste it into my current directory.
Now, if you want, you can also implement the PyGWalker dashboard into your Streamlit app.
To demonstrate this, I've created the following app.
After importing Streamlit, I'll set some basic page configurations.
Next, I'll load our 'tips' dataset and set up a title and subheader.
The interesting part is here.
We can now read the content from the config file and use "pyg.walk" again in our Streamlit
app, together with the previous settings.
All you need to do is specify "Streamlit" in the environment.
This time, I'll also switch it to the dark mode.
Ok, and with that in place, let's spin up my app by running "streamlit run app.py".
Once my page is loaded, we'll have the PyGWalker canvas in our Streamlit app.
And as before, you can now play around with your data directly in Streamlit.
Ok, guys, and that's all I have for you today.
I will upload this Streamlit app and also the Jupyter Notebook to my GitHub repo.
You will find the link in the description box of this video.
As always, thanks for watching, and I'll see you in the next video!
5.0 / 5 (0 votes)
How to Make Money With Excel in 2024 (For Beginners)
FACEBOOK ADS 2024 - Comment Créer Des Publicités Facebook De Débutant à Expert (avec ChatGPT)
Comment Tester Un Produit Sur Facebook Ads En 2024 (Dropshipping)
Comment Avoir un Visage Attirant ? [Guide Homme]
Minecraft but I Open a School!
How to make $100,000+ with Excel Skills (6 strategies)