Un workshop hands-on di 3 ore per chi si avvicina all’Exploratory Data Analysis e vuole imparare a leggere i grafici e a guidare l’analisi senza perdersi nella statistica di base.
L’idea di base è: le librerie open source fanno il lavoro pesante di calcolo e visualizzazione; chi analizza dati impara a interpretare i grafici, a sceglierli in base a cosa rappresentano, e a impostare la sequenza dell’analisi. La prima ora e’ una lezione frontale interattiva con tre poll che generano i dati che poi vengono analizzati nelle due ore di notebook. Si vede in pratica come si pulisce del testo libero e come si visualizza una distribuzione, una correlazione, una matrice di missing values. Se resta tempo, una sezione bonus applica gli stessi strumenti a tre dataset reali di scikit-learn: Iris, Wine, Diabetes.
Alla fine del workshop i partecipanti sanno:
Laptop con accesso a Colab
Laptop con Python 3.12 o successivo, e Jupyter (lab o notebook): se usate un IDE, installate Jupyter da lì
pip install --upgrade dabl fg-data-profiling pygwalker smltkFornito al workshop