Serie in Pandas
In Pandas, una Serie è una struttura dati fondamentale utilizzata per dati unidimensionali con etichette. Essenzialmente, è un oggetto simile a un array unidimensionale che può contenere dati di qualsiasi tipo, come interi, numeri floating-point, stringhe o oggetti Python più complessi.
Ecco alcune caratteristiche chiave e concetti correlati alle Serie in Pandas:
Indicizzazione
Ogni elemento in una Serie è associato a un indice, che può essere sia l’indice intero predefinito (0, 1, 2, …) sia un indice personalizzato che è possibile specificare. L’indice consente di accedere e identificare gli elementi all’interno della Serie. Ad esempio, è possibile accedere a un elemento tramite il suo indice o utilizzare un indice personalizzato per identificare i dati.
Creazione di Serie
Per creare una Serie in Pandas, è possibile utilizzare la funzione pd.Series()
. È possibile passare una lista di dati come argomento per creare una Serie. Ecco un esempio:
import pandas as pd
data = [10, 20, 30, 40, 50]
serie = pd.Series(data)
print(serie)
In questo esempio, abbiamo creato una Serie serie
contenente una lista di dati.
Serie con Coppie Chiave-Valore
Le Serie in Pandas possono essere utilizzate per rappresentare dati con coppie chiave-valore. In questo caso, l’indice della Serie diventa la chiave e il valore associato diventa il valore della coppia. Ecco un esempio:
import pandas as pd
data = {'Alice': 25, 'Bob': 30, 'Charlie': 35, 'David': 40}
serie = pd.Series(data)
print(serie)
In questo esempio, abbiamo creato una Serie serie
con coppie chiave-valore, dove le chiavi sono i nomi e i valori sono le età .
Etichette degli Assi
Le Serie possono avere etichette sugli assi, che consentono di fornire un nome descrittivo sia per i dati sia per l’indice. Le etichette possono essere utili per una migliore comprensione dei dati e per il riferimento durante le operazioni di manipolazione dei dati.
data = {'Alice': 25, 'Bob': 30, 'Charlie': 35, 'David': 40}
serie = pd.Series(data, name='Età ')
print(serie)
In questo esempio, abbiamo assegnato un’etichetta personalizzata alla Serie.
Operazioni su Serie
Le Serie supportano una varietà di operazioni, tra cui l’accesso agli elementi, la selezione tramite maschere booleane, operazioni matematiche e altro ancora. È possibile eseguire operazioni su Serie in modo simile a come si farebbe con un array NumPy.
serie = pd.Series({'Alice': 25, 'Bob': 30, 'Charlie': 35, 'David': 40})
print(serie['Bob']) # Accesso all'elemento con chiave 'Bob'
print(serie[serie > 30]) # Selezione con maschera booleana
print(serie * 2) # Moltiplicazione di tutte le età per 2
Utilizzo di Serie
Le Serie sono ampiamente utilizzate in Pandas per rappresentare colonne di dati in un DataFrame, una struttura dati bidimensionale di Pandas. I DataFrame sono essenziali per l’analisi e la manipolazione dei dati tabulari, e le Serie fungono spesso da colonne in un DataFrame.
Le Serie con coppie chiave-valore sono particolarmente utili quando si desidera associare un valore a una chiave specifica, ad esempio, quando si gestiscono dati strutturati o informazioni di tipo dizionario.
Le Serie sono un elemento fondamentale in Pandas e svolgono un ruolo chiave nell’analisi e nella manipolazione dei dati. Consentono di gestire dati unidimensionali in modo efficiente e offrono molte funzionalità per l’elaborazione e l’analisi dei dati.