📢 Nuovo Corso Bootstrap Completo disponibile!

Serie in Pandas

In Pandas, una Serie è una struttura dati fondamentale utilizzata per dati unidimensionali con etichette. Essenzialmente, è un oggetto simile a un array unidimensionale che può contenere dati di qualsiasi tipo, come interi, numeri floating-point, stringhe o oggetti Python più complessi.

Ecco alcune caratteristiche chiave e concetti correlati alle Serie in Pandas:

Indicizzazione

Ogni elemento in una Serie è associato a un indice, che può essere sia l’indice intero predefinito (0, 1, 2, …) sia un indice personalizzato che è possibile specificare. L’indice consente di accedere e identificare gli elementi all’interno della Serie. Ad esempio, è possibile accedere a un elemento tramite il suo indice o utilizzare un indice personalizzato per identificare i dati.

Creazione di Serie

Per creare una Serie in Pandas, è possibile utilizzare la funzione pd.Series(). È possibile passare una lista di dati come argomento per creare una Serie. Ecco un esempio:

import pandas as pd
data = [10, 20, 30, 40, 50]
serie = pd.Series(data)
print(serie)

In questo esempio, abbiamo creato una Serie serie contenente una lista di dati.

Serie con Coppie Chiave-Valore

Le Serie in Pandas possono essere utilizzate per rappresentare dati con coppie chiave-valore. In questo caso, l’indice della Serie diventa la chiave e il valore associato diventa il valore della coppia. Ecco un esempio:

import pandas as pd
data = {'Alice': 25, 'Bob': 30, 'Charlie': 35, 'David': 40}
serie = pd.Series(data)
print(serie)

In questo esempio, abbiamo creato una Serie serie con coppie chiave-valore, dove le chiavi sono i nomi e i valori sono le età.

Etichette degli Assi

Le Serie possono avere etichette sugli assi, che consentono di fornire un nome descrittivo sia per i dati sia per l’indice. Le etichette possono essere utili per una migliore comprensione dei dati e per il riferimento durante le operazioni di manipolazione dei dati.

data = {'Alice': 25, 'Bob': 30, 'Charlie': 35, 'David': 40}
serie = pd.Series(data, name='Età')
print(serie)

In questo esempio, abbiamo assegnato un’etichetta personalizzata alla Serie.

Operazioni su Serie

Le Serie supportano una varietà di operazioni, tra cui l’accesso agli elementi, la selezione tramite maschere booleane, operazioni matematiche e altro ancora. È possibile eseguire operazioni su Serie in modo simile a come si farebbe con un array NumPy.

serie = pd.Series({'Alice': 25, 'Bob': 30, 'Charlie': 35, 'David': 40})
print(serie['Bob']) # Accesso all'elemento con chiave 'Bob'
print(serie[serie > 30]) # Selezione con maschera booleana
print(serie * 2) # Moltiplicazione di tutte le età per 2

Utilizzo di Serie

Le Serie sono ampiamente utilizzate in Pandas per rappresentare colonne di dati in un DataFrame, una struttura dati bidimensionale di Pandas. I DataFrame sono essenziali per l’analisi e la manipolazione dei dati tabulari, e le Serie fungono spesso da colonne in un DataFrame.

Le Serie con coppie chiave-valore sono particolarmente utili quando si desidera associare un valore a una chiave specifica, ad esempio, quando si gestiscono dati strutturati o informazioni di tipo dizionario.

Le Serie sono un elemento fondamentale in Pandas e svolgono un ruolo chiave nell’analisi e nella manipolazione dei dati. Consentono di gestire dati unidimensionali in modo efficiente e offrono molte funzionalità per l’elaborazione e l’analisi dei dati.