IniziaInizia gratis

Mantienilo descrittivo

Per comprendere meglio le esperienze dei viaggiatori all'aeroporto di San Francisco, il reparto qualità ha inviato un questionario qualitativo a tutti i viaggiatori che hanno dato all'aeroporto il punteggio peggiore in tutte le categorie possibili. L'obiettivo di questo questionario è identificare schemi ricorrenti in ciò che i viaggiatori dicono sull'aeroporto.

Le loro risposte sono memorizzate nella colonna survey_response. A un'analisi più attenta, ti sei accorto che alcune risposte riportavano il numero minimo di caratteri possibile, senza molto contenuto. In questo esercizio, isolerai le risposte con un conteggio di caratteri superiore a 40 e ti assicurerai che il tuo nuovo DataFrame contenga risposte con 40 caratteri o più usando un'istruzione assert.

Il DataFrame airlines è già nel tuo ambiente e pandas è importato come pd.

Questo esercizio fa parte del corso

Pulizia dei dati in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Usando il DataFrame airlines, salva la lunghezza di ogni elemento nella colonna survey_response in resp_length utilizzando .str.len().
  • Isola le righe di airlines con resp_length maggiore di 40.
  • Verifica con un'asserzione che la minima lunghezza di survey_response in airlines_survey sia ora maggiore di 40.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Store length of each row in survey_response column
resp_length = ____

# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]

# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____

# Print new survey_response column
print(airlines_survey['survey_response'])
Modifica ed esegui il codice