Mantienilo descrittivo
Per comprendere meglio le esperienze dei viaggiatori all'aeroporto di San Francisco, il reparto qualità ha inviato un questionario qualitativo a tutti i viaggiatori che hanno dato all'aeroporto il punteggio peggiore in tutte le categorie possibili. L'obiettivo di questo questionario è identificare schemi ricorrenti in ciò che i viaggiatori dicono sull'aeroporto.
Le loro risposte sono memorizzate nella colonna survey_response. A un'analisi più attenta, ti sei accorto che alcune risposte riportavano il numero minimo di caratteri possibile, senza molto contenuto. In questo esercizio, isolerai le risposte con un conteggio di caratteri superiore a 40 e ti assicurerai che il tuo nuovo DataFrame contenga risposte con 40 caratteri o più usando un'istruzione assert.
Il DataFrame airlines è già nel tuo ambiente e pandas è importato come pd.
Questo esercizio fa parte del corso
Pulizia dei dati in Python
Istruzioni dell'esercizio
- Usando il DataFrame
airlines, salva la lunghezza di ogni elemento nella colonnasurvey_responseinresp_lengthutilizzando.str.len(). - Isola le righe di
airlinesconresp_lengthmaggiore di40. - Verifica con un'asserzione che la minima lunghezza di
survey_responseinairlines_surveysia ora maggiore di40.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Store length of each row in survey_response column
resp_length = ____
# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]
# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____
# Print new survey_response column
print(airlines_survey['survey_response'])