1. Learn
  2. /
  3. Kurser
  4. /
  5. Datarensning i Python

Connected

övning

Filtrera på svarslängd

För att bättre förstå resenärernas upplevelser på San Francisco Airport skickade kvalitetssäkringsavdelningen ut ett kvalitativt frågeformulär till alla resenärer som gett flygplatsen lägsta möjliga betyg i samtliga kategorier. Syftet är att identifiera gemensamma mönster i vad resenärerna säger om flygplatsen.

Deras svar finns lagrade i kolumnen survey_response. Vid en närmare granskning märker du att en del svar är så korta att de knappt innehåller något av värde. I den här övningen ska du isolera svaren med fler än 40 tecken och sedan verifiera med en assert-sats att din nya DataFrame bara innehåller svar med 40 tecken eller mer.

DataFramen airlines finns i din miljö och pandas är importerat som pd.

Instruktioner

100 XP
  • Använd DataFramen airlines och beräkna längden på varje svar i kolumnen survey_response med .str.len(). Spara resultatet i resp_length.
  • Filtrera raderna i airlines där resp_length är högre än 40.
  • Kontrollera med en assert-sats att det kortaste svaret i airlines_survey nu är längre än 40 tecken.