Extraindo números de strings
O campo length_of_time no conjunto de dados de UFO é um campo de texto que traz o número de minutos dentro da string. Aqui, você vai extrair esse número desse campo de texto usando expressões regulares.
Este exercício faz parte do curso
Pré-processamento para Machine Learning em Python
Instruções do exercício
- Busque números em
time_stringusando um padrão de RegEx apropriado. - Use o método
.apply()para chamarreturn_minutes()em cada linha da colunalength_of_time. - Imprima o
.head()das colunaslength_of_timeeminutespara comparar.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def return_minutes(time_string):
# Search for numbers in time_string
num = re.____(____, ____)
if num is not None:
return int(num.group(0))
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____
# Take a look at the head of both of the columns
print(ufo[[____]].head())