ComeçarComece de graça

Encontrando correspondências com base em duas condições

Neste exercício, você vai combinar 2 conjuntos de dados com títulos de filmes correspondentes, mas que também contêm erros de digitação. Na primeira tabela, movie_titles, há dez filmes que você deve associar com a segunda tabela, movie_db. Mas eles vêm de documentos digitalizados e contêm erros gerados pelo software de Reconhecimento Óptico de Caracteres (OCR).

Ambas as tabelas contêm as colunas title e year. Use essas colunas para encontrar correspondências entre elas.

Crie 2 funções auxiliares que verifiquem entradas iguais ou semelhantes. Uma para os títulos dos filmes (com base em stringdist()) e outra para comparar anos, usando abs() (que retorna o delta).

Este exercício faz parte do curso

Expressões Regulares Intermediárias em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Calculate the string distance - it should be smaller than 3
is_string_distance_below_three <- function(left, right) {
  ___(left, right) < ___
}

is_string_distance_below_three("Hi there", "Hi there")
Editar e executar o código