Encontrando correspondências com base em duas condições
Neste exercício, você vai combinar 2 conjuntos de dados com títulos de filmes correspondentes, mas que também contêm erros de digitação. Na primeira tabela, movie_titles, há dez filmes que você deve associar com a segunda tabela, movie_db. Mas eles vêm de documentos digitalizados e contêm erros gerados pelo software de Reconhecimento Óptico de Caracteres (OCR).
Ambas as tabelas contêm as colunas title e year. Use essas colunas para encontrar correspondências entre elas.
Crie 2 funções auxiliares que verifiquem entradas iguais ou semelhantes. Uma para os títulos dos filmes (com base em stringdist()) e outra para comparar anos, usando abs() (que retorna o delta).
Este exercício faz parte do curso
Expressões Regulares Intermediárias em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate the string distance - it should be smaller than 3
is_string_distance_below_three <- function(left, right) {
___(left, right) < ___
}
is_string_distance_below_three("Hi there", "Hi there")