Learn R Programming

nomesbr (version 0.0.7)

tabular_problemas_em_nomes: Tabula Problemas Detectados nos Nomes

Description

Cria uma tabela resumo contabilizando o número de ocorrências para cada tipo de problema detectado pela função `marcar_problemas_e_limpar_nomes`.

Usage

tabular_problemas_em_nomes(d, s)

tabulate_name_poblems(d, s)

Value

Um `data.table` com as colunas:

  • `condition`: O nome da condição/problema verificado.

  • `N_detected`: Número de vezes que a condição foi detectada.

  • `N_made_NA`: Número de detecções que resultaram na limpeza para `NA`.

  • `N_replaced`: Número de detecções onde o nome foi alterado (não para `NA`).

Arguments

d

O `data.table` retornado por `marcar_problemas_e_limpar_nomes`.

s

O nome da coluna original (string) que foi processada.

Examples

Run this code
DT_limpo <- data.table::data.table(nome = c("JOSEE SILVA", 
"RAIMUNDA DA DA SILVA"), nome_clean = c("JOSE SILVA",
"RAIMUNDA DA SILVA"),
falecido = NA, cartorio = NA, 
espaco_TilAcentoApostrofe = NA, 
nome_P_M_S_N = NA, nada_nao = NA, 
nada_nao_consta2 = NA, final_missing = NA, Xartigo = NA, sr_sra = NA,
ignorado = NA, dededada = 1, letra_repetida = 1)
sumario <- tabular_problemas_em_nomes(DT_limpo, "nome")
print(sumario)

Run the code above in your browser using DataLab