Learn R Programming

nomesbr

nomesbr é um pacote de R que limpa e simplifica nomes de pessoas para auxiliar no pareamento de banco de dados na ausência de chaves únicas não ambíguas. Detecta e corrige erros tipográficos mais comuns, simplifica opcionalmente termos sujeitos eventualmente a omissão em cadastros.

(R package for tidying and simplifying names. Created for aiding in dataset pairing in the absence of unambiguous keys. It detects and corrects common typos, optionally simplifies terms prone to omission in records.)

Instalação

O pacote está em processo de submissão ao CRAN. Quando aceito, a versão estável poderá ser instalada com:

install.packages("nomesbr")

A versão em desenvolvimento pode ser instalada com o seguinte comando :

# install.packages("remotes")
remotes::install_github("ipeadata-lab/nomesbr")

Utilização

O pacote nomesbr torna disponíveis funções para limpar e simplificar nomes. limpar_nomes() e simplifica_PARTICULAS_AGNOMES_PATENTES(), principais funções do pacote, foram criadas para seu uso em sequência nessa ordem.

limpar_nomes() recebe como parâmetros d,um data.frame, e s, nome da coluna com os nomes a processar. A função cria uma nova coluna, com sufixo ’_clean’, e gera novas colunas com informações dos tipos de limpeza detectados como necessários e realizados.

simplifica_PARTICULAS_AGNOMES_PATENTES() recebe também, d e s (por padrão para s, ‘nome_clean’) como parâmetros, e simplifica partículas repetidas, agnomes e alguma patentes.

A informação (novas colunas) gerada pela função limpar_nomes() servem como base para a função tabular_problemas_em_nomes() , que retorna uma tabela resumo dos problemas detectados e ações tomadas no sentido da limpeza de nomes.

Nota

nomesbr é desenvolvido por uma equipe de pesquisadores do Instituto de Pesquisa Econômica Aplicada (Ipea).

Copy Link

Version

Install

install.packages('nomesbr')

Monthly Downloads

476

Version

0.0.7

License

MIT + file LICENSE

Issues

Pull Requests

Stars

Forks

Maintainer

Rodrigo Borges

Last Published

July 17th, 2025

Functions in nomesbr (0.0.7)

NA_strings

ADA CONSTA'
identificar_adicionar_nome_proprio

Adiciona Nome Próprio Validado de `nomes_proprios_compostos` .
remove_PARTICULAS_AGNOMES

Remove Partículas, Agnomes e algumas Patentes de Nomes
segmentar_nomes

Adiciona Colunas com Partes do Nome (w1, w2, w3, w2p, w12p)
tabular_problemas_em_nomes

Tabula Problemas Detectados nos Nomes
simplifica_PARTICULAS_AGNOMES_PATENTES

Cria coluna com agnomes, algumas patentes/cargos as remove, remove partículas
limpar_nomes

Limpa e Analisa Nomes em um data.table
obter_dic_nomes_proprios_compostos

Carrega o dataset nomes_proprios_compostos Verifica se o dataset nomes_proprios_compostos existe em uma pasta de cache local. Se inexistir, baixa-o de um release do GitHub e o salva no cache.
nomesbr-package

nomesbr: Limpa e Simplifica Nomes de Pessoas (Name Cleaner and Simplifier)