Learn R Programming

statAfrikR (version 0.1.0)

nettoyer_libelles: Nettoyer les libellés de variables textuelles

Description

Normalise les chaînes de caractères : suppression des espaces superflus, normalisation de la casse, gestion des caractères spéciaux, correction des encodages. Préserve les caractères accentués africains et francophones.

Usage

nettoyer_libelles(
  data,
  vars = NULL,
  casse = c("titre", "majuscule", "minuscule", "aucune"),
  supprimer_espaces = TRUE,
  supprimer_ponctuation = FALSE,
  encodage = "UTF-8"
)

Value

Un tibble avec les variables textuelles nettoyées.

Arguments

data

data.frame ou tibble — Données à nettoyer

vars

character ou NULL — Variables à nettoyer. Si NULL, toutes les variables de type character. Défaut : NULL.

casse

character — Normalisation de la casse : "titre" (Première Lettre Majuscule), "majuscule", "minuscule", "aucune". Défaut : "titre".

supprimer_espaces

logical — Supprimer les espaces multiples et les espaces en début/fin. Défaut : TRUE.

supprimer_ponctuation

logical — Supprimer la ponctuation superflue. Défaut : FALSE.

encodage

character — Encodage cible. Défaut : "UTF-8".

Examples

Run this code
# \donttest{
  donnees <- data.frame(region = c(" nord ","SUD"), commune = c("Cotonou "," parakou"))
  nettoyer_libelles(donnees, vars = c("region", "commune"))
# }

Run the code above in your browser using DataLab