Learn R Programming

⚠️There's a newer version (0.5.1) of this package.Take me there.

datos

Este paquete provee la traducción al español de conjuntos de datos en inglés originalmente disponibles en otros paquetes de R. Los datos traducidos son los que se utilizan en los ejemplos del libro R para Ciencia de Datos, la versión en español de R for Data Science de Hadley Wickham & Garrett Grolemund. El paquete datos puede utilizarse junto con el libro o de manera independiente como fuente de datos de práctica en español.

Instalación

La versión en CRAN está disponible por medio de:

# install.packages("datos")

La versión en GitHub puede ser instalada utilizando remotes:

# install.packages("remotes")
# remotes::install_github("cienciadedatos/datos")

Requisitos

Este paquete traduce los datos en el momento. Esto implica que la versión en español de los datos no está contenida como un objeto dentro del paquete, sino que se genera al momento de utilizarlos. Por lo tanto, para poder usar datos, el paquete que contiene los datos originales en inglés debe estar previamente instalado.

Los paquetes necesarios son:

Paquetes
nycflights13
nasaweather
Lahman
babynames
fueleconomy
ggplot2
datasets
gapminder
forcats
tidyr

El paquete datasets es parte de R base y ggplot2, tibble, tidyr, readr y forcats vienen incluidos en el paquete tidyverse. Todos los demás deben instalarse individualmente.

Traducciones

Las traducciones disponibles dentro de datos son las siguientes:

NombreTituloPaqueteDataset
nombresNombres de bebésbabynamesbabynames
fielDatos del géiser Viejo Fiel (Old Faithful)datasetsfaithful
floresDatos sobre la flor Iris de Edgar Andersondatasetsiris
mtautosPruebas de ruta de automóviles de Motor Trenddatasetsmtcars
encuestaMuestra de variables categóricas de una encuesta socialforcatsgss_cat
comunesModelos comunes de vehículosfueleconomycommon
vehiculosDatos de economía de combustiblefueleconomyvehicles
paisesDatos de Gapmindergapmindergapminder
diamantesPrecio de 50.000 diamantesggplot2diamonds
millasDatos de economía de combustible de 1999 y 2008 para 38 modelos populares de automóvilesggplot2mpg
presidencialPeriodos de 11 presidentes, desde Eisenhower a Obamaggplot2presidential
premios_dirigentesTabla de premios de los dirigentesLahmanAwardsManagers
bateadoresTabla de estadísticas de bateoLahmanBatting
jardinerosTabla de estadísticas de jardinerosLahmanFielding
dirigentesTabla de dirigentesLahmanManagers
personasTabla de personasLahmanPeople
lanzadoresTabla de estadísticas de lanzadoresLahmanPitching
salariosTabla de salariosLahmanSalaries
atmosferaDatos atmosféricosnasaweatheratmos
aerolineasNombres de aerolíneasnycflights13airlines
aeropuertosDatos de aeropuertosnycflights13airports
vuelosDatos de vuelosnycflights13flights
avionesDatos de avionesnycflights13planes
climaDatos de climanycflights13weather
tabla1Registros de tuberculosis de la Organización Mundial de la Salud (1era variante)tidyrtable1
tabla2Registros de tuberculosis de la Organización Mundial de la Salud (2da variante)tidyrtable2
tabla3Registros de tuberculosis de la Organización Mundial de la Salud (3era variante)tidyrtable3
tabla4aRegistros de tuberculosis de la Organización Mundial de la Salud (3era variante)tidyrtable4a
tabla4bRegistros de tuberculosis de la Organización Mundial de la Salud (3era variante)tidyrtable4b
tabla5Registros de tuberculosis de la Organización Mundial de la Salud (3era variante)tidyrtable5
omsDatos de tuberculosis de la Organización Mundial de la Saludtidyrwho

Los datos para practicar la manipulación de cadenas (strings) son oraciones, palabras y frutas.

Uso

El paquete datos se carga igual que todos los paquetes de R:

library(datos)
library(ggplot2)
library(dplyr)

Las variables que contienen los datos van a estar disponibles inmediatamente para su uso, pero los datos no se traducirán hasta que la variable sea “llamada” explícitamente en el código que se escriba. En este ejemplo, el dataset diamantes, que proviene de ggplot2::diamonds, se carga en la memoria de R en el momento en que lo llamamos por primera vez en español:

glimpse(diamantes)
## Observations: 53,940
## Variables: 10
## $ precio      <int> 326, 326, 327, 334, 335, 336, 336, 337, 337, 338, 33…
## $ quilate     <dbl> 0.23, 0.21, 0.23, 0.29, 0.31, 0.24, 0.24, 0.26, 0.22…
## $ corte       <ord> Ideal, Premium, Bueno, Premium, Bueno, Muy bueno, Mu…
## $ color       <ord> E, E, E, I, J, J, I, H, E, H, J, J, F, J, E, E, I, J…
## $ claridad    <ord> SI2, SI1, VS1, VS2, SI2, VVS2, VVS1, SI1, VS2, VS1, …
## $ profundidad <dbl> 61.5, 59.8, 56.9, 62.4, 63.3, 62.8, 62.3, 61.9, 65.1…
## $ tabla       <dbl> 55, 61, 65, 58, 58, 57, 57, 55, 61, 61, 55, 56, 61, …
## $ x           <dbl> 3.95, 3.89, 4.05, 4.20, 4.34, 3.94, 3.95, 4.07, 3.87…
## $ y           <dbl> 3.98, 3.84, 4.07, 4.23, 4.35, 3.96, 3.98, 4.11, 3.78…
## $ z           <dbl> 2.43, 2.31, 2.31, 2.63, 2.75, 2.48, 2.47, 2.53, 2.49…

Los datos traducidos quedarán cargados durante toda la sesión de R:

diamantes %>%
  filter(corte == "Bueno") %>%
  ggplot() +
  geom_boxplot(aes(claridad, precio, fill = claridad)) +
  theme(legend.position = "none") +
  labs(title = "Diamantes", subtitle = "Precio y claridad")

Actualización del paquete

La actualización del paquete tiene múltiples pasos. Si se hacen cambios a las traducciones, se debe ejecutar el siguiente código para que todas las referencias estén al día.

# Crea los scripts de traducción
datos:::data_script()
# Crea los archivos de ayuda
datos:::folder_rd()
# Actualiza el sitio web
pkgdown::build_site()
# Cambia la referencia a tipo html
datos:::fix_reference()

Copy Link

Version

Install

install.packages('datos')

Monthly Downloads

1,616

Version

0.2.0

License

CC0

Issues

Pull Requests

Stars

Forks

Maintainer

Edgar Ruiz

Last Published

September 25th, 2019

Functions in datos (0.2.0)

datos-package

datos: Traduce al Espa<U+00F1>ol Varios Conjuntos de Datos de Pr<U+00E1>ctica
representantes

Tabla de representantes (bateadores)
vehiculos

Datos de econom<U+00ED>a de combustible
vuelos

Datos de vuelos
fiel

Datos del g<U+00E9>iser Viejo Fiel (Old Faithful)
salarios

Tabla de salarios
diamantes

Precio de 50.000 diamantes
atmosfera

Datos atmosf<U+00E9>ricos
nombres

Nombres de beb<U+00E9>s
millas

Datos de econom<U+00ED>a de combustible de 1999 y 2008 para 38 modelos populares de autom<U+00F3>viles
lanzadores

Tabla de estad<U+00ED>sticas de lanzadores
aviones

Datos de aviones
oms

Datos de tuberculosis de la Organizaci<U+00F3>n Mundial de la Salud
premios_dirigentes

Tabla de premios de los dirigentes
paises

Datos de Gapminder
datos-stringr

Vectores de caracteres dentro del paquete stringr
presidencial

Periodos de 11 presidentes, desde Eisenhower a Obama
fildeo

Tabla de Fildeo
dirigentes

Tabla de dirigentes
tabla1

Registros de tuberculosis de la Organizaci<U+00F3>n Mundial de la Salud (1era variante)
flores

Datos sobre la flor Iris de Edgar Anderson
tabla3

Registros de tuberculosis de la Organizaci<U+00F3>n Mundial de la Salud (3era variante)
tabla4a

Registros de tuberculosis de la Organizaci<U+00F3>n Mundial de la Salud (3era variante)
personas

Tabla de personas
premios_capitanes

Tabla de premios de los capitanes
tabla2

Registros de tuberculosis de la Organizaci<U+00F3>n Mundial de la Salud (2da variante)
tabla4b

Registros de tuberculosis de la Organizaci<U+00F3>n Mundial de la Salud (3era variante)
tabla5

Registros de tuberculosis de la Organizaci<U+00F3>n Mundial de la Salud (3era variante)
aeropuertos

Datos de aeropuertos
comunes

Modelos comunes de veh<U+00ED>culos
bateadores

Tabla de estad<U+00ED>sticas de bateo
clima

Datos de clima
aerolineas

Nombres de aerol<U+00ED>neas
capitanes

Tabla de capitanes
encuesta

Muestra de variables categ<U+00F3>ricas de una encuesta social
mtautos

Pruebas de ruta de autom<U+00F3>viles de Motor Trend