datos

Este paquete provee la traducción al español de conjuntos de datos en inglés originalmente disponibles en otros paquetes de R. Los datos traducidos son los que se utilizan en los ejemplos del libro R para Ciencia de Datos, la versión en español de R for Data Science de Hadley Wickham & Garrett Grolemund. El paquete datos puede utilizarse junto con el libro o de manera independiente como fuente de datos de práctica en español.

Instalación

El paquete datos puede instalarse directamente desde CRAN:

install.packages("datos")

La versión en desarrollo está disponible en GitHub y puede instalarse utilizando remotes:

# install.packages("remotes")
remotes::install_github("cienciadedatos/datos")

Traducciones

Las traducciones disponibles dentro de datos son las siguientes:

NombreTituloPaqueteDataset
premios_dirigentesTabla de premios de los dirigentesLahmanAwardsManagers
bateadoresTabla de estadísticas de bateoLahmanBatting
jardinerosTabla de estadísticas de jardinerosLahmanFielding
dirigentesTabla de dirigentesLahmanManagers
personasTabla de personasLahmanPeople
lanzadoresTabla de estadísticas de lanzadoresLahmanPitching
salariosTabla de salariosLahmanSalaries
nombresNombres de bebésbabynamesbabynames
fielDatos del géiser Viejo Fiel (Old Faithful)datasetsfaithful
floresDatos sobre la flor Iris de Edgar Andersondatasetsiris
mtautosPruebas de ruta de automóviles de Motor Trenddatasetsmtcars
encuestaMuestra de variables categóricas de una encuesta socialforcatsgss_cat
comunesModelos comunes de vehículosfueleconomycommon
vehiculosDatos de economía de combustiblefueleconomyvehicles
paisesDatos de Gapmindergapmindergapminder
diamantesPrecio de 50.000 diamantesggplot2diamonds
millasDatos de economía de combustible de 1999 y 2008 para 38 modelos populares de automóvilesggplot2mpg
presidencialPeriodos de 11 presidentes, desde Eisenhower a Obamaggplot2presidential
datos_creditoDatos de créditomodeldatacredit_data
atmosferaDatos atmosféricosnasaweatheratmos
aerolineasNombres de aerolíneasnycflights13airlines
aeropuertosDatos de aeropuertosnycflights13airports
vuelosDatos de vuelosnycflights13flights
avionesDatos de avionesnycflights13planes
climaDatos de climanycflights13weather
pinguinosMedidas de tamaño de pingüinos adultos en busca de comida cerca de la estación Palmer en la Antártica.palmerpenguinspenguins
tabla1Registros de tuberculosis de la Organización Mundial de la Salud (1era variante)tidyrtable1
tabla2Registros de tuberculosis de la Organización Mundial de la Salud (2da variante)tidyrtable2
tabla3Registros de tuberculosis de la Organización Mundial de la Salud (3ra variante)tidyrtable3
tabla4aRegistros de tuberculosis de la Organización Mundial de la Salud (variante 4a)tidyrtable4a
tabla4bRegistros de tuberculosis de la Organización Mundial de la Salud (variante 4b)tidyrtable4b
tabla5Registros de tuberculosis de la Organización Mundial de la Salud (5ta variante)tidyrtable5
omsDatos de tuberculosis de la Organización Mundial de la Saludtidyrwho

Los datos para practicar la manipulación de cadenas (strings) son oraciones, palabras y frutas.

Uso

El paquete datos se carga igual que todos los paquetes de R:

library(datos)
library(ggplot2)
library(dplyr)

Las variables que contienen los datos van a estar disponibles inmediatamente para su uso, pero los datos no se traducirán hasta que la variable sea “llamada” explícitamente en el código que se escriba. En este ejemplo, el dataset diamantes, que proviene de ggplot2::diamonds, se carga en la memoria de R en el momento en que lo llamamos por primera vez en español:

glimpse(diamantes)
## Rows: 53,940
## Columns: 10
## $ precio      <int> 326, 326, 327, 334, 335, 336, 336, 337, 337, 338, 339, 340…
## $ quilate     <dbl> 0.23, 0.21, 0.23, 0.29, 0.31, 0.24, 0.24, 0.26, 0.22, 0.23…
## $ corte       <ord> Ideal, Premium, Bueno, Premium, Bueno, Muy bueno, Muy buen…
## $ color       <ord> E, E, E, I, J, J, I, H, E, H, J, J, F, J, E, E, I, J, J, J…
## $ claridad    <ord> SI2, SI1, VS1, VS2, SI2, VVS2, VVS1, SI1, VS2, VS1, SI1, V…
## $ profundidad <dbl> 61.5, 59.8, 56.9, 62.4, 63.3, 62.8, 62.3, 61.9, 65.1, 59.4…
## $ tabla       <dbl> 55, 61, 65, 58, 58, 57, 57, 55, 61, 61, 55, 56, 61, 54, 62…
## $ x           <dbl> 3.95, 3.89, 4.05, 4.20, 4.34, 3.94, 3.95, 4.07, 3.87, 4.00…
## $ y           <dbl> 3.98, 3.84, 4.07, 4.23, 4.35, 3.96, 3.98, 4.11, 3.78, 4.05…
## $ z           <dbl> 2.43, 2.31, 2.31, 2.63, 2.75, 2.48, 2.47, 2.53, 2.49, 2.39…

Los datos traducidos quedarán cargados durante toda la sesión de R:

diamantes %>%
  filter(corte == "Bueno") %>%
  ggplot() +
  geom_boxplot(aes(claridad, precio, fill = claridad)) +
  theme(legend.position = "none") +
  labs(title = "Diamantes", subtitle = "Precio y claridad")

Copy Link

Version

Down Chevron

Install

install.packages('datos')

Monthly Downloads

1,351

Version

0.5.1

License

CC0

Issues

Pull Requests

Stars

Forks

Maintainer

Last Published

July 17th, 2023

Functions in datos (0.5.1)