Learn R Programming

summarytools (version 0.8.0)

tabagisme: Usage du Tabac et <U+00E9>tat de Sant<U+00E9> (Donn<U+00E9>es simul<U+00E9>es)

Description

Jeu de donn<U+00E9>es simul<U+00E9>es de 1000 sujets, avec les colonnes suivantes:

  • sexe Variable cat<U+00E9>gorielle (facteur), 2 niveaux: “F” et “M”. Environ 500 chacun.

  • age Num<U+00E9>rique.

  • age.gr Age regroup<U+00E9> en facteur (4 niveaux).

  • IMC Indice de masse corporelle (num<U+00E9>rique).

  • fumeur Variable cat<U+00E9>gorielle <U+00E0> 2 niveaux (“Oui” / “Non”).

  • cigs.par.jour Nombre de cigarettes fum<U+00E9>es par jour (num<U+00E9>rique).

  • malade Variable cat<U+00E9>gorielle <U+00E0> 2 niveaux (“Oui” / “Non”).

  • maladie Champs texte.

  • ponderation Poids <U+00E9>chantillonal (num<U+00E9>rique).

Usage

data(tabagisme)

Arguments

Format

Un data frame de 1000 rang<U+00E9>es et 9 colonnes

Details

Note sur la simulation des donn<U+00E9>es: la probabilit<U+00E9> pour un sujet de tomber dans la cat<U+00E9>gorie “malade” est bas<U+00E9>e sur une fonction arbitraire faisant intervenir l'<U+00E2>ge, l'IMC et le nombre de cigarettes fum<U+00E9>es par jour.

A copy of this dataset is available in English under the name “tobacco”.