Jeu de donn<U+00E9>es simul<U+00E9>es de 1000 sujets, avec les colonnes suivantes:
sexe Variable cat<U+00E9>gorielle (facteur), 2 niveaux: “F” et “M”. Environ 500 chacun.
age Num<U+00E9>rique.
age.gr Age regroup<U+00E9> en facteur (4 niveaux).
IMC Indice de masse corporelle (num<U+00E9>rique).
fumeur Variable cat<U+00E9>gorielle <U+00E0> 2 niveaux (“Oui” / “Non”).
cigs.par.jour Nombre de cigarettes fum<U+00E9>es par jour (num<U+00E9>rique).
malade Variable cat<U+00E9>gorielle <U+00E0> 2 niveaux (“Oui” / “Non”).
maladie Champs texte.
ponderation Poids <U+00E9>chantillonal (num<U+00E9>rique).
data(tabagisme)Un data frame de 1000 rang<U+00E9>es et 9 colonnes
Note sur la simulation des donn<U+00E9>es: la probabilit<U+00E9> pour un sujet de tomber dans la cat<U+00E9>gorie “malade” est bas<U+00E9>e sur une fonction arbitraire faisant intervenir l'<U+00E2>ge, l'IMC et le nombre de cigarettes fum<U+00E9>es par jour.
A copy of this dataset is available in English under the name “tobacco”.