On dispose d'informations médicales sur 462 patients mâles dans une région à risque élevé de maladies cardiaques du Cap-Occidental (Afrique du Sud).
Le jeu de données des maladies cardio-vasculaires
On considère à cet effet un jeu de données issu d'un article dans le South African Medical Journal (Rousseauw et al, 1983).
On y trouve les 12 variables suivantes :
sbp : tension artérielle systolique ;
tobacco : tabac cumulé (en kg) ;
ldl : cholestérol de lipoprotéines de faible densité ;
adiposity : adiposité ;
famhist : antécédents familiaux ;
typea : comportement type A ;
obesity : obésité ;
alcohol : consommation courante d'alcool ;
age : âge au moment de l'attaque cardiaque ;
chd : maladie coronarienne.
Objectif de notre analyse
Notre objectif sera d'appréhender les facteurs pouvant influencer l'apparition d'une maladie coronarienne à des fins de prévision.
Dans ce cas, nous allons utiliser une régression logistique.
Très bien, voyons enfin notre dernier jeu de données, portant sur des variétés de blé.