• 12 heures
  • Facile

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 15/12/2020

Familiarisez-vous avec les différents types d'objet en R

Il existe de nombreux objets permettant de représenter au mieux la réalité (vecteurs, matrices, etc.). R possède de nombreuses fonctions et opérateurs qui facilitent la manipulation de ces derniers. Dans cette partie, vous verrez ainsi comment créer et manipuler ces différents objets.

Créez vos propres objets

Avant de pouvoir utiliser un objet, il faut pouvoir le créer : pour cela, l’affectation - le fait d’associer une valeur, un objet bien particulier à un nom, de créer une variable - peut se faire via trois opérateurs : <-  ,  ->  ou  =. Voici comment les utiliser en pratique :

x <- 2 # crée l’objet x en lui donnant la valeur 2
X = 4 # X reçoit la valeur 4
b = x # b reçoit la valeur x, soit ici 2
3 -> y # y reçoit la valeur 3

Même s’il en existe trois différents, l’opérateur privilégié par la communauté est généralement
 <-  .

Il est également possible d’accéder à des jeux de données existants de base en R, via la fonction  data. Voilà par exemple comment charger le jeu de données iris, contenant les caractéristiques de différentes espèces de fleurs d’iris qui est particulièrement pratique pour tester différentes méthodes statistiques : 

data(iris) 

À présent, votre jeu de données IRIS est exploitable.

Vous pouvez également lire des données directement à partir d’un fichier externe (de type .csv, .txt, etc.) après l’avoir importé. Nous reviendrons là-dessus plus en détail dans une partie ultérieure.

Contrôlez l’environnement de vos objets

Lors de vos études statistiques, vous allez être amené à modifier plusieurs fois un même objet. Dans ce cas - et dans bien d’autres, d’ailleurs -, vous allez avoir besoin d’afficher le contenu d’un objet. Vous pouvez afficher la valeur d’un objet  x  via la commande  print  :

print(x)

ou plus simplement :

x

Par défaut, R conserve en mémoire tous les objets créés dans la session. Il est donc recommandé de supprimer régulièrement des objets. Pour connaître les objets de la session, vous pouvez utiliser les fonctions  objects  ou  ls.

En revanche, si vous souhaitez supprimer un seul objet  x  via du code, vous avez à votre disposition la fonction  rm  :

rm(x)

Cette dernière permet également de supprimer plusieurs objets :

rm(objet1,objet2,objet3)

Manipulez les types d’objets

Lors de vos analyses statistiques, vous allez être confronté à de nombreuses variables de natures diverses. Si par exemple votre analyse porte sur des données météorologiques, vous pourriez avoir :

  • des variables numériques (température, pression atmosphérique, etc.) ;

  • des variables textuelles (station météo, ville, etc.) ;

  • des variables indicatrices (présence ou non de pluie, etc.) ;

  • et bien d’autres...

R vous permet de représenter toutes ces variables via différents types, ou modes d’objets. Les types fondamentaux sont :

  • null - représentant le vide, lorsqu’il n’y a rien : NULL

  • logical - booléen, permettant des opérations logiques. Il n’a que deux valeurs, vrai ou faux, qui se notent :  TRUE  ou  FALSE  (  T  ou  F  marchent également).

  • numeric - correspond à toute valeur numérique (entier, décimal et réel) : 1  ,  2.3222  ,  pi  ,  1e-10

  • complex - permettant de représenter des nombres complexes : 2+0i  ,  2i

  • character - chaîne de caractères, permettant de stocker du texte :  'bonjour'  ,  "K"

Voici quelques exemples concrets de création de variables de types différents :

rien = NULL
temperature = 23.5
pluie = TRUE
tempete = F
station = 'Paris'
ville = "Corbeil-Essonnes"

Pour connaître le mode d’un objet  x  de R, il suffit d’exécuter la commande  mode  :

> mode(x)

Il est aussi possible de tester l’appartenance d’un objet  x  à un mode particulier via une fonction construite généralement avec is.  suivi du nom du type correspondant en R. Il existe ainsi une fonction pour chaque type. Le résultat est un booléen qui prend les valeurs TRUE ou FALSE :

is.null(x)
is.logical(x)
is.numeric(x)
is.complex(x)
is.character(x)

Vous pouvez également forcer la conversion d’un type à un autre, de façon explicite. Les fonctions correspondantes sont assez similaires aux précédentes, sauf qu’elles se construisent avec as.  suivi du nom du type correspondant en R :

as.logical(x)
as.numeric(x)
as.complex(x)
as.character(x)

Voici un tableau résumant les résultats des conversions en fonction des types considérés :

De

En

Fonction à utiliser

Résultat de la conversion

logique

numérique

as.numeric

FALSE -> 0
TRUE -> 1

logique

caractère

as.character

FALSE -> "FALSE"
TRUE -> "TRUE"

caractère

numérique

as.numeric

"1", "2", ... -> 1, 2, ...
"A", "B", ... -> NA, NA, ...

caractère

logique

as.logical

"FALSE", "F" -> FALSE
"TRUE", "T" -> TRUE
autres caractères -> NA

numérique

logique

as.logical

0 -> FALSE
autres nombres -> TRUE

numérique

caractère

as.character

1, 2, ... -> "1", "2", ...

Un objet a deux attributs intrinsèques : son mode et sa longueur (fonction length). Il existe aussi d’autres attributs spécifiques qui diffèrent selon le type d’objet. Vous pouvez accéder à la liste de ces attributs en exécutant la commande :

attributes(objet)

Les types un peu particuliers

Lors de vos analyses statistiques, vous allez forcément être confronté à un moment ou à un autre à ce que l’on appelle des valeurs manquantes. Elles peuvent être dues à différentes raisons : manque d’information, donnée non collectée, donnée non renseignée, erreur dans le programme de récupération des données, erreur de conversion de votre part, etc.

Dans tous les cas, ces données ne sont pas disponibles pour l’utilisateur et R les note  NA  pour « Not Available ». Ce n’est pas un véritable mode et il possède ses propres règles de calcul. Par exemple :

x <- NA
print(x+1)
# NA

Pour savoir où se trouvent les valeurs manquantes d’un objet  x, il faut poser la question  is.na  :

is.na(x)

Cela retourne un booléen de même longueur que  x  . La question est posée élément par élément. Dans le cas d’un vecteur, cela renvoie un vecteur logique de même longueur que  x  avec  TRUE  si l’élément correspondant de  x  est  NA  , et  FALSE  sinon.

En résumé

  • Vous pouvez créer des objets via une opération d’affectation.

  • Il est possible d’ajouter des commentaires ne servant qu’à la documentation du code.

  • Vous pouvez contrôler l’environnement en affichant ou supprimant vos objets.

  • Il existe cinq types (ou modes) d’objets fondamentaux :null  ,  logical  ,  numeric  ,  complex  et  character  .

  • Vous pouvez réaliser une conversion pour changer le type d’un objet.

  • Les valeurs manquantes sont représentées par des  NA  en R.

Dans le prochain chapitre, nous verrons un peu plus en détails comment utiliser les vecteurs.

Et si vous obteniez un diplôme OpenClassrooms ?
  • Formations jusqu’à 100 % financées
  • Date de début flexible
  • Projets professionnalisants
  • Mentorat individuel
Trouvez la formation et le financement faits pour vous
Exemple de certificat de réussite
Exemple de certificat de réussite