Simulation statistique avec R
Amal Mahjoub
University of Monastir, Faculty of Sciences of Monastir.
November 1, 2022
Amal Mahjoub () Simulation statistique avec R November 1, 2022 1 / 32
Table des matières
1 Introduction
2 R comme calculatrice scientifique :
3 Vecteur
4 Les matrices
5 Les listes
6 Les data frame
7 Exercices
Amal Mahjoub () Simulation statistique avec R November 1, 2022 2 / 32
Introduction
Introduction : Qu’est-ce-que le logiciel R ?
R est un logiciel de Statistiques permettant de manipuler les données, tracer des
graphiques, et faire des analyses statistiques sur ces données.
R est également un langage de programmation complet. C’est cet aspect qui
fait que R est différent des autres logiciels statistiques (SPSS, EVIEWS, ...).
Amal Mahjoub () Simulation statistique avec R November 1, 2022 3 / 32
Introduction
Introduction : Qu’est-ce-que le logiciel R ?
R est un logiciel de Statistiques permettant de manipuler les données, tracer des
graphiques, et faire des analyses statistiques sur ces données.
R est également un langage de programmation complet. C’est cet aspect qui
fait que R est différent des autres logiciels statistiques (SPSS, EVIEWS, ...).
Les informations sur R sont disponibles sur la homepage du projet :
http ://www.r-project.org/
C’est le premier résultat pour la recherche de la lettre R avec le moteur de
recherche google et la meilleure source d’informations sur le logiciel R. Vous
pourrez y trouver les différentes distributions du logiciel, de nombreuses
bibliothèques de fonctions et des documents d’aide.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 3 / 32
Introduction
Introduction : Qu’est-ce-que le logiciel R ?
R est un logiciel de Statistiques permettant de manipuler les données, tracer des
graphiques, et faire des analyses statistiques sur ces données.
R est également un langage de programmation complet. C’est cet aspect qui
fait que R est différent des autres logiciels statistiques (SPSS, EVIEWS, ...).
Les informations sur R sont disponibles sur la homepage du projet :
http ://www.r-project.org/
C’est le premier résultat pour la recherche de la lettre R avec le moteur de
recherche google et la meilleure source d’informations sur le logiciel R. Vous
pourrez y trouver les différentes distributions du logiciel, de nombreuses
bibliothèques de fonctions et des documents d’aide.
Enfin, R est un clône gratuit du logiciel S-Plus commercialisé par MathSoft
et d’eveloppé par Statistical Sciences autour du langage S (conu par les
laboratoires BELL).
Amal Mahjoub () Simulation statistique avec R November 1, 2022 3 / 32
Introduction
Comment installer le logiciel R ?
Le logiciel R est gratuit. La page officielle du logiciel est :
http ://www.r-project.org/
Pour installer R veuillez
1 Cliquer sur ”Download R”.
2 Choisir votre miroir CRAN preféré. Par exemple : CRAN Mirrors
https://mirror.ibcp.fr/pub/CRAN/ CNRS IBCP, Lyon
3 Cliquer sur ”Download R for Windows”
4 Cliquer sur ”Base”.
5 Cliquer sur ”Download R 4.2.1 for Windows”.
6 Installer R avec les paramètres par défaut.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 4 / 32
Introduction
Remarques d’ordre général sur le logiciel R :
R fonctionne avec plusieurs fenêtres sous Windows. En particulier, nous
distinguons la fenêtre R Console, fenêtre principale où sont réalisés par défaut les
entrées de commandes et les sorties de résultats.
Figure: La fenêtre R Console.
Suite de ce symbole >, vous pourrez taper les commandes R. Une fois la
commande tapée, vous devez toujours la valider par la touche Entrée.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 5 / 32
Introduction
Remarques d’ordre général sur le logiciel R :
R fonctionne avec plusieurs fenêtres sous Windows. En particulier, nous
distinguons la fenêtre R Console, fenêtre principale où sont réalisés par défaut les
entrées de commandes et les sorties de résultats.
Figure: La fenêtre R Console.
Suite de ce symbole >, vous pourrez taper les commandes R. Une fois la
commande tapée, vous devez toujours la valider par la touche Entrée.
Le symbole + apparaı̂t si la ligne précédente est incomplète.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 5 / 32
Introduction
La fenêtre de script
Il est souvent plus pratique de composer le code R dans une fenêtre
spécifique du logiciel : la fenêtre de script.
Figure: La fenêtre de script sous R.
Nouveau script ou Ouvrir un script permettent de créer un nouveau script de
commandes R ou d’accéder à un ancien script sauvegardé lors d’une session
précédente.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 6 / 32
Introduction
La fenêtre de script
Il est souvent plus pratique de composer le code R dans une fenêtre
spécifique du logiciel : la fenêtre de script.
Figure: La fenêtre de script sous R.
Nouveau script ou Ouvrir un script permettent de créer un nouveau script de
commandes R ou d’accéder à un ancien script sauvegardé lors d’une session
précédente.
Pour executer des instructions à partir de la fenêtre de script il suffit de
copier le code existant dans la fenêtre de script et le coller dans R console.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 6 / 32
Introduction
La fenêtre de script
Il est souvent plus pratique de composer le code R dans une fenêtre
spécifique du logiciel : la fenêtre de script.
Figure: La fenêtre de script sous R.
Nouveau script ou Ouvrir un script permettent de créer un nouveau script de
commandes R ou d’accéder à un ancien script sauvegardé lors d’une session
précédente.
Pour executer des instructions à partir de la fenêtre de script il suffit de
copier le code existant dans la fenêtre de script et le coller dans R console.
Pour sauvegarder un script, il suffit de sélectionner l’entrée ”Sauver” du
menu”Fichier”.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 6 / 32
Introduction
Il y a aussi un certain nombre de fenêtres facultatives, telles que les fenêtres
graphiques et les fenêtres d’informations (historique des commandes, aide,
visualisation de fichier, etc. . .), toutes appelées par des commandes spécifiques via
la console.
Figure: Fenêtre sous R.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 7 / 32
R comme calculatrice scientifique :
R est une calculatrice scientifique :
R permet
de faire les opérations de calcul élémentaire. Essayez les commandes suivantes :
R permet de faire des calculs plus élaborés. Il utilise pour cela des fonctions.
Plusieurs fonctions prédéfinies sont disponibles. Que font les fonctions
suivantes ?
R posséde aussi en mémoire la valeur de quelques constantes mathématiques :
Amal Mahjoub () Simulation statistique avec R November 1, 2022 8 / 32
R comme calculatrice scientifique :
Premières commandes
ls() Affiche tous les objets situés dans la mémoire de l’environnement R.
rm(a) Supprime un objet ou a reprśente le nom de l’objet à supprimer.
rm(list=ls()) Supprimer tous les objets en mémoire.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 9 / 32
R comme calculatrice scientifique :
Création de variable
On peut stocker en mémoire des données, résultats, etc. :
Pour rappeler le contenu d’une variable, il suffit de taper son nom :
Les variables ainsi créées peuvent être appelées n’importe quand, y compris lors de
la création de nouvelles variables :
Toutes les variables créées sont stockées dans la mémoire de R. On peut obtenir la
liste des objets stockes par la fonction ls
Amal Mahjoub () Simulation statistique avec R November 1, 2022 10 / 32
Vecteur
Création d’un vecteur
Les vecteurs sont des séries de valeurs de même type. Par exemple une série de
nombres ou une série de chaı̂ne de caractères.
Création d’un vecteur ”à la main”.
Il y a d’autres manières de créer des vecteurs.
Lorsqu’on affiche un vecteur de grande taille, R l’écrit sur plusieurs lignes :
Amal Mahjoub () Simulation statistique avec R November 1, 2022 11 / 32
Vecteur
Les objets
Les éléments de base du langage R sont des objets qui peuvent être
des données (vecteurs, matrices, · · · )
des fonctions
des graphiques · · ·
Les objets R se différencient par leur classe. Les principales classes d’objets sont
vector
matrix
array
factor
data.frame
list
Leur contenu peuvent être de nature (mode): null (objet vide), logical, numeric,
complex ou character.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 12 / 32
Vecteur
Le mode d’un objet est obtenu avec la fonction mode :
La longueur d’un objet est obtenue avec la fonction length :
Amal Mahjoub () Simulation statistique avec R November 1, 2022 13 / 32
Vecteur
Exemples
Amal Mahjoub () Simulation statistique avec R November 1, 2022 14 / 32
Vecteur
Exemples
Autres manières de créer des vecteurs.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 15 / 32
Vecteur
Opération sur les vecteurs
Opérations sur les vecteurs numériques :
Essayer d’utiliser +, −, ∗, /, sqrt(), log(), exp(), abs(), t().
Opérations logiques sur les vecteurs :
vous pouvez tester x < y , x == y , x! = y , (x <= 3)&(y > 3).
Amal Mahjoub () Simulation statistique avec R November 1, 2022 16 / 32
Vecteur
Opération sur les vecteurs
Extraction d’éléments dans un vecteur
Autres fonctions utilisables sur les vecteurs :
min(x), max(x), length(x), sum(x), prod(x), sort(x), mean(x), cumsum(x),
cumprod(x), summary(x)· · ·
Amal Mahjoub () Simulation statistique avec R November 1, 2022 17 / 32
Les matrices
Création de matices
Les matrices comme les vecteurs, sont de mode quelconque mais ne
contiennent que des éléments de même nature.
Par ”collage” de vecteurs lignes ou colonnes :
Amal Mahjoub () Simulation statistique avec R November 1, 2022 18 / 32
Les matrices
Création de matices
Avec l’ordre ”matrix” :
La fonction matrix() : remplissage par colone par défaut:
matrix( vec, nrow = n, ncol = p, byrow = T )
où vec est le vecteur contenant les éléments de la matrice de taille n par p,
qui seront rangés en colonne sauf si l’option byrow = T est utilisée.
À partir d’un vecteur existant :
Amal Mahjoub () Simulation statistique avec R November 1, 2022 19 / 32
Les matrices
Opérations sur les matrices :
Extraction d’éléments:
Opérations courantes sur les matrices :
Amal Mahjoub () Simulation statistique avec R November 1, 2022 20 / 32
Les matrices
Les opérations +, −, ∗, /, log() s’effectuent élément par élément :
Les matrices à plus de deux dimensions
Les tableaux sont des matrices de dimensions supérieures à 2. On peut les
générer à partir de la commande array (vec, c(n, p, q, · · · )):
Amal Mahjoub () Simulation statistique avec R November 1, 2022 21 / 32
Les listes
Création d’une liste :
La liste est le mode de stockage le plus général et polyvalent du langage R. Il
s’agit d’un type de vecteur spécial dont les éléments peuvent être de n’importe
quel mode, y compris le mode list.
Nous pouvons donner des noms aux différentes composantes de la liste :
Extraire des composantes et des éléments dans les composantes :
On peut accéder à chaque élément de la liste à l’aide de son index entre double
crochets [[ ]] ou par son nom précédé du signe $.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 22 / 32
Les data frame
Création d’un data frame
Un data frame est une table de vecteurs de même longueur mais pouvant chacun
avoir son type. Les colonnes sont hétérogènes : certaines peuvent être des chaı̂ne
de catactères quand d’autres peuventetre numériques. La création se fait à l’aide
de la commande data.frame (nom1=var1,nom2=var2,. . . ) :
Pour changer éventuellement les noms de colonnes :
Pour un aperçu sur la composition et la structure du data frame :
Amal Mahjoub () Simulation statistique avec R November 1, 2022 23 / 32
Exercices
Exercices
Exercice 1
Amal Mahjoub () Simulation statistique avec R November 1, 2022 24 / 32
Exercices
Solution exercice 1:
Amal Mahjoub () Simulation statistique avec R November 1, 2022 25 / 32
Exercices
Exercices
Exercice 2
Considérons le vecteur suivant : x = [1, 18, 2, 1, 5, 6, 1, 12, 13, 8, 20].
1 Crér ce vecteur dans R.
2 Afficher le mode de x, puis sa longueur.
3 Extraire les éléments suivants,
a) le premier élément, puis le dernier,
b) les trois premier éléments,
c) les éléments en position 1, 3, 5,
d) les éléments strictement supérieurs à 11.
4 Afficher les éléments de x qui sont supérieurs où égal à 8 ou multiples de 3.
5 Remplacer le premier élément de x par un 4.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 26 / 32
Exercices
Solution exercice 2:
Amal Mahjoub () Simulation statistique avec R November 1, 2022 27 / 32
Exercices
Exercice 3
−3 5 6
1 Créer la matrice suivante: A = −1 2 2 .
1 −1 −1
2 Afficher la dimension de A, son nombre de colonne, son nombre de ligne, et
sa longueur.
3 Extraire la seconde colonne de A, puis la première ligne,
4 Extraire l’élément en troisième position à la première ligne,
5 Extraire la sous-matrice
de dimension 2 × 2 du coin inférieur de A,
2 2
c’est-à-dire .
−1 −1
6 Calculer la somme des colonnes puis des lignes de A,
7 Afficher la diagonale de A.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 28 / 32
Exercices
Solution exercice 3:
Amal Mahjoub () Simulation statistique avec R November 1, 2022 29 / 32
Exercices
Exercice 4
1 Écrire une expression R pour créer la liste suivante :
2 Extraire les étiquettes de la liste.
3 Trouver le mode et la longueur du quatrième élément de la liste.
4 Extraire les dimensions du second élément de la liste.
5 Extraire les deuxième et troisième éléments du second élément de la liste.
6 Remplacer le troisième élément de la liste par le vecteur 3 : 8.
Amal Mahjoub () Simulation statistique avec R November 1, 2022 30 / 32
Exercices
Solution exercice 4:
Amal Mahjoub () Simulation statistique avec R November 1, 2022 31 / 32
Exercices
Exercice 5
Construire une matrice comportant 9 lignes et 9 colonnes avec des 0 sur la
diagonale et des 1 partout ailleurs (on pourra utiliser la commande diag).
Amal Mahjoub () Simulation statistique avec R November 1, 2022 32 / 32
Exercices
Exercice 5
Construire une matrice comportant 9 lignes et 9 colonnes avec des 0 sur la
diagonale et des 1 partout ailleurs (on pourra utiliser la commande diag).
Solution exercice 5:
Amal Mahjoub () Simulation statistique avec R November 1, 2022 32 / 32