On considère les notes obtenues en Maths et Compta par 10 élèves Tle CG représenté dans le tableau suivant:
|
Elève |
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
|
|
Note Compta |
6 |
9 |
13 |
9 |
10 |
11 |
9 |
11 |
12 |
14 |
X |
|
Note Maths |
11 |
13 |
12 |
13 |
9 |
10 |
13 |
10 |
9 |
7 |
Y |
Tableau 1
Ø On désigne par P la population étudiée, ici il y a deux caractères:
X: le caractère ‘’ Note de Compta’’.
Y: le caractère ‘’ Note Maths‘’
Ø On désigne par Mi les modalités, ici il y a deux modalités:
MX={6, 9, 13,10, 11, 12, 14}
MX={11, 13,12, 9, 10, 7}
L’effectif de la modalité 13 du caractère Y est 3.
Tableau à double entrée
Partant du tableau 1, on peut utiliser un tableau à double entrée.
|
|
6 |
9 |
10 |
11 |
12 |
13 |
14 |
←Compta |
|
7 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
|
|
9 |
0 |
0 |
1 |
0 |
1 |
0 |
0 |
|
|
10 |
0 |
0 |
0 |
2 |
0 |
0 |
0 |
|
|
11 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
|
|
12 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
|
|
13 |
0 |
3 |
0 |
0 |
0 |
0 |
0 |
|
|
↑Maths |
|
|
|
|
|
|
|
|
Tableau 2
// il y a 3 personnes qui ont 13 en Maths et 9 en Compta.
// il y a 2 personnes qui ont 10 en Maths et 11 en Compta.
Séries statistiques marginales
|
|
6 |
9 |
10 |
11 |
12 |
13 |
14 |
ni |
|
7 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
|
9 |
0 |
0 |
1 |
0 |
1 |
0 |
0 |
2 |
|
10 |
0 |
0 |
0 |
2 |
0 |
0 |
0 |
2 |
|
11 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
|
12 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
1 |
|
13 |
0 |
3 |
0 |
0 |
0 |
0 |
0 |
3 |
|
ni |
1 |
3 |
1 |
2 |
1 |
1 |
1 |
10 |
Tableau
3
on déduit les tableaux linéaires suivants:
Tableau linéaire associe à X
|
xi |
6 |
9 |
10 |
11 |
12 |
13 |
14 |
Total |
|
ni |
1 |
3 |
1 |
2 |
1 |
1 |
1 |
10 |
Tableau linéaire associe à Y
|
yi |
7 |
9 |
10 |
11 |
12 |
13 |
Total |
|
ni |
1 |
2 |
2 |
1 |
1 |
3 |
10 |
X et Y sont deux caractères définis sur une population P
{x1, x2,…,xp} .l’ensemble MX des modalités du caractère X
{y1, y2,…,yp} .l’ensemble MY des modalités du caractère Y
: Dans un repère orthogonal, l’ensemble des points 𝑀𝑖 de coordonnées (𝑥𝑖, 𝑦𝑖) constitue le nuage de points associé à la série statistique à deux variables.

On peut utiliser la représentation du nuage par un ensemble de points pondérés c.-à-d. on indique à coté de chaque point 𝑀𝑖 de coordonnées (𝑥𝑖, 𝑦𝑖) l’effectif. Une autre variante de ce type de représentation est la représentation par tâche c.-à-d. chaque point 𝑀𝑖 de coordonnées (𝑥𝑖, 𝑦𝑖) est représenté par un disque dont l’aire est proportionnelle à l’effectif.
Point moyen d’un nuage représentant une série double
Le point moyen du nuage de la
série statistique à deux variables est le point M dont les coordonnées sont les
moyennes (
) des
X et Y respectivement.

Soit (xi, yi) une série statistique double, avec un nuage de points Mi (xi, yi) associé. Lorsque les points du nuage paraissent presque alignés, on peut chercher une relation de la forme y = ax + b qui exprime de façon approchée les valeurs de la série (y i) en fonction des valeurs de la série (xi) , autrement dit, une fonction affine f telle que l’égalité y = f(x) s’ajuste au mieux avec les données. Graphiquement, cela signifie qu’on cherche une droite qui passe au plus près de tous les points du nuage. Une telle relation permettrait notamment de faire des prévisions. Il existe de nombreuses manières d’obtenir un ajustement affine satisfaisant.
Etape 1 : On commence par « découper » la série statistique double en deux sous-séries bien distinctes, c’est-à-dire que l’on découpe le nuage de points Mi (xi, yi) en deux sous-nuages distincts et de même effectif (ou presque : si le nombre de points est pair, pas de souci. S’il est impair, on peut mettre le point surnuméraire dans n’importe lequel des deux sous-nuages)
Etape 2 : On calcule les coordonnées des deux points moyens G1 et G2 associés à ces deux sous nuages, et on place ces deux points sur le graphique.
Etape 3 : On trace la droite (G1 G2), appelée droite de Mayer du nuage de points Mi (xi, yi), qui doit passer par le point moyen G du nuage de points Mi (xi, yi). C’est cette droite qui constitue un ajustement affin tout à fait acceptable pour la série double (xi, yi).
Exemple:
|
xi |
60 |
70 |
90 |
110 |
130 |
150 |
|
yi |
3 |
3.1 |
3.7 |
4.7 |
6 |
9 |
= (8 + 10 + 12) : 3 =
10
= (40 + 55 + 55) : 3 =
50.
Le point moyen G1 a pour coordonnées (10 ; 50).
= (14 + 16 + 18) : 3 =
16
= (70 + 75 + 95) : 3 =
80
Le point moyen G2 a pour coordonnées (16 ; 80).

Covariance d’une série statistique double
On appelle covariance de la série double (xi, yi) le nombre note Cov(X,Y) tel que:
.![]()
On appelle coefficient de corrélation linéaire du couple (X, Y), le nombre réel, noté r tel que :

· On considère un nuage de points Mi (xi, yi) et soit (D) une droite d’équation y = ax + b que l’on cherche à déterminer.

![]()
La droite (D) d’équation y = ax+b où a et b sont déterminés d’après les relations ci-dessus, est appelé droite de régression de Y en X .
· La droite (D’) d’équation : x=a’y+b’ avec :

![]()
est appelée droite de régression de X en Y
Remarque 1 :
Les
deux droites de régression de Y en X et de X en Y passent toutes deux par le
point moyen de coordonnées (
)
Remarque 2 :
· -1 ≤ r ≤ 1
· aa’ = r²
· Lorsque la corrélation est forte (r2 ≥ ¾) les droites de régression sont très proches et le nuage peut être approximé par une droite.
· Lorsque la corrélation est faible, le nuage de points ne peut pas être ajusté par une droite, mais il se peut qu’une autre courbe permette un bon ajustement.
EXERCICE I:
Un responsable de vente des produits laitiers analyse l’évolution de son chiffre d’affaires sur les 10 dernières années. Il relève pour cela le montant des frais de publicité engages sur la même période. Il dresse le tableau suivant(les montants sont exprimés en dizaines de millions).
|
Frais de publicite (xi) |
6 |
6,5 |
6,8 |
7 |
7,8 |
9 |
10,5 |
11 |
11,3 |
11,5 |
|
Chiffre d’affaire(yi) |
220 |
229 |
225 |
237 |
235 |
247 |
250 |
268 |
258 |
264 |
1. Déterminer les coordonnées du point moyen G de cette série.
2. Déterminer les coordonnées de G1, point moyen du 1er groupe.
3. Déterminer les coordonnées de G2, point moyen du 2eme groupe.
4. Déterminer l’équation cartésienne de la droite passant par G1 et G2.
EXERCICE II:
C,
1. Tracer le nuage des points.
EXERCICE III:
Dans la série statistique suivante, X représente le nombre de jours d’exposition au soleil d’une feuille et Y le nombre de stomates aérifères au millimètre carré :

1. Tracer le nuage des points.
2. Calculer le coefficient de corrélation linéaire entre X et Y. Conclusion ?
3. Déterminer l’équation de la droite de régression de Y en fonction de X.
4. Si on expose au soleil une feuille 15 jours; quel est le nombre de stomates aérifères peut-on prévoir ?
EXERCICE IV:
Afin d’orienter ses investissements, une chaine d’hôtel réalise des analyses sur le taux d’occupation des chambres. Une analyse établit un lien entre le taux d’occupation exprimé en % et les années de fonctionnement.
|
Frais de publicité (xi) |
30 |
27 |
32 |
25 |
35 |
22 |
24 |
35 |
|
Taux d’occupation(yi) |
52 |
45 |
67 |
55 |
76 |
48 |
32 |
72 |
1.Determiner les coordonnées du point moyen
2.Determiner la variance de x, celle de y, la covariance du couple (x,y) ainsi que le coefficient de corrélation.
3. Déterminer par la méthode des moindres carres une équation cartésienne de la droite de régression de y en x
4.Quelle estimation peut-on faire du taux d’occupation des chambres de cet hôtel si les frais de publicité étaient de 4000 0000frs
EXERCICE V:
EXERCICE VI:
Merci de votre visite
Laissez un commentaire