Marque de classe pour ce qu'elle sert, comment elle est prise et exemples



Le marque de classe, également appelé point milieu, correspond à la valeur trouvée au centre d'une classe, qui représente toutes les valeurs de cette catégorie. Fondamentalement, la marque de classe est utilisée pour le calcul de certains paramètres, tels que la moyenne arithmétique ou l'écart type.

Ensuite, la marque de classe est le milieu de tout intervalle. Cette valeur est également très utile pour trouver la variance d'un ensemble de données déjà regroupées en classes, ce qui nous permet de comprendre à quel point ces données déterminées sont éloignées du centre.

Index

  • 1 distribution de fréquence
    • 1.1 Combien de classes prendre en compte?
  • 2 Comment ça se passe?
    • 2.1 Exemple
  • 3 À quoi ça sert?
    • 3.1 Exemple
  • 4 références

Distribution de fréquence

Pour comprendre ce qu'est une marque de classes, le concept de distribution de fréquence est nécessaire. Étant donné un ensemble de données, une distribution de fréquence est une table qui divise ces données en un certain nombre de catégories appelées classes.

Ce tableau indique le nombre d'éléments appartenant à chaque classe. ce dernier est connu sous le nom de fréquence.

Dans ce tableau, une partie des informations que nous obtenons des données est sacrifiée, car au lieu d’avoir la valeur individuelle de chaque élément, nous savons seulement qu’elle appartient à cette classe.

D'autre part, nous comprenons mieux l'ensemble de données, car il est ainsi plus facile d'apprécier les modèles établis, ce qui facilite la manipulation des données.

Combien de classes prendre en compte?

Pour faire une distribution de fréquence, il faut d'abord déterminer le nombre de classes que nous voulons prendre et en choisir les limites de classe.

Le choix du nombre de classes à prendre devrait être pratique, sachant qu'un petit nombre de classes peut cacher des informations sur les données que nous voulons étudier et qu'une très grande peut générer trop de détails qui ne sont pas nécessairement utiles.

Les facteurs à prendre en compte lors du choix du nombre de classes à prendre sont nombreux, mais parmi ces derniers, il convient de noter: le premier est de prendre en compte la quantité de données à prendre en compte; la seconde est de savoir quelle est la taille de la distribution (c'est-à-dire la différence entre la plus grande et la plus petite observation).

Après avoir défini les classes, nous procédons au décompte du nombre de données existant dans chaque classe. Ce nombre est appelé fréquence de classe et est désigné par fi.

Comme nous l'avons dit précédemment, une distribution de fréquence perd les informations qui proviennent individuellement de chaque donnée ou observation. Par conséquent, une valeur est recherchée qui représente la classe entière à laquelle elle appartient; cette valeur est la marque de classe.

Comment tu l'obtiens?

La marque de classe est la valeur centrale que représente une classe. On l'obtient en ajoutant les limites de l'intervalle et en divisant cette valeur par deux. Ceci pourrait être exprimé mathématiquement comme suit:

xje= (Limite inférieure + limite supérieure) / 2.

Dans cette expression xje dénote la marque de la ith classe.

Exemple

Compte tenu de l'ensemble de données suivant, donnez une distribution de fréquence représentative et obtenez le symbole correspondant.

Comme les données ayant la valeur numérique la plus élevée est 391 et la plus petite 221, la plage est 391 -221 = 170.

Nous choisirons 5 classes, toutes de même taille. Une façon de choisir les classes est la suivante:

Notez que chaque donnée est dans une classe, elles sont disjointes et ont la même valeur. Une autre façon de choisir les classes consiste à considérer les données comme faisant partie d'une variable continue, qui pourrait atteindre n'importe quelle valeur réelle. Dans ce cas, on peut considérer des classes de la forme:

205-245, 245-285, 285-325, 325-365, 365-405

Cependant, cette façon de regrouper les données peut présenter certaines ambiguïtés avec les frontières. Par exemple, dans le cas de 245, la question se pose: à quelle classe appartient-elle, à la première ou à la seconde?

Pour éviter ces confusions, une convention de points extrêmes est faite. De cette façon, la première classe sera l'intervalle (205.245), la seconde (245.285), etc.

Une fois les classes définies, nous procédons au calcul de la fréquence et nous avons le tableau suivant:

Après avoir obtenu la distribution de fréquence des données, nous procédons à la recherche des marques de classe de chaque intervalle. En effet, nous devons:

x1=(205+ 245)/2=225

x2=(245+ 285)/2=265          

x3=(285+ 325)/2=305

x4=(325+ 365)/2=345

x5=(365+ 405)/2=385

Nous pouvons représenter cela par le graphique suivant:

A quoi ça sert?

Comme mentionné précédemment, la marque de classe est très fonctionnelle pour trouver la moyenne arithmétique et la variance d'un groupe de données déjà regroupées dans différentes classes.

Nous pouvons définir la moyenne arithmétique comme la somme des observations obtenues entre la taille de l'échantillon. D'un point de vue physique, son interprétation ressemble au point d'équilibre d'un ensemble de données.

Identifier un ensemble complet de données par un seul numéro peut être risqué. Nous devons donc également prendre en compte la différence entre ce point d’équilibre et les données réelles. Ces valeurs sont connues sous le nom d'écarts par rapport à la moyenne arithmétique et sont utilisées pour déterminer la variation de la moyenne arithmétique des données.

La manière la plus courante de trouver cette valeur est la variance, qui est la moyenne des carrés des écarts par rapport à la moyenne arithmétique.

Pour calculer la moyenne arithmétique et la variance d'un ensemble de données regroupées dans une classe, nous utilisons respectivement les formules suivantes:

Dans ces expressions xje est la marque de i-classe, fje représente la fréquence correspondante et k le nombre de classes dans lesquelles les données ont été regroupées.

Exemple

En utilisant les données fournies dans l'exemple précédent, nous pouvons élargir un peu plus les données du tableau de répartition des fréquences. Vous obtenez ce qui suit:

Ensuite, en remplaçant les données dans la formule, il reste que la moyenne arithmétique est:

Sa variance et son écart type sont les suivants:

Nous pouvons en conclure que les données originales ont une moyenne arithmétique de 306,6 et un écart type de 39,56.

Références

  1. Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. José M. Statistiques descriptives. Esic Editorial.
  2. Jhonson Richard A.Miller et Freund Probability et Statesmen pour Ingenieros.Pearson Educacion.
  3. Miller I & Freund J. Probability et Statesmen for Engineers. REVERTE.
  4. Sarabia A. Jose Maria, Pascual Marta. Cours de base de statistiques pour les entreprises
  5. Llinás S. Humberto, Rojas A. Carlos Statistiques descriptives et distributions de probabilités.Universidad del Norte Editorial