Mesures de la tendance centrale pour les données groupées
Le mesures de tendance centrale des données groupées ils sont utilisés dans les statistiques pour décrire certains comportements d'un groupe de données fournies, telles que la valeur à laquelle ils sont proches, la moyenne des données collectées, entre autres.
Lorsqu'une grande quantité de données est prise, il est utile de les regrouper pour en avoir un meilleur ordre et ainsi être en mesure de calculer certaines mesures de tendance centrale.
Parmi les mesures de tendance centrale les plus utilisées sont la moyenne arithmétique, la médiane et le mode. Ces chiffres indiquent certaines qualités des données collectées dans une expérience donnée.
Pour utiliser ces mesures, il faut d'abord savoir comment regrouper un ensemble de données.
Données groupées
Pour regrouper les données en premier, vous devez calculer la plage des données, obtenue en soustrayant la valeur la plus élevée moins la valeur la plus faible des données.
Choisissez ensuite un nombre "k", qui correspond au nombre de classes dans lesquelles vous souhaitez regrouper les données.
Nous procédons à la division de la plage entre "k" pour obtenir l'amplitude des classes à grouper. Ce nombre est C = R / k.
Enfin, le regroupement est lancé, pour lequel un nombre plus petit est choisi que la valeur la plus basse des données obtenues.
Ce nombre sera la limite inférieure de la première classe. A cela est ajouté le C. La valeur obtenue sera la limite supérieure de la première classe.
Ensuite, C est ajouté à cette valeur et la limite supérieure de la deuxième classe est obtenue. De cette manière, nous continuons jusqu'à ce que nous obtenions la limite supérieure de la dernière classe.
Une fois les données regroupées, vous pouvez calculer la moyenne, la médiane et le mode.
Pour illustrer comment la moyenne arithmétique, la médiane et le mode sont calculés, nous allons procéder avec un exemple.
Exemple
Regroupez les données suivantes en 4 classes.Lorsque vous calculez la plage, vous obtenez que R = 9-1 = 8. L'amplitude des classes est C = R / k = 8/4 = 2.
Par conséquent, lors du regroupement des données, vous obtiendrez une table comme celle-ci:
Les 3 principales mesures de tendance centrale
Nous allons maintenant procéder au calcul de la moyenne arithmétique, de la médiane et du mode. L'exemple précédent sera utilisé pour illustrer cette procédure.
1- moyenne arithmétique
La moyenne arithmétique consiste à multiplier chaque fréquence par la moyenne de l'intervalle. Ensuite, tous ces résultats sont ajoutés, et enfin il est divisé entre les données totales.
En utilisant l'exemple précédent, on obtiendrait que la moyenne arithmétique soit égale à:
(4*2 + 4*4 + 6*6 + 4*8) / 18 = (8+16+36+32)/18 = 5,11111
Cela indique que la valeur moyenne des données dans la table est 5.11111.
2- moyen
Pour calculer la médiane d'un ensemble de données, toutes les données sont classées par ordre croissant. Deux cas peuvent être présentés:
- Si le numéro de données est impair, la médiane est la donnée située au centre.
- Si le numéro de données est pair, la médiane est la moyenne des deux données qui restent au centre.
En ce qui concerne les données groupées, le calcul de la médiane se fait de la manière suivante:
- N / 2 est calculé, où N est le total des données.
- le premier intervalle lorsque la fréquence cumulative (fréquence de somme) est supérieur à N / 2 est demandée, et la limite inférieure de cette plage est sélectionnée, nommé Li.
La médiane est donnée par la formule suivante:
Me = Li + (Ls-Li) * (N / 2 - Fréquence accumulée avant Li) / Fréquence de [Li, Ls]
Ls est la limite supérieure de la plage mentionnée ci-dessus.
Si le tableau de données ci-dessus est utilisé, il doit N / 2 = 18/2 = 9. fréquences cumulées sont 4, 8, 14 et 18 (une pour chaque rangée de la table).
Par conséquent, le troisième intervalle doit être sélectionné, car la fréquence accumulée est supérieure à N / 2 = 9.
Donc Li = 5 et Ls = 7. En appliquant la formule décrite ci-dessus, vous devez:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3- Mode
La mode est la valeur qui a le plus de fréquence parmi toutes les données groupées; c'est-à-dire que c'est la valeur qui est répétée la plupart du temps dans le jeu de données initial.
Lorsque vous avez une très grande quantité de données, la formule suivante est utilisée pour calculer le mode des données groupées:
Mo = Li + (Ls-Li) * (fréquence Li - Fréquence L (i-1)) / ((fréquence Li - Fréquence L (i-1)) + (Li fréquence - Fréquence L ( i + 1)))
L'intervalle [Li, Ls] est l'intervalle où la fréquence la plus élevée est trouvée. Pour l'exemple présenté dans cet article, nous avons la mode donnée par:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Une autre formule utilisée pour obtenir une valeur approximative à la mode est la suivante:
Mo = Li + (Li-Ls) * (fréquence L (i + 1)) / (fréquence L (i-1) de fréquence L (i + 1)).
Avec cette formule, les comptes sont les suivants:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Références
- Bellhouse, D. R. (2011). Abraham De Moivre: Préparer la probabilité classique et ses applications. CRC Press.
- Cifuentes, J. F. (2002). Introduction à la théorie des probabilités. Univ. National de Colombie.
- Daston, L. (1995). Probabilité classique dans les Lumières. Princeton University Press.
- Larson, H. J. (1978). Introduction à la théorie des probabilités et à l'inférence statistique. Editorial Limusa.
- Martel, P.J. et Vegas, F. J. (1996). Probabilités et statistiques mathématiques: applications en pratique clinique et en gestion de la santé. Ediciones Díaz de Santos.
- Vázquez, A. L. et Ortiz, F. J. (2005). Méthodes statistiques pour mesurer, décrire et contrôler la variabilité. Ed. Université de Cantabrie.
- Vázquez, S. G. (2009). Manuel de mathématiques pour l'accès à l'université. Centre de rédaction d'études Ramon Areces SA.