Capítulo 4 Medidas de tendencia central

Son aquellas medidas que buscan un dato representivo central de un conjunto de datos tales como la media, la moda y la mediana.

Definición 4.1 (Datos agrupados y los no agrupados) La principal diferencia entre los datos agrupados y los no agrupados es que los agrupados están clasificados según un criterio y los no agrupados se encuentran en el mismo formato que cuando se recopilaron.

Tabla 4.1: Datos agrupados en intervalos.
Clase \(Y_i\) \(f_i\) \(F_i\) \(\ldots\) \(H_i^*\%\)
\([y_1,y_2)\) \(y_1\) \(f_1\) \(\ldots\) \(\ldots\) \(H_1^*\%\)
\([y_2,y_3)\) \(y_2\) \(f_2\) \(\ldots\) \(\ldots\) \(H_1^*\%\)
\([y_3,y_4)\) \(y_3\) \(f_3\) \(\ldots\) \(\ldots\) \(H_1^*\%\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\ldots\) \(\ldots\) \(\vdots\)
\([y_{r-1},y_r]\) \(y_r\) \(f_r\) \(\ldots\) \(\ldots\) \(H_1^*\%\)

4.1 La media

A veces llamada promedio aritmético, es la medida de tendencia central que pondera los datos.

4.1.1 Media de datos no agrupados

Los datos no están agrupados cuando no están ordenados sobre una tabla de distribución de frecuencias. Sean los \(n\) datos \(x_1, x_2, \ldots, x_n\) entonces la media o promedio aritmético se define como

\[ \overline{x}=\frac{x_1+x_2+\cdots+x_n}{n}=\frac{1}{n}\sum_{i=1}^nx_i \]

Ejemplo 4.1 (Media de datos no agrupados) wwwwwww

4.1.2 Media de datos agrupados

Considérese la siguiente tabla de distribución de frecuencias Tabla 4.1 entonces el promedio es \[\overline{x}=\frac{y_1f_1+y_2f_2+\cdots+y_nf_n}{n}=\frac{1}{n}\sum_{i=1}^ny_if_i\]

Ejemplo 4.2 (Media de datos agrupados) Sean los datos

Clase \(Y_i\) \(f_i\) \(Y_i*f_i\)
\([10,15)\) 12.5 1 12.5
\([15,20)\) 17.5 2 35
\([20,25)\) 22.5 5 112.5
\([25,30)\) 27.5 3 82.5
\([30,35]\) 32.5 2 65
\(\sum\) 13 307.5

\[\overline{x}=\frac{12.5+35++112.5+82.5+65}{13}=\frac{307.5}{13}=23.65\]

Ejercicio 4.1 Si el promedio de \(n\) datos es \(\overline{x}\) entonces el promedio del conjunto inicial más un dato adicional \(x_{n+1}\) es \[\overline{x}'=\frac{n\overline{x}+x_{n+1}}{n+1}\] en general si se adicionan \(r\) datos \(y_1, y_2, \ldots y_r\) entonces el nuevo promedio será \[\overline{x}'=\frac{n\overline{x}+y_{1}+y_2+\ldots+y_r}{n+r}\]

Solución. En efecto sea el promedio \[\begin{align*} \overline{x}'&=\frac{x_1+x_2+\cdots+x_{n+1}}{n+1}\\ &=\frac{n\frac{x_1+x_2+\cdots x_n}{n}+x_{n+1}}{n+1}\\ &=\frac{n\overline{x}+x_{n+1}}{n+1} \end{align*}\]

4.2 La moda (Mo)

  • La moda es el valor que tiene mayor frecuencia absoluta.

  • Se representa por \(Mo\)

  • Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, entonces la distribución es bimodal es decir, tiene varias modas.

  • Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.

  • Se puede hallar la moda para variables cualitativas y cuantitativas.

  • Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.

  • Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.

  • Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.Ejemplos de ejercicios de moda

4.2.1 Moda de datos no tabulados

En este caso es dato que más repite en un conjunto de datos dados.

La moda es el dato que más se repite por ejemplo sea el conjunto de datos \(x_1\), \(x_2\), \(x_2\), \(x_2\), \(x_3\) entonces la moda es \(\text{Mo}=x_2\)

Halle la moda de los siguinetes datos 3, 5,3,6,7,3,4,5,5 ya que hay hay precencia de dotas que se repiten dos veces en tonces este conjunto de datos recibe el nombre de datos bimodal Mo=3 y Mo=5

4.2.2 Moda de datos tabulados

La moda es el dato que más se repite por ejemplo sea el conjunto de datos tabulados de la Tabla 4.1 entonces la moda es \[ M_o=L_i+\frac{f_i-f_{i-1}}{(f_i-f_{i-1})+(f_i-f_{i+1})}\cdot a_i\]

  • \(L_i\) es el límite inferior de la clase modal

  • \(f_i\) es la frecuencia absoluta de la clase modal

  • \(f_{i-1}\) es la frecuencia absoluta inmediatamente inferior a la clase modal

  • \(f_{i+1}\) es la frecuencia absoluta inmediatamente posterior a la clase modal

  • \(a_i\) es la amplitud de la clase

Ejemplo 4.3 Sea la tabla

Clase \(f_i\)
\([10,15)\) 2
\([15,20)\) 5
\([20,25)\) 10
\([25,30)\) 3
\([30,35]\) 1

Primeramente la mayor frecuencia absoluta es 10 y corresponde \(f_3=10\) por tanto \(i=3\). \(L_i=20\)

\[ M_o=L_i+\frac{f_i-f_{i-1}}{(f_i-f_{i-1})+(f_i-f_{i+1})}\cdot a_i=\] \[ =20+\frac{10-5}{(10-5)+(10-3)}\cdot 5=20+\frac{5}{12}*5=22.08\]

Más información

4.3 La mediana (Me)

4.3.1 Mediana de datos no tabulados

Obtener la mediana consiste en ordenar los datos de menor a mayor y considerar dos casos: El primero si el número de datos es impar entonces el dato \(x_{\frac{n+1}{2}}\) del conjunto ordenado será la mediana es decir \[\text{Me}=x_{\frac{n+1}{2}}\] de otro lado si el número de datos es par entonces la mediana es la semisuma de los dos datos intermedios es decir \[\text{Me}=\frac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2}\]

Ejemplo 4.4 Sean los conjuntos de datos 5, 6, 8, 2, 1, 5, 6, 7, 10, 0, 14 y 20, 25, 6, 5, 19, 5 obtener la mediana de estos conjuntos de datos.

Al ordenarlos se obtiene el siguiente arreglo 0, 1, 2, 5, 5, 6, 6, 7, 8, 10, 14 y considerando que \(x_1=0\), \(x_2=1\), \(\ldots\), \(x_{11}=14\) en este caso el número de datos es impar entonces el dato \(x_{\frac{11+1}{2}}=x_{6}=6\) el la mediana. De otro lado el segundo conjunto de datos al ser ordenados 5, 5, 6, 19, 20, 25 ademas considerando que \(x_1=5\), \(x_2=5\), \(\ldots\), \(x_6=25\) conducen a obtener la mediana \(\text{Me}=\frac{x_{\frac{6}{2}}+x_{\frac{6}{2}+1}}{2}=\frac{6+19}{2}=12.5\).

4.3.2 Mediana de datos tabulados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. Sea la Tabla 4.1.

Es decir tenemos que buscar el intervalo en el que se encuentre.

\[ M_e=L_{i}+\frac{\frac{N}{2}-F_{i-1}}{f_{i}}\cdot a_{i}\]

\(L_{i}\) es el límite inferior de la clase donde se encuentra la mediana

\(\frac{N}{2}\) es la semisuma de las frecuencias absolutas

\(f_{i}\) es la frecuencia absoluta de la clase mediana

\(F_{i-1}\) es la frecuencia acumulada anterior a la clase mediana

\(a_{i}\) es la amplitud de la clase

La mediana es independiente de las amplitudes de los intervalos

Más información

Ejemplo 4.5 Sea la tabla

Clase \(f_i\) \(F_i\)
\([10,15)\) 1 1
\([15,20)\) 2 3
\([20,25)\) 5 8
\([25,30)\) 3 11
\([30,35]\) 1 12
\(\sum\) 12

\[\frac{N}{2}=12/2=6\] ubicando en las frecuencias absolutas acumuladas que corresponde al intervalo \([20,25)\)

\[ M_e=L_{i}+\frac{\frac{N}{2}-F_{i-1}}{f_{i}}\cdot a_{i}\] \[ =20+\frac{\frac{12}{2}-3}{5}\cdot 5=23\] por lo tanto la mediana de este conjunto de datos tabulados (agrupados) es \(Me=23\)

4.4 Asignación

Halle le media, la moda y la mediana de los siguientes datos tabulados

Clase \(Y_i\) \(f_i\) \(F_i\)
\([100,150)\) 1 1
\([150,200)\) 2 3
\([200,250)\) 5
\([250,300)\) 7
\([300,350]\) 10
\([350,400]\) 6
\([400,450]\) 5
\([450,500]\) 2
\([500,550]\) 1

\[\overline{x}=\frac{y_1f_1+y_2f_2+\cdots+y_nf_n}{n}=\frac{1}{n}\sum_{i=1}^ny_if_i\]

\[ M_o=L_i+\frac{f_i-f_{i-1}}{(f_i-f_{i-1})+(f_i-f_{i+1})}\cdot a_i\]

\[ M_e=L_{i}+\frac{\frac{N}{2}-F_{i-1}}{f_{i}}\cdot a_{i}\]