1. Estudio Estadístico
2. Población y muestra
3. Variables estadísticas
4. Tablas de frecuencias y gráficos estadísticos
5. Parámetros de centralización
6. Parámetros de dispersión
7. Parámetros de posición
8. Estadística bidimensional
9. Vídeos
1. Estudio estadístico
Para llevar a cabo un estudio estadístico debemos:
1. Seleccionar las características que queremos analizar. Es importante determinar qué tipo de variables representan esas características. Por ejemplo, en nuestro estudio sobre la vida saludable podemos preguntar número de días que se hace ejercicio o tipo de frutas que más nos gusta.
2. Realizar una encuesta para recabar información sobre las características que queremos estudiar.
3. Organizar la información en tablas de frecuencias.
4. Realizar gráficos estadísticos que representen la información más relevante.
5. Estudiar los parámetros estadísticos para comprender los datos.
6. Sacar conclusiones sobre los datos estudiados.
2. Población y muestra
La población y la muestra son dos términos estadísticos que nos hablan de quiénes o qué forman parte del estudio.
Población: conjunto de personas o elementos a los que va dirigida la encuesta o estudio
Muestra: conjunto de personas o elementos que forman parte de la encuesta o estudio
Ejemplo 1
Por ejemplo, para saber que marca de coche prefieren los españoles se encuesta a un grupo de 1.000 personas.
La población del estudio son todos los españoles.
La muestra son las 1000 personas encuestados.
Ejemplo 2
Se plantea un estudio en un instituto sobre los hábitos de vida saludable de los alumnos. En el instituto hay 1580 alumnos pero se pasa una encuesta a 500 de ellos.
La población del estudio son los 1580 estudiantes del instituto.
La muestra son los 500 estudiantes encuestados.
Actividades
Ejercicio 1: Indica la población y la muestra en los siguientes casos:
a) Para analizar las temperaturas máximas diarias de abril en Andalucía, se registran las temperaturas máximas de 5 días seguidos.
b) En un colegio se quiere saber qué porcentaje del alumnado está estudiado una carrera universitaria en los últimos 10 años. Para ello, encuestan a diez ex-alumnos cada año.
c) Se ha realizado una encuesta telefónica a 120 personas para conocer los programas preferidos de televisión de los habitantes de San Isidro.
d) Una organización protectora de animales ha realizado una encuesta a 1000 familias para saber qué tipo de mascotas tienen los habitantes de la ciudad.
e) Una empresa de transportes pregunta a sus 50 clientes por la eficacia en el servicio.
SOLUCIONES
3. Variables estadísticas
Existen dos tipos :
Variables cuantitativas: vienen dadas por números. Este tipo de variables pueden ser discretas o continuas.
Las discretas están asociadas a números enteros, por ejemplo, número de libros leídos el último mes. En este caso las respuestas pueden ser 0, 1, 2 o 3. Este tipo de variables se utilizan cuando las respuestas obtenidas en un estudio se repiten.
Las continuas vienen dadas por valores que pueden organizarse en intervalos. Están asociadas a números decimales, por ejemplo, estaturas de los alumnos de 4ºESO. En este caso las posibles respuestas no tienen por qué repetirse, es decir, las estaturas pueden ser todas diferentes. Por tanto, los datos se agrupan en intervalos: 150cm-160cm, 161cm-170cm, etc.
Variables cualitativas: vienen dadas por palabras. Por ejemplo, color de pelo de los estudiantes de 4ºESO.
Ejemplo
Se plantea un estudio en un instituto sobre los hábitos de vida saludable de los alumnos. En el instituto hay 1580 alumnos pero se pasa una encuesta a 500 de ellos.
Las variables que se estudiarán y por tanto serán las preguntas de la encuesta son:
El peso de los estudiantes: se trata de una variable cuantitativa continua. Los pesos de los alumnos pueden estar dentro del intervalo 50 kg – 100 kg. Algunos alumnos pesarán 50 kg, otros 70,5 kg, otros 63,8 kg, etc.
El número de días a la semana que van al gimnasio: se trata de una variable cuantitativa discreta. Pueden ir 1 días, 2 días, 5 días o ninguno.
Cómo llegan al centro escolar: se trata de una variable cualitativa. Los alumnos llegan al centro en autobús, en coche o andando.
Actividades
Ejercicio 2: Clasifica las siguientes variables en cuantitativas discretas, continuas o cualitativas
Edad de un grupo de alumnos de 4ºESO, Estado civil, Peso de un grupo de 20 personas, Color preferido, Litros de lluvia en un mes en toda Andalucía, Número de mascotas de una familia.
SOLUCIONES
4. Tablas de frecuencia y gráficos estadísticos
Para cada pregunta de la encuesta o estudio tenemos una variable, con sus posibles resultados, a los que se llama datos estadísticos. El total de datos estadísticos se nota con la letra N.

Ejemplo 1: variable discreta
Se ha preguntado a 20 personas por el número de calzado que usa. Las respuestas son las siguientes: 39 40 36 38 42 38 41 42 39 41 38 37 39 42 40 38 40 41 38 39
Ejemplo 2: variable continua
Se ha preguntado a 20 personas por sus pesos. Las respuestas han sido 60 66 72 75 90 81 78 69 83 99 65 74 71 87 88 68 94 95 77 75
Como vemos los datos no se repiten. Por tanto para realizar la tabla de frecuencias primero organizamos los datos en intervalos semicerrados.
¿Cómo se hace?
Paso 1: Calculo el rango, la diferencia entre el mayor y el menor dato.
Rango = 99 – 60 = 39
Paso 2: Calculo el número de intervalos (m) raíz cuadrada de 20 = 4,47.
Entonces habrá m = 5 intervalos (redondeo).
Paso 3: Calculo la longitud del intervalo: L = Rango : m = 39 : 5 = 7,8
Entonces la longitud del intervalo será 8 (redondeo).
Así, los intervalos son: [60,68), [68,76), [76,84), [84,92), [92,100)
Al trabajar con variables continuas es importante elegir una marca de clase, es decir, un valor que será el representante de cada intervalo. Esa marca de clase se calcula como el punto medio de cada intervalo (se suman los extremos y se divide entre 2).
[60,68) marca de clase (60+68) : 2 = 64
[68,76) marca de clase (68+76) : 2 = 72
[76,84) marca de clase (84+92) : 2 = 80
[84,92) marca de clase (84 + 92) : 2 = 88
[92,100) marca de clase (92 + 100) : 2 = 96
Ahora ya podemos completar la tabla
Gráficos estadísticos
Los datos recogidos en las tablas se pueden representar con diferentes gráficos estadísticos.
Diagrama de barras: en el eje x se representan los datos y el eje y se representan las frecuencias absolutas de cada uno. Se llama diagrama de barras porque los datos del eje x se unen con una barra en el eje y. Se suele utilizar para variables discretas.
Histogramas: Es un diagrama de barras en el que se representan variables continuas.
Polígono de frecuencia: Se obtienen al unir el punto medio de cada barra del histograma.
Diagrama de sectores: se trata de un círculo dividido en sectores. Cada sector expresa el porcentaje de encuestados que ha elegido cada uno de los valores de la variable. Suelen utilizarse con variables cualitativas.




Actividades
Ejercicio 3: Al tirar un dado 30 veces se obtienen los siguientes resultados
3 2 4 2 2 3 4 1 1 6 3 2 2 2 4 5 3 4 4 3 2 4 5 1 4 4 4 1 1 4
Realiza la tabla de frecuencias y el diagrama de barras.
Ejercicio 4: Se ha preguntado a 20 personas qué mascota tenían en casa. Los resultados son los siguientes:
Gato Perro Canario Tortuga Perro Gato Perro Gato Canario Perro Tortuga Gato Perro Canario Perro Gato Perro Gato Gato Perro
Realiza la tabla de frecuencias y el diagrama de sectores.
Ejercicio 5: Se ha preguntado el peso de un grupo de 20 personas. Se han obtenido los siguientes resultados
60 63 75 80 55 67 79 75 100 95 86 74 63 92 90 78 69 94 72 65
Realiza la tabla de frecuencias y el polígono de frecuencias.
SOLUCIONES
Comprueba tus soluciones
Ejercicio 3
Ejercicio 4
Ejercicio 5
5. Parámetros de centralización
Los parámetros de centralización son valores en torno a los cuales están agrupados los datos, es decir, los valores centrales de la muestra y representan a toda la población del estudio. Hay tres parámetros de centralización.
Media aritmética (M): Valor promedio del conjunto de datos. Nos indica el valor que tendría cada dato estadístico si todos valiesen lo mismo.
¿Cómo se calcula? Se suman todos los datos y se divide entre el número total de datos.
Moda (Mo): el dato de la muestra con más frecuencia absoluta, es decir, el dato que más se repite.
¿Cómo se calcula? Se busca en la tabla de frecuencias el valor con mayor frecuencia absoluta.
Mediana (Me): Con los datos ordenados de menor a mayor, la mediana es el valor central de la muestra, el valor que tiene antes y después el mismo número de datos.
¿Cómo se calcula? Se ordenan los datos de menor a mayor. Si el número de datos es impar se busca el valor que esté en la posición central. Si es par, se calcula la media de los dos valores centrales.
Ejemplo Media
Ejemplo Moda

Ejemplo Mediana
Actividades
SOLUCIONES
6. Parámetros de dispersión
Son parámetros que informan sobre la dispersión de los datos respecto de la media.
Varianza (S²): Indica en qué medida los datos están alejados de la media. Si la varianza es cercana a cero, entonces los datos están agrupados cerca de la media. Si la varianza es un número grande, entonces los datos están alejados de la media. Se calcula con la siguiente fórmula

Para calcular la varianza de una muestra no hace falta aplicar la fórmula, se puede obtener a partir de la tabla de frecuencias, mira el ejemplo.
Desviación típica (𝛔): Es la raíz cuadrada de la varianza.
Coeficiente de variación (CV): Es el cociente entre la desviación típica y la media. Si lo multiplicamos por 100 obtenemos un porcentaje que nos indica el nivel de dispersión de la muestra.
Ejemplo
Actividades
nn
SOLUCIONES
7. Parámetros de posición
Los cuartiles son valores que dividen los datos en cuatro partes iguales
- El 1º cuartil Q1 deja a la izquierda el 25% de los datos y el 75% a la derecha.
- El 2º cuartil Q2 deja a la izquierda el 50% de los datos y el otro 50% a la derecha. Coincide con la mediana.
- El 3º cuartil Q3 deja a la izquierda el 75% de los datos y el 25% a la derecha.
Para calcular los cuartiles debemos mirar en la tabla de frecuencias las frecuencias acumuladas.
Para poder representar los cuartiles de un modo adecuado se utiliza el diagrama de caja y bigotes.
Ejemplo
Actividades
nn
SOLUCIONES
8. Estadística bidimensional
8.1. Tablas de doble entrada
En un estudio estadístico es habitual querer estudiar si las variables están relacionadas, es decir, si los resultados de una variable dependen de los resultados de otra.
Las variables bidimensionales se representan en tablas de doble entrada.
Ejemplo
8.2. Diagrama de dispersión
Las variables bidimensionales pueden representarse en un diagrama de dispersión o nube de puntos, es decir, cada par de las variables X e Y corresponde a un punto del plano.
Ejemplo

8.3. Correlación
La relación entre las variables puede deducirse del diagrama de dispersión.
Si los puntos del diagrama están dispuestos en el plano de forma que nos recuerden una recta, hablamos de correlación lineal. El tipo de correlación puede ser fuerte, débil o nula.
Ejemplo
