Estadística
 
    Página Principal
     
 
           
 

TABLAS Y GRAFICAS
PARA VARIABLES CUANTITATIVAS

 
 

INTRODUCCIÓN

Las variables cuantitativas son organizadas de una manera más precisa por su contenido numérico, los tipos de continuas son:
  • Discretas
  • Contínuas
Cuando el número de datos es grande, es conveniente organizar los datos numéricos en un arrego ordenado o diagrama de tallo y hojas para ayudar a comprender la información.
El aprendizaje de esta unidad se va a centrar en la organización de variables continuas, en su mayoría contínuas.

ARREGLO ORDENADO

Una vez que las encuestas se encuentran listas, el siguiente paso es organizar la información y ordenarla.
  • Por cada variable se hace un ordenamiento simple
  • Determinar cuál es el dato que tiene el menor valor y cual es el que tiene mayor valor es información vital para empezar a trabajar con variables cuantitativas.
EJEMPLO
Suponga que decide llevar a cabo un estudio comparativo del costo de una comida en un restaurante de una gran ciudad con el de una comida similar en un restaurante fuera de la ciudad. La siguiente tabla muestra los datos de 50 restaurantes citadinos y 50 fuera de la ciudd. Los datos no están ordenados, esta organización hace difícil obtener conclusiones sobre el precio de las comidas en las dos áreas geográficas.
Ejemplo 1
Al ordenar ambas muestras, los resultados se mostrarán de la siguiente manera:
Ejemplo 1

 

RANGO

En una muestra o población, el rango es la distancia entre el dato mayor y el dato menor, se calcula restando ambos datos.
Rango = DatoMayor - DatoMenor
EJEMPLO
Calcular el rango de las muestras sobre el precio de los platos en los restaurantes, según se muestra en la lista de datos.
Ejemplo 1
Al ordenar ambas muestras, los resultados se mostrarán de la siguiente manera:
Ejemplo 1
Muestra 1: Precio de plato en 50 restaurantes de la ciudad

Rango = Dato mayor - Dato menor

Rango= 63 - 14

Rango = 49

Muestra 2: Precio de plato en 50 restaurantes fuera de la ciudad

Rango = Dato mayor - Dato menor

Rango = 55 - 23

Rango = 32

DISTRIBUCIÓN DE FRECUENCIAS

Sin importar si los datos están o no ordenados, siempre es posible crear una distribución de frecuencias para los datos de una variable de una muestra.
La distribución de frecuencias es una tabla de resumen en la cual los datos se colocan en agrupamientos o clases en forma conveniente y ordenadas numéricamente.
Se organiza en filas y columnas para resumir la información y poder realizar interpretaciones de manera rápida y efectiva.

En el caso de las variables continuas, una distribución de frecuencias está formada por una columna donde se ubican las características de cada caso y otra columna donde se coloca la frecuencia de ocurrencia de cada caso.

En la primer fila se colocan los encabezados que corresponden a la variable cuantitativas en proceso de estudio y las veces que repite por cada encuesta procesada.

 

Distribucion 1

COLUMNA 1: Irá el nombre de la variable que se está analizando

COLUMNA 2: Irá las veces que se repiten los datos con las mismas características de la variable y se le conoce con el nombre de frecuencia.

 

Distribucion 2

Como la variabe es cuantitativa, se trata de valores numéricos y si éstos son más de 10 datos diferentes, es conveniente hacer grupos para administratrlos con eficiencia. A cada grupo de datos se le llama Intervalo.

Un intervalo es como un rango, tiene un dato mayor y un dato menor y el estilo de representación puede ser de varias maneras, las más generalizadas son dos.

Para determinar el número de intervalos para una distribución, se calcula con la información del valor del Rango.

 

Distribucion 3

La información en cada intervalo debe ser única.

Se sugiere que una distribución de frecuencias no debe tener menos de 5 intervalos, ni más de 15.

Si no se sigue esta convención, la interpretación de los datos puede ser demasiado condensada o muy dispersa y en ambos casos los resultados aunque están bien, no son objetivos. Y puede afectar la toma de decisiones.

  Distribución

Determinar el número de intervalos que sirva a una muestra se basa en la experiencia o sentido común de la persona que va a generar la distribución de frecuencias.

Se sugiere que una distribución de frecuencias no debe tener menos de 5 intervalos, ni más de 15.

Si no se sigue esta convención, la interpretación puede ser demasiado condensada o muy dispersa y en ambos casos los resultados aunque están bien no son objetivos y puede afectar la interpretación o la toma de decisiones.

Los datos por ser numéricos pueden ir de 100 a 1000, 10,000, etc.

Un intervalo es similar al rango, tiene un dato mayor y un dato menor, sólo que la distancia entre ellos recibe el nombre de Amplitud.

La amplitud de cada intervalo se calcula dividiendo el rango entre el número de intervalos que el responsable del trabajo lo determine. Se a convenido que todos los intervalos tienen que ser de la misma amplitud. El cálculo de la amplitud se hace de la siguiente manera:
Formula amplitud
La mayoría de las veces la amplitud de un intervalo es mejor trabajarla con una amplitud que sea un número entero (depende de los valores que tomen los datos).
Si el resultado de la división es decimal, se redondea el resultado de la siguiente manera:
  • Si el resultado es menor de 0.5 se elimina la parte decimal
  • En caso contrario se pasa al próximo dígito
El procedimiento usual para generar una distribución de frecuencias es el siguiente:
  • Calcular el rango
  • Elegir el número de intervalos
  • Calcular la amplitud de cada intervalo
  • Determinar el primer valor de la distribución de frecuencias
  • Generar los intervalos o clases
  • Determinar la frecuencia de cada intervalo
EJEMPLO

muestra de los datos de 50 restaurantes citadinos con relación al precio de los platos

El primere paso de la construcción de frecuencias es ordenar los datos en orden ascendente, de la siguiente manera:

Como la muestra es pequeña, lo más conveniente es construirla con 5 intervalos.
Dato Mayor
=
63
Dato Menor
=
14
Rango
=
49
Intervalos
=
7
amplitud
=
49/7
=
7
  • La amplitud de cada intervalo será de 7 unidades.
  • En este caso, lo mejor es iniciar el primer intervalo con el dato menor de la muestra que es 14
  • A 14 se le suma la amplitud que resultó ser 7
    • 14 + 7 = 21
    • Intervalo : 14 pero menos de 21
  • A 21 se le suma la amplitud 7
    • 21 + 7 = 28
    • Intervalo : 21 pero menos de 28
  • A 28 se le suma la amplitud 7
    • 28 + 7 = 35
    • Intervalo : 28 pero menos de 35
  • A 35 se le suma la amplitud 7
    • 35 + 7 = 42
    • Intervalo : 35 pero menos de 42
  • A 42 se le suma la amplitud 7
    • 42 + 7 = 49
    • Intervalo : 42 pero menos de 49
  • A 49 se le suma la amplitud 7
    • 49 + 7 = 56
    • Intervalo : 49 pero menos de 56
  • A 56 se le suma la amplitud 7
    • 56 + 7 = 63
    • Intervalo : 56 pero menos de 63
  • A 63 se le suma la amplitud 7
    • 63 + 7 = 70
    • Intervalo : 63 pero menos de 70
  • Resultaron 8, ahora serán colocados en la primera columna de la tabla, cuya variable es "Precio por plato".

Para calcular las frecuencias se revisa en los datos de la muestra cuantos datos son iguales al límite menor pero menores que el límite superior y en la columna de las frecuencias de escribe el número correspondiente.

El valor de las frecuencias siempre es una variable discreta.

   

FRONTERAS DE CLASE

Es otro nombre que se le da a los límites menor y mayor de cada intervalo; el límite menor se incluye como parte del intervalo, pero el mayor no forma parte de él porque se determina que son los menore que el límite superior o mayor.
EJEMPLO
En el ejemplo anterior, la distribución de frecuencias está formada por 8 intervalos que empiezan en US$14.00 y terminan en US$70.00 y se calcularán las fronteras reales de la siguiente manera:

FRONTERA REAL DE CLASE

Es un intervalo definido de la manera más exacta con el dato mayor que éste puede ostentar, se presentan varias caracteerísticas:
  • Númericamente, "antes de A" no es un número para un computador
  • Se establece el límite superior de acuerdo a la fórmula de los datos.
  • Si los datos de los intervalos son enteros, se busca el número más cercano al límite superior.
  • Si el intervalo es "De 10 a menos de 20" y los datos de la encuesta tienen dos decimales, entonces al límite superior se le resta 0.01 y se obtiene la frontera real superior.
  • Si el intervalo es "De 100 a menos de 200" y los datos tienen 1 decimal, entonces al la frontera superior se le resta 0.1 y se obtiene 19.9 como frontera superior
  • La frontera inferior siempre es la misma.
EJEMPLO
En el ejemplo anterior, la distribución de frecuencias está formada por 8 intervalos que empiezan en US$14.00 y terminan en US$70.00; se calcularán las fronteras reales a una distancia de 0.1 del límite superior, de la siguiente manera:

MARCA DE CLASE

Es el punto medio de un intervalo de clase, se calcula sumando sus fronteras y dividiendo el resultado entre 2. Es decir, el intervalo es dividio a la mitad.
Marca de Clase
Es una marca de clase por cada intervalo.
EJEMPLO
Siempre con la muestra de los precios de los platos de 50 restaurantes citadinos, se calculará la marca de clase de cada intervalo.

FRECUENCIA RELATIVA

La frecuencia relativa es la proporción de la frecuencia que corresponde un intervalo con relación al tamaño de la muestra. Se calcula dividiendo la frecuencia del intervalo entre el total de datos de la muestra.
Frecuencia relativa
La frecuencia es una herramienta que permite hacer comparaciones entre muestras de diferente tamaño.
EJEMPLO
Siempre con la muestra de los precios de los platos de 50 restaurantes citadinos, se calculará la frecuencia relativa de cada intervalo.

FRECUENCIA ACUMULADA

La frecuencia acumulada es la suma parcial de cada intervalo, permite hacer observaciones sobre grupos de intervalos que están por debajo de él.
Para calcular la frecuencia acumulada se puede seguir el siguiente proceso:
  • Se suman todas la frecuencias para obtener el tamaño de la muestra
  • El primer intervalo acumulado es igual a la frecuencia del primer intervalo
  • Se suma la frecuencia de un intervalo con todas las frecuencias de los intervalor anteriores anteriores
  • La frecuencia acumulada de cada intervalo nunca es menor que el valor del intervalo anterior.
  • El último intervalo debe ser igual al tamaño de la muestra (la suma de todas las frecuencias)
EJEMPLO
Siempre con la muestra de los precios de los platos de 50 restaurantes citadinos, se calculará la marca de clase de cada intervalo.

FRECUENCIA PORCENTUAL

La frecuencia porcentual es la misma frecuencia relativa pero en formato de porcentaje (%). El total de la muestra siempre es 100%
La frecuencia porcentual se puede calcular tanto para frecuencias simples como para las acumuladas. Para convertir una frecuencia relativa en porcentual solamente se multiplica la frecuencia relativa por 100.
Frecuencia porcentual
EJEMPLO
Seguimos con la muestra de los precios de los platos de 50 restaurantes citadinos, se calculará la frecuencia porcentual (%) de cada intervalo.

 

 

           
 

ACTIVIDADES

 

Ejemplo 02B

 

Ejercicio 02B

 

Lectura 02B

 

Tarea 02B

 

Investigación 02B

 

Prueba

 

 

     
 
Página Principal
 
 

2 - 2008