INTRODUCCIÓN |
Las variables cuantitativas son organizadas de una manera más precisa por su contenido numérico, los tipos de continuas son: |
|
|
Cuando el número de datos es grande, es conveniente organizar los datos numéricos en un arrego ordenado o diagrama de tallo y hojas para ayudar a comprender la información. |
El aprendizaje de esta unidad se va a centrar en la organización de variables continuas, en su mayoría contínuas. |
ARREGLO ORDENADO
|
Una vez que las encuestas se encuentran listas, el siguiente paso es organizar la información y ordenarla. |
-
Por cada variable se hace un ordenamiento simple
-
Determinar cuál es el dato que tiene el menor valor y cual es el que tiene mayor valor es información vital para empezar a trabajar con variables cuantitativas.
|
| EJEMPLO |
| Suponga que decide llevar a cabo un estudio comparativo
del costo de una comida en un restaurante de una
gran ciudad con el de una comida similar en un
restaurante fuera de la ciudad. La siguiente tabla
muestra los datos de 50 restaurantes citadinos
y 50 fuera de la ciudd. Los datos no están
ordenados, esta organización hace difícil
obtener conclusiones sobre el precio de las comidas
en las dos áreas geográficas. |
|
| Al ordenar ambas muestras, los resultados se mostrarán de la siguiente manera: |
|
|
|
RANGO |
En una muestra o población, el rango es la distancia entre el dato mayor y el dato menor, se calcula restando ambos datos. |
Rango = DatoMayor - DatoMenor |
| EJEMPLO |
| Calcular el rango de las muestras sobre el precio de los platos en los restaurantes, según se muestra en la lista de datos. |
|
| Al ordenar ambas muestras, los resultados se mostrarán de la siguiente manera: |
|
| Muestra 1: Precio de plato en 50 restaurantes de la ciudad |
Rango = Dato mayor - Dato menor
|
Rango= 63 - 14
|
Rango = 49
|
| Muestra 2: Precio de plato en 50 restaurantes fuera de la ciudad |
Rango = Dato mayor - Dato menor
|
Rango = 55 - 23
|
Rango = 32
|
|
|
DISTRIBUCIÓN DE FRECUENCIAS
|
Sin importar si los datos están o no ordenados, siempre es posible crear una distribución de frecuencias para los datos de una variable de una muestra. |
La distribución de frecuencias es una tabla de resumen en la cual los datos se colocan en agrupamientos o clases en forma conveniente y ordenadas numéricamente. |
Se organiza en filas y columnas para resumir la información y poder realizar interpretaciones de manera rápida y efectiva. |
En el caso de las variables continuas, una distribución de frecuencias está formada por una columna donde se ubican las características de cada caso y otra columna donde se coloca la frecuencia de ocurrencia de cada caso.
En la primer fila se colocan los encabezados que corresponden a la variable cuantitativas en proceso de estudio y las veces que repite por cada encuesta procesada.
|
|
|
COLUMNA 1: Irá el nombre de la variable que se está analizando
COLUMNA 2: Irá las veces que se repiten los datos con las mismas características de la variable y se le conoce con el nombre de frecuencia. |
|
 |
Como la variabe es cuantitativa, se trata de valores numéricos y si éstos son más de 10 datos diferentes, es conveniente hacer grupos para administratrlos con eficiencia. A cada grupo de datos se le llama Intervalo.
Un intervalo es como un rango, tiene un dato mayor y un dato menor y el estilo de representación puede ser de varias maneras, las más generalizadas son dos.
Para determinar el número de intervalos para una distribución, se calcula con la información del valor del Rango. |
|

La información en cada intervalo debe ser única. |
Se sugiere que una distribución de frecuencias no debe tener menos de 5 intervalos, ni más de 15.
Si no se sigue esta convención, la interpretación de los datos puede ser demasiado condensada o muy dispersa y en ambos casos los resultados aunque están bien, no son objetivos. Y puede afectar la toma de decisiones. |
|
 |
|
Determinar el número de intervalos que sirva a una muestra se basa en la experiencia o sentido común de la persona que va a generar la distribución de frecuencias. |
Se sugiere que una distribución de frecuencias no debe tener menos de 5 intervalos, ni más de 15.
Si no se sigue esta convención, la interpretación puede ser demasiado condensada o muy dispersa y en ambos casos los resultados aunque están bien no son objetivos y puede afectar la interpretación o la toma de decisiones.
Los datos por ser numéricos pueden ir de 100 a 1000, 10,000, etc.
Un intervalo es similar al rango, tiene un dato mayor y un dato menor, sólo que la distancia entre ellos recibe el nombre de Amplitud.
|
La amplitud de cada intervalo se calcula dividiendo el rango entre el número de intervalos que el responsable del trabajo lo determine. Se a convenido que todos los intervalos tienen que ser de la misma amplitud. El cálculo de la amplitud se hace de la siguiente manera: |
|
La mayoría de las veces la amplitud de un intervalo es mejor trabajarla con una amplitud que sea un número entero (depende de los valores que tomen los datos). |
Si el resultado de la división es decimal, se redondea el resultado de la siguiente manera: |
|
|
El procedimiento usual para generar una distribución de frecuencias es el siguiente: |
-
Calcular el rango
-
Elegir el número de intervalos
-
Calcular la amplitud de cada intervalo
-
Determinar el primer valor de la distribución de frecuencias
-
Generar los intervalos o clases
-
Determinar la frecuencia de cada intervalo
|
EJEMPLO |
muestra de los datos de 50 restaurantes citadinos
con relación al precio de los platos |
|
El primere
paso de la construcción de frecuencias
es ordenar los datos en orden ascendente, de
la siguiente manera: |

|
Como
la muestra es pequeña, lo más
conveniente es construirla con 5 intervalos.
|
Dato
Mayor |
= |
63 |
Dato
Menor |
= |
14 |
Rango |
= |
49 |
Intervalos |
= |
7 |
amplitud |
= |
49/7 |
|
= |
7 |
|
- La amplitud de cada
intervalo será de 7 unidades.
- En este caso, lo mejor
es iniciar el primer intervalo con el dato
menor de la muestra que es 14
- A 14 se le suma la amplitud
que resultó ser 7
- 14 + 7 = 21
- Intervalo : 14 pero menos de 21
- A 21 se le suma la amplitud 7
- 21 + 7 = 28
- Intervalo : 21 pero menos de 28
- A 28 se le suma la amplitud 7
- 28 + 7 = 35
- Intervalo : 28 pero menos de 35
- A 35 se le suma la amplitud 7
- 35 + 7 = 42
- Intervalo : 35 pero menos de 42
- A 42 se le suma la amplitud 7
- 42 + 7 = 49
- Intervalo : 42 pero menos de 49
- A 49 se le suma la amplitud 7
- 49 + 7 = 56
- Intervalo : 49 pero menos de 56
- A 56 se le suma la amplitud 7
- 56 + 7 = 63
- Intervalo : 56 pero menos de 63
- A 63 se le suma la amplitud 7
- 63 + 7 = 70
- Intervalo : 63 pero menos de 70
- Resultaron 8, ahora serán colocados
en la primera columna de la tabla, cuya
variable es "Precio por plato".
|
 |
Para
calcular las frecuencias se revisa en
los datos de la muestra cuantos datos
son iguales al límite menor pero
menores que el límite superior
y en la columna de las frecuencias de
escribe el número correspondiente.
El valor de las frecuencias siempre es
una variable discreta. |
| |
|
|
|
|
FRONTERAS DE CLASE |
Es otro nombre que se le da a los límites menor y mayor de cada intervalo; el límite menor se incluye como parte del intervalo, pero el mayor no forma parte de él porque se determina que son los menore que el límite superior o mayor. |
| EJEMPLO |
En el ejemplo anterior, la distribución
de frecuencias está formada por 8 intervalos
que empiezan en US$14.00 y terminan en US$70.00
y se calcularán las fronteras reales
de la siguiente manera: |
|
|
|
FRONTERA REAL DE CLASE |
Es un intervalo definido de la manera más exacta con el dato mayor que éste puede ostentar, se presentan varias caracteerísticas: |
- Númericamente, "antes de A" no es un número para un computador
- Se establece el límite superior de acuerdo a la fórmula de los datos.
- Si los datos de los intervalos son enteros, se busca el número más cercano al límite superior.
- Si el intervalo es "De 10 a menos de 20" y los datos de la encuesta tienen dos decimales, entonces al límite superior se le resta 0.01 y se obtiene la frontera real superior.
- Si el intervalo es "De 100 a menos de 200"
y los datos tienen 1 decimal, entonces al la frontera
superior se le resta 0.1 y se obtiene 19.9 como frontera
superior
- La frontera inferior siempre es la misma.
|
| EJEMPLO |
| En el ejemplo anterior, la distribución
de frecuencias está formada por 8 intervalos
que empiezan en US$14.00 y terminan en US$70.00;
se calcularán las fronteras reales a
una distancia de 0.1 del límite superior,
de la siguiente manera: |
|
|
|
MARCA DE CLASE |
| Es el punto medio de un intervalo de clase, se calcula sumando sus fronteras y dividiendo el resultado entre 2. Es decir, el intervalo es dividio a la mitad. |
|
| Es una marca de clase por cada intervalo. |
| EJEMPLO |
| Siempre con la muestra de los precios de los
platos de 50 restaurantes citadinos, se calculará
la marca de clase de cada intervalo. |
|
|
|
FRECUENCIA RELATIVA |
| La frecuencia relativa es la proporción de la frecuencia que corresponde un intervalo con relación al tamaño de la muestra.
Se calcula dividiendo la frecuencia del intervalo entre el total de datos de la muestra. |
|
| La frecuencia es una herramienta que permite hacer comparaciones entre muestras de diferente tamaño. |
| EJEMPLO |
| Siempre con la muestra de los
precios de los platos de 50 restaurantes
citadinos, se calculará
la frecuencia relativa de cada
intervalo. |
|
|
|
|
|
FRECUENCIA ACUMULADA |
| La frecuencia acumulada es la suma parcial de cada intervalo, permite hacer observaciones sobre grupos de intervalos que están por debajo de él. |
| Para calcular la frecuencia acumulada se puede seguir el siguiente proceso: |
- Se suman todas la frecuencias para obtener el tamaño de la muestra
- El primer intervalo acumulado es igual a la frecuencia del primer intervalo
- Se suma la frecuencia de un intervalo con todas las
frecuencias de los intervalor anteriores anteriores
- La frecuencia acumulada de cada intervalo nunca es menor que el valor del intervalo anterior.
- El último intervalo debe ser igual al tamaño de la muestra (la suma de todas las frecuencias)
|
| EJEMPLO |
| Siempre con la muestra de los precios de los platos
de 50 restaurantes citadinos, se calculará
la marca de clase de cada intervalo. |
|
|
|
FRECUENCIA PORCENTUAL |
| La frecuencia porcentual es la misma frecuencia relativa pero en formato de porcentaje (%). El total de la muestra siempre es 100% |
| La frecuencia porcentual se puede calcular tanto para frecuencias simples como para las acumuladas. Para convertir una frecuencia relativa en porcentual solamente se multiplica la frecuencia relativa por 100. |
|
| EJEMPLO |
| Seguimos con la muestra de los precios de los
platos de 50 restaurantes citadinos, se calculará
la frecuencia porcentual (%) de cada intervalo. |
|
|
|