1. ¿Qué es la Estadística?
La Estadística es una ciencia que estudia las características de un conjunto de casos para hallar en ellos regularidades en el comportamiento, que sirven para describir el conjunto y para efectuar predicciones.
La Estadística tiene por objeto recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto de objetos, personas, procesos, etc. A través de la cuantificación y el ordenamiento de los datos intenta explicar los fenómenos observados, por lo que resulta una herramienta de suma utilidad para la toma de decisiones.
2. Conceptos básicos
En cualquier trabajo en el que se aplique, la estadística debe hacer referencia a un conjunto de entidades, conocido como población.
Población o Universo: es el total del conjunto de elementos u objetos de los cuales se quiere obtener información. Aquí el término población tiene un significado mucho más amplio que el usual, ya que puede referirse a personas, cosas, actos, áreas geográficas e incluso al tiempo.
La población debe estar perfectamente definida en el tiempo y en el espacio, de modo que ante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no de la población bajo estudio. Por lo tanto, al definir una población, se debe cuidar que el conjunto de elementos que la integran quede perfectamente delimitado. Si, por ejemplo, estamos analizando las escuelas primarias, debemos especificar cuáles y cuándo: escuelas primarias de la Capital Federal, año 1992.
El tamaño de una población viene dado por la cantidad de elementos que la componen.
Unidad de análisis: es el objeto del cual se desea obtener información. Muchas veces nos referimos a las unidades de análisis con el nombre de elementos. En estadística, un elemento o unidad de análisis puede ser algo con existencia real, como un automóvil o una casa, o algo más abstracto como la temperatura o un intervalo de tiempo. Dada esta definición, puede redefinirse población como el conjunto de unidades de análisis.
Muestra: es un subconjunto de unidades de análisis de una población dada, destinado a suministrar información sobre la población. Para que este subconjunto de unidades de análisis sea de utilidad estadística, deben reunirse ciertos requisitos en la selección de los elementos.
Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la población que se defina tenga tamaño infinito, y en consecuencia, no fuera posible observar a todos sus elementos. En otras ocasiones, el costo de la observación exhaustiva puede ser muy elevado, el tiempo de recolección de la información muy extenso, o más aún, la observación de los elementos puede ser destructiva. Por ejemplo, si quisiéramos hacer un estudio de la calidad de una partida de fósforos, no podríamos probarlos a todos pues los destruiríamos.
Variable: es la cualidad o cantidad medible que se estudia de las unidades de análisis y que varían de una unidad a otra. Por ejemplo: edad, ingreso de un individuo, sexo, cantidad de lluvia caída, etc.
Nivel de medición: las variables pueden ser medidas con mayor o menor grado de precisión según la escala de medida utilizada para su observación. Podemos distinguir los siguientes niveles de medición de una variable:
· Nominal: sólo permite clasificar a las unidades de análisis en categorías. Por ejemplo: sexo –varón y mujer -.
· Ordinal: además de clasificar a los elementos en distintas categorías, permite establecer una relación de orden de las mismas. Por ejemplo: clase social –baja, media y alta-.
· Intervalar: permite clasificar, ordenar y medir la distancia entre las diferentes categorías. Por ejemplo: edad.
Las variables se clasifican en dos grupos de acuerdo al nivel de medición utilizado para su observación:
· Variables cualitativas: son las variables medidas en escala nominal u ordinal, ya que la característica que miden de la unidad de análisis es una cualidad.
· Variables cuantitativas: son las variables medidas en escala intervalar, puesto que lo que miden es una cantidad.
3. Métodos de recolección de datos
La forma de obtener la información original de las unidades de análisis que componen el universo por investigar puede ser efectuada a través de un censo, una encuesta o un registro administrativo.
Censo
Es un método de recolección de datos mediante el cual la información se obtiene relevando la totalidad de los elementos que componen la población o universo bajo estudio. Un censo debe cumplir las condiciones de universalidad (censar a todos los elementos de la población) y simultaneidad (realizarse en un momento determinado). Un censo es equivalente a una fotografía de la población bajo estudio.
El término censo no sólo se aplica a aquellos relevamientos que comprenden todas las unidades de todo un país y que se realizan con una frecuencia de recolección quinquenal o decenal, como es el caso de los censos de población, económicos, agropecuarios, etc., sino también a todo relevamiento, cualquiera sea su cobertura geográfica, número de unidades de información, o frecuencia de su recolección, siempre que incluya todas las unidades que componen el universo que se investiga.
Encuesta
Es un método de recolección mediante el cual la información se obtiene relevando sólo un subconjunto o muestra de elementos del universo en estudio, que permite obtener información sobre el mismo.
Para que la información obtenida con la encuesta sea generalizable a la población, la muestra utilizada debe ser representativa de la población de la que proviene. Para lograrlo, se utilizan métodos de selección de unidades especialmente diseñados con este fin.
Su uso ha ido en rápido aumento, en la medida en que las instituciones productoras de información disponen de personal capacitado para efectuar su organización, diseño y análisis, debido a su menor costo y a que en determinadas circunstancias la información resulta más exacta debido a que los errores ajenos al muestreo (errores en la recolección y en el procesamiento) pueden ser reducidos a través de una mejor capacitación de los empadronadores y la utilización de métodos de captación de información más objetivos.
Registro administrativo
Existen oficinas públicas que llevan registros administrativos para sus propios fines. Por ejemplo, los Registros Civiles que registran los nacimientos, los casamientos, las defunciones, etc.; los Ministerios de Educación que llevan registros de matriculación de alumnos, deserción escolar, etc.; la Aduana que registra las importaciones y exportaciones, etc.
Esta información puede ser utilizada con fines estadísticos y se obtiene tal como está disponible. Los fines administrativos no siempre coinciden totalmente con los fines estadísticos.
Por ejemplo, para un estudio sobre determinada enfermedad se puede recurrir a los registros disponibles en hospitales, sanatorios, etc. Estos registros habrán sido diseñados para dar respuesta a ciertos requerimientos administrativos y seguramente la información que contienen no coincidirá exactamente con los requerimientos estadísticos.
Los registros constituyen la forma más económica de obtener información estadística de una población.
4. Agrupamiento de datos
Existen métodos para resumir los datos medidos u observados.
Cuando se trata de variables cualitativas donde las categorías están determinadas, lo único que hay que hacer es contabilizar el número de casos pertenecientes a cada categoría y normalizar en relación al número total de casos, calculando una proporción, un porcentaje o una razón.
En cambio, cuando se trata de variables cuantitativas, el resumen de los datos consiste en organizar tablas que sintetizan los datos originales y se denominan distribuciones de frecuencia.
Frecuencia: es el número de veces que se presenta cada valor de la variable.
Tabla de frecuencias: es una tabla que presenta en forma ordenada los distintos valores de una variable y sus correspondientes frecuencias.
Por ejemplo: consideremos la variable “número de aulas por escuela”, medida en las escuelas de una localidad.
(1) | Frecuencia (2) | ||
8 | 7 | ||
9 | 7 | ||
10 | 12 | ||
11 | 11 | ||
12 | 15 | ||
13 | 10 | ||
14 | 5 | ||
67 |
Representación gráfica: en general la representación gráfica de una tabla de frecuencias permite percibir con mayor claridad algunas características de la masa de datos que se investiga. Por ello, a través de gráficos, resulta bastante más fácil transmitir conclusiones a personas no habituadas a la interpretación de tablas de frecuencias.
Para representar gráficamente una distribución de frecuencias se utiliza un par de ejes de coordenadas. En el eje de las abscisas se representará la variable estudiada y en el eje de las ordenadas, las correspondientes frecuencias.
5. Parámetros estadísticos
Al obtener de una población la distribución de frecuencias de una variable lo que se persigue es reducir o condensar en pocas cifras el conjunto de observaciones relativas a dicha variable.
Este proceso de reducción puede continuarse hasta su grado máximo, es decir, hasta sustituir todos los valores observados por uno solo, que se llama promedio.
Existen numerosas formas de calcular promedios. La más conocida es la media aritmética, pero además existen otras como la mediana y la moda o el modo.
Media aritmética: es el número que se obtiene al dividir la suma de todas las observaciones por la cantidad de observaciones sumadas.
A la media aritmética la simbolizamos con X.
Por ejemplo, si tomamos las edades de un grupo de 9 personas:
16 - 17 - 19 - 20 - 22 - 22 - 23 - 28 - 29
X = (16+17+19+20+22+22+23+28+29)/9 = 21,8 años.
Mediana: si todos los valores observados de la variable se ordenan en sentido creciente (o decreciente), la mediana es el valor de la variable que ocupa el lugar central, es decir, el que deja a un lado y a otro el mismo número de observaciones.
La mediana se representa con el símbolo Mna.
En el ejemplo anterior, las edades ya están ordenadas de menor a mayor. La mediana será:
16 - 17 - 19 - 20 - 22 - 22 - 23 - 28 - 29
Mna= 22 años
Moda o modo: es el valor de la variable que más veces se repite, o sea, el valor que presenta mayor frecuencia.
Es útil como medida de tendencia central, sólo en aquellos casos en que un valor de la variable es mucho más frecuente que el resto. Se basa en la idea de “lo que es moda” o en el “comportamiento de la mayoría” para tomar a cierto valor como representativo del comportamiento de los datos.
No hay comentarios:
Publicar un comentario