miércoles, 25 de enero de 2012

Introducción a la Estadística Inferencial


La Hipótesis es la aseveración que se hace sobre una población. En el análisis estadístico se hace una aseveración, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera. La prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad que se emplea para determinar si la hipótesis es una afirmación razonable Usualmente se desea probar una suposición que se ha hecho sobre un parámetro que caracteriza a una población en particular, tal como la media poblacional.

La prueba de una hipótesis se realiza mediante un procedimiento sistemático de cinco pasos. Al llegar al 5º paso se puede o no rechazar la hipótesis. Esta prueba aporta una clase de prueba más allá de una duda razonable. El propósito de la prueba de hipótesis es el de hacer un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro.

Procedimiento para probar una Hipótesis:

1. Definir: Definir Hipótesis nula (H0) e Hipótesis alternativa (H1), es decir traducir a lenguaje estadístico la hipótesis científica.
2. Nivel de significación: Controlar los supuestos y definir el nivel de significación (α y β)y el error tipo I y tipo II
3. Calcular Estadístico:Identificar la Distribución Muestral asociada (distribución Normal estándar “z”o la “ t ” de student) y seleccionar el estadístico de prueba.
4. Decidir: Establecer la Regla de Decisión bajo las cuales se acepta o no H0.
5. Aceptar o No:
Formular conclusiones basado en la evidencia muestral y tomar una DECISION : Rechazar o No la H0

Paso 1: Definir Hipótesis nula (H0) e Hipótesis alternativa (H1)

Consiste en establecer el valor supuesto del parámetro en consideración antes de empezar el muestreo. Ese valor supuesto que se desea probar se le denomina Hipótesis Nula (H0). La hipótesis nula es una afirmación que no se rechaza a menos que los datos muestrales proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro. La hipótesis alternativa (H1) se refiere a cualquier hipótesis que difiera de H0. Es una afirmación que se acepta si los datos muestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro.

Paso 2: Seleccionar el nivel de significación

Se refiere a la probabilidad α de rechazar H0 cuando en realidad es verdadera, cometiendo así un ERROR tipo I. O por el contrario la probabilidad β de aceptar H0 cuando en realidad es falsa, cometiendo así un ERROR tipo II. Aunque no existe una regla general para seleccionar los valores de α, suele utilizarse α= 0,05 (5%) y α= 0,01 (1%) y debe especificarse antes de realizar la prueba. Si por ejemplo se elige un α= 5% al diseñar una prueba entonces podemos esperar que en 5 ocasiones de cada 100 se rechazará la H0 cuando debería ser aceptada (porque por azar la muestra cae en la región de rechazo), o sea que tenemos una probabilidad = 0.95 (95%) de que no rechazaremos la H0 siendo cierta

Paso 3: Tipos de prueba. Prueba de H0 de dos colas

La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de rechazo (conocida como región crítica) y una región de NO rechazo (aceptación). Si el estadístico de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula. El Valor crítico separa la región de no rechazo de la de rechazo. Se rechaza H0 si la Media Muestral cae en cualquiera de las dos regiones de rechazo.

Paso 4: Identificar la Distribución Muestral asociada

Se refiere al valor determinado a partir de la información muestral que se utiliza para aceptar o rechazar la hipótesis nula H0. Existen muchos estadísticos de prueba, en nuestro caso utilizaremos los estadísticos Z para distribución normal de la población y t “t de student” para la muestra. La elección de uno de estos depende del tamaño de la muestras, si las muestras son grandes (mayor a 30 observaciones) el estadístico recomendado es el de la Distribución Normal Estándar (z) , o en caso de muestras pequeñas utilizar el estadístico t. En las pruebas de hipótesis para la media de la población (μ), cuando se conoce la desviación estándar (σ) poblacional, o cuando el valor de la muestra es grande (30 o más), el valor estadístico de prueba es z y se determina a partir de: (Ver fórmula)

Paso 5: Formular la regla de decisión

Se establece las condiciones específicas en la que se rechaza la hipótesis nula H0 y las condiciones en que no se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera, es muy remota. En nuestro ejemplo, la PRUEBA.Z confirma H0, es decir que la población en estudio tiene una calificación promedio menor o igual a 12 puntos si la desviación estándar de 1,8 es cierta, basada en una media de muestral menor o igual a 11,9 con una probabilidad de 59%.

Funciones estadísticas de Excel
http://support.microsoft.com/kb/828296/es