est inf aplicada

Upload: gisela-rodriguez

Post on 06-Apr-2018

231 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/3/2019 Est Inf Aplicada

    1/166

    Violeta Alicia Nolberto Sifuentes

    Mara Estela Ponce Aruneri

    ESTADSTICA INFERENCIAL APLICADA

    Unidad de Post Grado de la Facultad de Educacinde la Universidad Nacional Mayor de San Marcos

  • 8/3/2019 Est Inf Aplicada

    2/166

    2

    Primera edicin:

    Lima, 2008.

    Violeta Alicia Nolberto Sifuentes.

    Mara Estela Ponce Aruneri.

    Unidad de Post Grado de la Facultad de Educacin

    de la Universidad Nacional Mayor de San Marcos.

    Serie:

    Textos de la Maestra en Educacin.

    UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

    FACULTAD DE EDUCACIN

    UNIDAD DE POST GRADO

    Rector : Dr. Luis Izquierdo VsquezDecano : Dr. Carlos Barriga Hernndez

    Director de la UPG : Dr. Elas Meja Meja

    Comit Directivo de la UPG : Dra. Elsa Barrientos Jimnez

    Dr. Kenneth Delgado Santa Gadea

    Mg. Rubn Mesa Marav

  • 8/3/2019 Est Inf Aplicada

    3/166

    3

    DedicatoriaDedicatoriaDedicatoriaDedicatoria

    Para Sandra Natalia (Mara Estela)

    Para Ernesto Alonso (Violeta Alicia)

  • 8/3/2019 Est Inf Aplicada

    4/166

    4

    CONTENIDO

    Prefacio

    Agradecimientos

    Captulo 1. La estadstica y su relacin con la investigacin cientfica

    1.1. Introduccin 001

    1.2. Definicin de estadstica 002

    1.3. Investigacin cientfica 004

    1.4. Objetivos fundamentales de la investigacin cientfica 005

    1.5. Paradigmas de la investigacin 005

    1.6. Clasificacin de la estadstica 008

    Captulo 2. Estadstica inferencial

    2.1. Introduccin 010

    2.2. Poblacin 011

    2.3. Muestra 012

    2.4. Muestra aleatoria 012

    2.5. Muestra aleatoria aplicada 013

    2.6. Parmetro 014

    2.7. Estadstico 015

    2.8. Distribucin muestral 017

    2.9. Estimacin 022

    2.10. Prueba de hiptesis 023

    2.11. Estadstica paramtrica 0252.12. Estadstica no paramtrica 026

    Ejercicios propuestos 027

    Captulo 3. Estimacin de parmetros

    3.1. Introduccin 029

    3.2. Propiedades de los estimadores 029

    3.3. Estimacin de parmetros mediante intervalos de confianza 032

  • 8/3/2019 Est Inf Aplicada

    5/166

    5

    3.4. Intervalo de confianza para estimar la media de una poblacin normal 033

    3.5. Intervalo de confianza para estimar la varianza poblacional

    2 de una poblacin normal 039

    3.6. Intervalo de confianza para estimar la proporcin poblacional de una poblacin binomial 041

    3.7. Intervalo de confianza para estimar diferencia de medias poblacionales,

    21 , de poblaciones normales 044

    3.7.1. Usando muestras independientes 044

    3.7.2. Usando muestras relacionadas 050

    3.8. Intervalo de confianza para estimar la razn de varianzas poblacionales,

    22

    21

    , de poblaciones normales independientes 054

    3.9. Intervalo de confianza para estimar la diferencia de proporciones

    poblacionales, 21 , de poblaciones binomiales independientes 056

    Ejercicios propuestos 060

    Captulo 4. Prueba de hiptesis paramtrica

    4.1. Introduccin 0664.2. Conceptos bsicos 067

    4.3. Etapas para realizar una prueba de hiptesis 075

    4.4. Prueba de para de una poblacin normal 076

    4.5. Prueba para 2 de una poblacin normal 082

    4.6. Para de una poblacin binomial 0854.7. Prueba para 21 usando muestras independientes 088

    4.7.1. Cuando las varianzas poblacionales son conocidas 089

    4.7.2. Cuando las varianzas poblacionales son desconocidas 092

    4.8. Para 21 usando muestras relacionadas 100

    4.9. Para la igualdad de varianzas poblacionales 104

    4.10. Para 21 de poblaciones binomiales 110

    Ejercicios propuestos 112

  • 8/3/2019 Est Inf Aplicada

    6/166

    6

    Captulo 5. Anlisis de regresin lineal mltiple

    5.1. Introduccin 116

    5.2. Modelo de regresin lineal simple 117

    5.3. Grfico o diagrama de dispersin 118

    5.4. Modelo de regresin lineal simple poblacional 119

    5.5. Estimacin de los parmetros del modelo de regresin lineal simple 120

    5.6. Evaluacin del ajuste global del modelo 122

    5.7. Adecuacin del modelo: Anlisis de residuos 125

    5.8. Modelo de regresin lineal mltiple 131

    5.9. Prueba de la significancia de la regresin 134

    5.10. Correlacin lineal simple 141

    Ejercicios propuestos 143

    Captulo 6. Pruebas de hiptesis no parmetricas

    6.1. Introduccin 145

    6.2. Prueba binomial 146

    6.3. Prueba U de Mann-Whitney 149

    6.4. Prueba de rangos de Wilcoxon 155

    6.5. Prueba de Kruskal-Wallis 159

    6.6. Prueba de Kolmogorov-Smirnov 164

    Ejercicios propuestos 168

    Captulo 7. Anlisis de datos categricos

    7.1. Introduccin 170

    7.2. Tablas de contingencia 170

    7.3. Estadstica Chi-cuadrado 1717.4. Prueba de hiptesis de homogeneidad 172

    7.5. Prueba de hiptesis de independencia 176

    Ejercicios propuestos 180

    Anexo

    Uso de Excel en el clculo de los valores de algunas variables aleatorias 000

  • 8/3/2019 Est Inf Aplicada

    7/166

    7

    PREFACIO

    El presente libro se ha elaborado a solicitud de la Unidad de Post Grado de la Facultad de

    Educacin de la Universidad Nacional Mayor de San Marcos, y tiene como objetivo ser una

    gua en el curso de Estadstica Inferencial, que se desarrolla en el plan de estudios de la

    Maestra en Educacin, en sus diferentes menciones.

    Por tanto, se ha escrito tomando en cuenta a un grupo heterogneo de profesionales, en el

    sentido de que los maestristas de esta facultad son en su mayora de la especialidad de

    educacin, y en su quehacer profesional no emplean cotidianamente las herramientas

    estadsticas. De ah, que el esfuerzo de las autoras sea desarrollar paso a paso las aplicaciones

    que se presentan en este libro.

    Los clculos que se presentan para aplicar las herramientas de la inferencia estadstica son

    para que los lectores entiendan sus cmo y porqu y, asimismo, la interpretacin de los

    resultados obtenidos. Dejamos bien en claro que en ningn momento se pretende adiestrar a

    lo lectores en clculos, sino en que aprendan los conocimientos tericos estadsticos de la

    inferencia (saber), apliquen las herramientas estadsticas (saber hacer) y desarrollen una

    actitud positiva hacia la estadstica. Esto es, que la estadstica no solamente es clculo, o el

    simple uso de las frmulas o expresiones que aparecen en ste y en diversos libros de

    estadstica, sino razonamiento crtico basado en evidencias objetivas que se obtienen de la

    poblacin bajo estudio (ser).

    Una vez que el lector haya asimilado los conocimientos estadsticos, y sus aplicaciones, que

    brindamos en el presente libro, estar en la capacidad de usar software estadstico, que es un

    instrumento comparable a una calculadora. El aprendizaje de estadstica usando softwareestadstico no debe reducirse, sin embargo, a manipulaciones mecnicas, pues ste sirve como

    apoyo del profesor para mostrar, en forma precisa y rpida, los grficos y clculos

    estadsticos.

    VIOLETA ALICIA NOLBERTO SIFUENTES

    MARA ESTELA PONCE ARUNERI

  • 8/3/2019 Est Inf Aplicada

    8/166

    8

    AGRADECIMIENTOS

    Al Dr. Elas Meja Mejia, Director de la Unidad de Post Grado de la Facultad de Educacin

    de la Universidad Nacional Mayor de San Marcos, por brindarnos la oportunidad de entregar

    al mundo acadmico el presente libro, en particular a los maestristas de la mencionada

    facultad, que lo usaran como gua para el aprendizaje del Curso de Estadstica Inferencial, en

    el plan de estudios vigente. Tambin por considerarnos como docentes de tan prestigiada

    unidad de post grado.

    A nuestros profesores de pregrado del Departamento Acadmico de Estadstica de la

    Universidad Nacional Mayor de San Marcos, quienes nos formaron en tan importante

    especialidad, cuyas enseanzas y exigencias acadmicas para con nuestra preparacin

    profesional en estadstica, han permitido que podamos seguir enseando y difundiendo la

    estadstica, no solo en el mbito sanmarquino sino en otros.

    A nuestros alumnos, por la paciencia e inters en aprender estadstica, por sus comentarios y

    sugerencias para con nuestro desempeo docente.

    A todos los lectores docentes, alumnos, empresarios, en general todos aquellos que tomaran

    decisiones basadas en evidencias objetivas, en concordancia con el mundo en que vivimos,

    caracterizado por el constante aprendizaje y el manejo adecuado de la informacin, en

    particular de la informacin estadstica.

    Asimismo a los que nos hagan llegar sus comentarios, observaciones y dudas respecto a lo

    tratado en el presente libro, los mismos que contribuirn con la enseanza y la difusin de la

    estadstica.

    Finalmente a nuestras familias, por el apoyo, comprensin y aliento, para con el desarrollo del

    presente libro.

  • 8/3/2019 Est Inf Aplicada

    9/166

    9

    CAPTULO 1

    LA ESTADSTICA Y SU RELACIN CON

    LA INVESTIGACIN CIENTFICA

    1.1.INTRODUCCIN

    Los profesionales de la Educacin como parte de su quehacer profesional realizan

    investigacin cientfica: evaluacin de la calidad de la educacin, someten a prueba diferentes

    mtodos de comprensin lectora, estudian problemas del aprendizaje, entre otros. Es as, que

    contamos con Internet como fuente general de informacin, que permite disponer de

    informacin educativa, por ejemplo, sobre Evaluaciones Muestrales, que realiza el Ministerio

    de Educacin y que se encuentra disponible en la pgina web:

    www2.minedu.gob.pe/umc/index2.php?v_codigo=47&v_plantilla=2 (23.03.08) que a la

    letra dice:

    Dentro de las Evaluaciones Nacionales que ha realizado la Unidad de Medicin de la

    Calidad (UMC) podemos distinguir dos tipos: las muestrales y las censales. A la fecha

    la UMC ha realizado cuatro evaluaciones muestrales y dos evaluaciones censales. En

    una evaluacin muestral se selecciona a un conjunto de estudiantes de una poblacin

    (objetivo). Las evaluaciones muestrales realizadas por la UMC son representativas de

    la poblacin objetivo planteadas en los distintos estudios (p. e. estudiantes peruanos de

    sexto grado de primaria, estudiantes peruanos de Instituciones Educativas Estatales de

    quinto grado de secundaria, etc.). La seleccin de una muestra representativa de

    estudiantes permite hacer inferencias de las poblaciones a partir de la informacin

    recogida.

    Para Castillo Arredondo (2003), evaluar:

    Es el acto de valorar una realidad que forma parte de un proceso cuyos momentos

    previos son la fijacin de las caractersticas de la realidad a valorar y de la recogida de

    informacin sobre la misma, y cuyas etapas posteriores son la informacin y/o toma de

    decisiones en funcin del juicio de valor emitido.

  • 8/3/2019 Est Inf Aplicada

    10/166

    10

    Por tanto, si el educador desea evaluar el rendimiento escolar, es necesario conocer las

    caractersticas de esta realidad escolar, llamada estadsticamente, poblacin. Si est en

    condiciones de recolectar los datos de toda la poblacin se denomina censo, es decir datos de

    todos y cada uno de los escolares para lograr los objetivos propuestos, o por el contrario, si

    toma o selecciona un grupo de escolares, se denomina una muestra representativa (muestra

    probabilstica o aleatoria) de escolares, y a travs de la muestra intentar conocer la realidad

    de la poblacin escolar.

    Cuando se trabaja con una muestra probabilstica y queremos conocer a la poblacin, a partir

    de los datos muestrales, empleamos los mtodos que ofrece la Estadstica Inferencial, que en

    el presente libro nos ocupar varios captulos.

    Este libro es a nivel bsico, tratando de ser lo ms amigable posible, tomando en cuenta que

    nos dirigimos a profesionales no estadsticos, en particular de la Educacin.

    Amigable en el sentido que obviaremos las demostraciones matemtico-estadsticas, pero si

    ser necesario tomar en cuenta las definiciones de la estadstica as como la rigurosidad para

    aplicar los mtodos estadsticos de la inferencia.

    Pero antes es necesario que se conozca la naturaleza de la Estadstica en particular de la

    Estadstica Inferencial.

    1.2.DEFINICIN DE ESTADSTICA

    Existen diversas definiciones, veamos algunas:

    Para Sierra Bravo (1991), la Estadstica es:

    La ciencia formada por un conjunto de teoras y tcnicas cuantitativas, que tienen por

    objeto la organizacin, presentacin, descripcin, resumen y comparacin de conjunto

    de datos numricos, obtenidos de poblaciones en su conjunto de individuos o

    fenmenos o bien de muestras que representan las poblaciones estudiadas, asi como el

    estudio de su variacin, propiedades, relaciones, comportamiento probabilstico de

  • 8/3/2019 Est Inf Aplicada

    11/166

    11

    dichos datos y la estimacin inferencia o generalizacin de los resultados obtenidos de

    muestras, respecto a las poblaciones que aqullas representan. La Estadstica en la

    investigacin cientfica, dada la necesidad de manejar y tratar en ellas grandes

    cantidades, progresivamente crecientes, de datos.

    Nocedo de Len Irma, et al (2001), anotan que:

    La Estadstica es la ciencia encargada de suministrar las diferentes tcnicas y

    procedimientos que permiten desde organizar la recoleccin de datos hasta su

    elaboracin, anlisis e interpretacin. Abarca dos campos fundamentales la Estadstica

    Descriptiva y la Estadstica Inferencial.

    Para Hopkins y Glass, (1997): La Estadstica es un lenguaje para comunicar informacin

    basada en datos cuantitativos.

    Montgmery, Douglas (1985), define a la Estadstica como: El arte de tomar decisiones acerca

    de un proceso o una poblacin con base en un anlisis de la informacin contenida en una

    muestra tomada de la poblacin.

    Otra definicin de la Estadstica que lo vincula al uso cientfico de principios matemticos a

    la coleccin, al anlisis, y a la presentacin de datos numricos. Contribuyen con la

    investigacin cientfica diseando pruebas y experimentos; la coleccin, el proceso, y el

    anlisis de datos; y la interpretacin de los resultados, aplicando conocimientos matemticos

    y estadsticos. El conocimiento estadstico se aplica a la biologa, economa, ingeniera,

    medicina, salud pblica, psicologa, comercializacin, educacin y deportes. Muchas

    decisiones econmicas, sociales, polticas, y militares no se pueden tomar objetivamente sinel empleo adecuado de la estadstica.

    Traduccin adaptada por las autoras del libro, tomada de:

    www.amstat.org/Careers/index.cfm?fuseaction=main (01.04.08)

    En nuestro medio profesional o en la sociedad en general se requiere solucionar un problema

    o verificar un supuesto, para desarrollar la ciencia, la tcnica y la educacin entre otros

  • 8/3/2019 Est Inf Aplicada

    12/166

    12

    mbitos; en particular respecto a los alumnos sobre rendimiento acadmico, aptitud cientfica,

    desarrollo social y la desercin entre otros. Tambin respecto al docente sobre su desempeo

    en aula, su formacin acadmico-profesional, los recursos didcticos que emplea y la

    produccin cientfica, entre otros. Respecto al sistema educativo, financiamiento de la

    educacin, gestin acadmica, informtica educativa y modelos educativos, entre otros.

    Todos estos problemas no pueden ser resueltos por iniciativas subjetivas, por pareceres o

    lluvia de ideas; sino en base a informacin valida y confiable, esto es, tener informacin lo

    ms prximo a la realidad bajo estudio. Indudablemente esto se logra empleando la ciencia

    llamada Estadstica.

    Para resolver estos problemas se debe seguir de manera organizada, sistemtica y planificada,

    es decir debemos realizar Investigacin Cientfica.

    1.3.INVESTIGACIN CIENTFICA

    Es una forma especial de buscar el conocimiento, presenta toda una serie de caractersticas

    que la diferencian de otras formas de abordar la realidad, como son el conocimiento emprico

    espontneo y el razonamiento especulativo. A continuaciones se presentan algunas

    definiciones:

    Ezequiel Ander-Egg (1995), define investigacin como:

    Un procedimiento reflexivo, sistemtico, controlado y crtico, que permite descubrir

    nuevos hechos o datos, relacin o leyes, en cualquier campo del conocimiento

    humano. Para entender qu se asume por investigacin cientfica debemos conocer sunaturaleza, sus aspectos o caractersticas, como son:

    1. Es un procedimiento mediante el cual se recogen nuevos conceptos de fuentes

    primarias, una investigacin existe cuando se ha pasado por el proceso de

    comprobacin y verificacin de un problema, el replantear lo ya conocido no se puede

    llamar investigacin.

  • 8/3/2019 Est Inf Aplicada

    13/166

    13

    2. Una investigacin es un aporte importante para el descubrimiento de principios

    generales por su naturaleza inferencial.

    3. La investigacin es un trabajo de exploracin profesional, organizada o sistemtica y

    exacta.

    4. Es lgica y objetiva.

    5. En lo posible procura ofrecer resultados cuantitativos de los datos manejados.

    6. El fin de una investigacin se expresa en un informe el cual presentar no solo la

    metodologa, resultados, experimentaciones, sino tambin las conclusiones y

    recomendaciones finales.

    1.4.OBJETIVOS FUNDAMENTALES DE LA INVESTIGACIN CIENTFICA

    En relacin a las funciones que realiza la ciencia, los objetivos fundamentales de una

    Investigacin Cientfica son:

    1. Describir la realidad. Proceso importante y necesario en el proceso del conocimiento

    cientfico donde las tcnicas y mtodos se aplican para recopilar datos y hechos, y

    establecer generalizaciones empricas.

    2. Explicar la realidad. Refleja mediante generalizaciones tericas (principios, leyes,

    conceptos) las propiedades y regularidades esenciales y estables de los fenmenos, as

    como los factores causales que los determinan.

    3. Predecir la realidad. La explicacin de la realidad y las generalizaciones tericas,

    permiten que cumpla con el objetivo de predecir los comportamientos futuros de los

    fenmenos, esto es, establecer pronsticos dentro de un determinado lmite de la

    probabilidad.

  • 8/3/2019 Est Inf Aplicada

    14/166

    14

    Como funcin prctica y utilitaria, la ciencia transforma la realidad en correspondencia con

    las necesidades y demandas de la sociedad, a fin de lograr un bienestar, mejorar la calidad de

    vida.

    Entonces la ciencia indaga su objeto de estudio utilizando de una manera sistemtica y

    rigurosa, empleando mtodos y medios especiales de conocimiento que permiten obtener

    datos empricos confiables, as como un reflejo profundo y exacto de las regularidades

    esenciales de la realidad.

    En este caso, los mtodos estadsticos cumplen funciones cognoscitivas importantes como

    herramienta de investigacin cientfica, por tanto el proceso de investigacin cientfica

    encuentra su fundamento metodolgico en la concepcin cientfica general de la realidad

    objetiva. Pero cmo conocer la realidad?

    1.5.PARADIGMAS DE LA INVESTIGACIN

    Un paradigma es un enfoque general que asume el investigador y es de carcter ontolgico,

    epistemolgico y metodolgico. Este ltimo tiene que ver con las vas, formas,

    procedimientos y estrategias que se consideran apropiados para estudiar al objeto, responde a

    la pregunta Cmo se conoce a la realidad?

    En la literatura del mtodo cientfico se habla con frecuencia de dos paradigmas de la

    investigacin cientfica, como son: el cualitativo y el cuantitativo.

    Para sintetizar, estos dos paradigmas, se presenta la siguiente tabla, disponible en:

    www.fisterra.com/mbe/investiga/cuanti_cuali/cuanti_cuali.asp (22.03.08).

  • 8/3/2019 Est Inf Aplicada

    15/166

    15

    Tabla N 1.1

    Ventajas y desventajas entre mtodos cualitativos y cuantitativos

    Mtodos cualitativos Mtodos cuantitativos

    Propensin a "comunicarse con" los

    sujetos del estudio.

    Propensin a "servirse de" los sujetos del

    estudio.

    Se limita a preguntar. Se limita a responder.

    Comunicacin ms horizontal () entre

    el investigador y los investigados ()

    mayor naturalidad y habilidad de estudiar

    los factores sociales en un escenario

    natural.

    Son fuertes en trminos de validez interna,

    pero son dbiles en validez externa, lo que

    encuentran no es generalizable a la

    poblacin.

    Son dbiles en trminos de validez interna

    -casi nunca sabemos si miden lo que

    quieren medir-, pero son fuertes en

    validez externa, lo que encuentran es

    generalizable a la poblacin.

    Preguntan a los cuantitativos: Cun

    particularizables son los hallazgos?

    Preguntan a los cualitativos: Son

    generalizables tus hallazgos?

    Podemos afirmar que como todo mtodo cientfico, se debe reconocer sus ventajas y

    desventajas, lo importante es determinar el momento adecuado para aplicarlo en el desarrollo

    de la investigacin cientfica.

    Pero destacamos que el paradigma cuantitativo se vale de la Estadstica para garantizar el

    estudio de muestras representativas y para el anlisis de los datos, como tambin para efectuar

    generalizaciones a partir de los resultados de estas muestras representativas.

    Tambin, para realizar investigacin va el paradigma cuantitativo, se ha empleado

    previamente el paradigma cualitativo; pero lo importante es tener la certeza de su aplicacin

  • 8/3/2019 Est Inf Aplicada

    16/166

    16

    para solucionar problemas de una investigacin cientfica, sta debe reunir ciertas

    caractersticas.

    En otros casos ser necesario emplear ambos paradigmas, como por ejemplo cuando se trata

    de evaluar la Calidad de la Educacin, en particular la Educacin Superior, no es suficiente

    uno de ellos se deben emplear ambas. La realidad es muy compleja, multifactorial, dinmica,

    por lo tanto, ambos paradigmas se complementan, no son excluyentes.

    Una vez establecido el objeto de estudio en base a los conocimientos tericos, se inicia la

    etapa de Diseo Metodolgico (Diseo), donde se define el proceso de recoleccin de datos,

    delimitando las unidades bajo estudio y las variables a medirse, que permitan contestar las

    preguntas formuladas, en el proyecto de investigacin cientfica. Es indudable que, la

    Estadstica es una poderosa herramienta para planificar y desarrollar el Diseo Metodolgico.

    Los datos obtenidos, de la realidad investigada, se analizan aplicando los mtodos y tcnicas

    estadsticas para contrastar sus posibles divergencias con las consecuencias que se deducen de

    las hiptesis. Por tanto nos preguntamos:

    Las respuestas que ustedes proporcionen dejan notar la relacin que existe entre Estadstica e

    Investigacin Cientfica.

    Entonces la Estadstica es la herramienta que ayuda a tener la seguridad, certeza y

    confianza de que los datos recogidos responden a la realidad que se pretende investigar,

    en trminos de Estadstica Aplicada.

    Cmo se llevar a cabo el estudio para investigar sobre diferentes problemas y aristasdel trabajo educativo, para el logro de sus objetivos y/o verificacin de sus hiptesis?

    Cmo se realizar la investigacin, a fin de maximizar la validez y confiabilidad de la

    informacin y reducir errores en los resultados?

  • 8/3/2019 Est Inf Aplicada

    17/166

    17

    1.6.CLASIFICACIN DE LA ESTADSTICA

    Dependiendo de cmo se analizan los datos, la Estadstica se clasifica como:

    1.6.1. ESTADSTICA DESCRIPTIVA

    Rama de la Estadstica que trata sobre la descripcin y anlisis estadstico de una poblacin,

    que resumen y presenta datos obtenidos de la poblacin o de una muestra, mediante mtodos

    adecuados.

    Tiene como objetivo, caracterizar los datos, de manera grfica o analtica, para resaltar las

    propiedades de los elementos bajo estudio.

    La siguiente pregunta: En promedio el nmero total de respuestas correctas, de una prueba

    de compresin lectora, es la misma en todas las secciones de quinto grado de primaria de

    Instituciones Educativas de Lima Metropolitana?, se resuelve con el apoyo de la Estadstica

    Descriptiva.

    1.6.2. ESTADSTICA INFERENCIAL

    Rama de la Estadstica que estudia el comportamiento y propiedades de las muestras y la

    posibilidad, y lmites, de la generalizacin de los resultados obtenidos a partir de aquellas a

    las poblaciones que representan. Esta generalizacin de tipo inductivo, se basa en la

    probabilidad. Tambin se le llama tambin Estadstica Matemtica, por su complejidad

    matemtica en relacin a la Estadstica Descriptiva.

    Tiene como objetivo, generalizar las propiedades de la poblacin bajo estudio, basado en los

    resultados de una muestra representativa de la poblacin.

    La siguiente pregunta: El instrumento Perso, clasifica y discrimina adecuadamente, a partir

    de variables de personalidad, a los alumnos de Educacin Bsica Secundaria segn requieran

    o no una escolarizacin especial? se resuelve con el apoyo de la Estadstica Inferencial.

  • 8/3/2019 Est Inf Aplicada

    18/166

    18

    En cuanto a la Probabilidad, Juez Martel, Pedro y Diez Vegas, Francisco Javier (1997),

    manifiestan que: Hoy en da la Probabilidad y la Estadstica, ntimamente unidas en s,

    desempean un papel fundamental en prcticamente todos los campos del saber, tanto en las

    ciencias naturales como en las ciencias humanas, papel que va cobrando cada vez mayor

    importancia.

    La siguiente pregunta: Cunto es la probabilidad de que un alumno de Educacin Bsica

    Secundaria requiera una escolarizacin especial, a partir de las variables de su personalidad?

    es un caso tpico que se resuelve con el apoyo de la probabilidad y se logra empleando

    modelos probabilsticos.

    Nosotros recordamos al estudiante que los mtodos estadsticos son las herramientas ms

    peligrosas en manos de gente inexperta. Pocas materias tiene una aplicacin tan amplia;

    Ninguna requiere tal cuidado en su aplicacin.

    RECUERDE

    Ningn mtodo estadstico puede corregir los defectos por una inadecuada seleccin

    del problema que se investiga, o por una mala recoleccin de datos. Una investigacin

    que empieza mal, con seguridad termina mal.

    CON DATOS DE MALA CALIDAD, NO SER POSIBLE DAR RESPUESTA

    ADECUADA A UN PROBLEMA CIENTFICO

    La estadstica es una de esas ciencias cuyos adeptos deben ejercer la automoderacin de

    un artista.

    George Udny Yule y Maurice Kendal

  • 8/3/2019 Est Inf Aplicada

    19/166

    19

    CAPTULO 2

    ESTADSTICA INFERENCIAL

    2.1. INTRODUCCIN

    Tambin se le llama Inferencia Estadstica, pero previamente recordemos que la Estadstica

    (EI) comprende el conjunto de mtodos estadsticos que permiten deducir (inferir) cmo se

    distribuye la poblacin bajo estudio a partir de la informacin que proporciona una muestra

    representativa, obtenida de dicha poblacin. Ver seccin 1.6.2 del presente libro.

    Para que la Estadstica Inferencial proporcione buenos resultados debe:

    1. Basarse en una tcnica estadstico-matemtica adecuada al problema y suficientemente

    validada.

    2. Utilizar una muestra que realmente sea representativa de la poblacin y de un tamao

    suficiente.

    Veamos el siguiente ejemplo:

    Ejemplo 2.1

    Se realiza un estudio para comparar tres mtodos para ensear tcnicas de comprensin

    lectora en ingls a escolares de segundo grado de Educacin Bsica Secundaria, como son:

    El mtodo de la enseanza recproca.

    El mtodo de instruccin directa.

    La combinacin de mtodos de instruccin directa y enseanza recproca.

  • 8/3/2019 Est Inf Aplicada

    20/166

    20

    Las preguntas por resolver son:

    1. Cul de los mtodos mejora la comprensin lectora?

    2. Para el prximo ao el mtodo identificado como el mejor, dar buenos resultados, para

    el alumno Javier Hernndez Len, quin realizar el segundo grado de Educacin Bsica

    Secundaria?

    La primera pregunta es un caso de incertidumbre, porque, basndonos en el estudio de tres

    muestras independientes y en igualdad de condiciones se aplicar uno de los tres mtodos a

    cada muestra de manera independiente; con el apoyo de la Estadstica Inferencial absolvemos

    esta pregunta, eligiendo a la que mejora significativamente la Comprensin Lectora, para este

    tipo de alumnos.

    La segunda pregunta es un caso de toma de decisiones, porque Javier Hernndez Len no ha

    participado en el estudio, pero se le aplicar el mejor mtodo que resulte de la investigacin

    realizada, ahora bien, con qu confianza, diremos que ese mtodo lograr que Javier mejore

    su comprensin lectora en ingls.

    Los casos de incertidumbre y toma de decisiones son resueltos por la Estadstica Inferencial,

    por supuesto apoyado por la probabilidad.

    Para iniciarse en el estudio y aplicacin de la Estadstica Inferencial es necesario

    conocer los conceptos bsicos que a continuacin se van a tratar.

  • 8/3/2019 Est Inf Aplicada

    21/166

    21

    2.2. POBLACIN

    Este concepto vamos a definir bajo diferentes enfoques. En investigacin cientfica se le

    define como la totalidad de elementos sobre los cuales recae la investigacin. A cada

    elemento se le llama unidad estadstica, sta se le observa o se le somete a una

    experimentacin, estas unidades son medidas pertinentemente.

    Si representamos mediante, X, una variable aleatoria bajo investigacin, al estudiar a esta

    variable en la poblacin, como resultado tendremos los valores:

    NXXXX ...,,,, 321

    Donde N es el total de elementos de la poblacin.

    Ejemplo 2.2

    Sea X, una variable aleatoria que representa la calificacin obtenida en la prueba de

    conocimientos sobre educacin ambiental (escala vigesimal), de los alumnos de la Facultad

    de Educacin, si la poblacin consta de 300 alumnos, entonces:

    300321 ...,,,, XXXX

    Es una poblacin en trminos de variable aleatoria, que se lee as:

    La calificacin que ha obtenido el alumno 1 en la prueba de conocimientos sobre educacin

    ambiental, la calificacin que ha obtenido el alumno 2 en la prueba de conocimientos sobre

    educacin ambiental, la calificacin que ha obtenido el alumno 3 en la prueba de

    conocimientos sobre educacin ambiental, y as sucesivamente hasta la calificacin que ha

    obtenido el alumno 300 en la prueba de conocimientos sobre educacin ambiental.

    El propsito de un estudio estadstico es extraer conclusiones acerca de la naturaleza de la

    poblacin, pero resulta que las poblaciones son grandes o por razones de tica, recursos

  • 8/3/2019 Est Inf Aplicada

    22/166

    22

    financieros, metodolgicos u otros no ser posible entonces se debe trabajar con una muestra

    extrada de la poblacin bajo estudio.

    2.3. MUESTRA

    Sierra Bravo (1991) anota que: Una muestra en general, es toda parte representativa de la

    poblacin, cuyas caractersticas debe reproducir en pequeo lo ms exactamente posible.

    Para que sea representativa se debe seleccionar empleando el muestreo, tpico importante de

    la Estadstica, con la finalidad de que los resultados de esta muestra sean validos para la

    poblacin de la que sea obtenido la muestra. Esta generalizacin se realiza empleando la

    estadstica inferencial.

    2.4. MUESTRA ALEATORIA

    Una muestra aleatoria de tamao n de la funcin de distribucin de la variable aleatoria X es

    una coleccin de n variables aleatorias independientesn

    XXXX ...,,,, 321 cada una con la

    misma funcin de distribucin de la variable aleatoriaX.

    Ejemplo 2.3

    Consideremos nuevamente la poblacin definida en el ejemplo 2.2, la variable de inters es X,

    calificacin obtenida en la prueba de conocimientos sobre educacin ambiental (escala

    vigesimal), de los alumnos de la Facultad de Educacin. Asumiremos que tiene distribucin

    de probabilidad con mediax y Varianza

    2x . No se conoce ni la distribucin exacta de X ni

    el valor numrico de x o de2

    x . Se trata de caractersticas de la poblacin que pueden

    determinarse con precisin si se revisa cada una de las calificaciones de los 300 alumnos. Para

    tener una idea del valor dex se extrae una muestra aleatoria de tamao n = 6 de la

    poblacin. Entonces:

    1X : La calificacin que ha obtenido en la prueba de conocimientos sobre educacin

    ambiental, el primer alumno seleccionado en la muestra.

  • 8/3/2019 Est Inf Aplicada

    23/166

    23

    2X : La calificacin que ha obtenido en la prueba de conocimientos sobre educacin

    ambiental, el segundo alumno seleccionado en la muestra.

    6X : La calificacin que ha obtenido en la prueba de conocimientos sobre educacinambiental, el sexto alumno seleccionado en la muestra.

    Puesto que la seleccin de los alumnos, en este caso es seis, es aleatoria o al azar:

    654321 ,,,,, XXXXXX

    Constituye variables aleatorias. Se admite que son independientes y cada una con la mismadistribucin que la variable aleatoria X. En un sentido matemtico el trmino muestra

    aleatoria, se refiere, no a seis alumnos seleccionados para este estudio sino a las seis variables

    aleatorias 654321 ,,,,, XXXXXX asociadas con los alumnos.

    La definicin matemtica de variable aleatoria es terica, para extraer conclusiones prcticas

    acerca de la poblacin en base a la muestra seleccionada deben determinarse los valores

    numricos de las variables nXXXX ...,,,, 321 .

    No estamos tratando con un conjunto de unidades estadsticas seleccionadas, ni con un grupo

    de variables tericas sino con un conjunto de n nmeros reales, es decir nxxxx ...,,,, 321 . Estos

    nmeros son los valores observados de las variablesn

    XXXX ...,,,, 321 respectivamente, para

    una determinada muestra aleatoria extrada de la poblacin. Esto conduce a la siguiente

    definicin.

    2.5. MUESTRA ALEATORIA APLICADA

    Una muestra aleatoria de tamao n es un conjunto de n observaciones nxxxx ...,,,, 321 sobre

    las variables nXXXX ...,,,, 321 independientes e idnticamente distribuidas.

  • 8/3/2019 Est Inf Aplicada

    24/166

    24

    Ejemplo 2.4

    Para el caso del ejemplo 2.3, una vez identificados los seis alumnos, podemos determinar los

    valores numricos de las seis variables aleatorias654321

    ,,,,, XXXXXX . Supongamos que el

    primer alumno seleccionado ha obtenido 13 en la prueba de educacin ambiental en este caso,

    la variable aleatoria 1X toma el valor 1x = 13.

    Si el segundo alumno seleccionado ha obtenido 10 en la prueba de educacin ambiental en

    este caso, la variable aleatoria 2X toma el valor 2x = 10. De igual forma las variables

    aleatorias 6543 ,,, XXXX tomarn valores numricos que van a depender de las calificaciones

    que obtienen los alumnos seleccionados en tercera, cuarta, quinta y sexta seleccin.

    Ahora estamos utilizando el termino muestra aleatoria no para referirnos a los alumnos

    seleccionados o a las variables aleatorias asociados con ellos sino a los seis valores numricos

    654321 ,,,,, xxxxxx que toman respectivamente cada una de las seis variables aleatorias.

    Por tanto hay tres formas de considerar a una muestra aleatoria:

    1. Como un conjunto de unidades seleccionadas y que son sometidos al estudio.

    2. Como un conjunto de variables aleatorias tericas asociadas con esas unidades

    3. Como un conjunto de valores numricos tomadas por las variables.

    Las definiciones no son equivalentes pero estn estrechamente relacionadas.

    2.6. PARMETRO

    Sierra Bravo (1991) indica que parmetro deriva del vocablo griegoparmetreo que significa

    medir una cosa con otra:

  • 8/3/2019 Est Inf Aplicada

    25/166

    25

    En estadstica se refiere a los valores o medidas que caracterizan una poblacin como

    por ejemplo la media y la desviacin tpica de una poblacin () Son cantidades

    indeterminadas constantes o fijas respecto a una condicin o situacin que caracteriza

    a un fenmeno en un momento dado que ocurre en una poblacin.

    Se suele representar a un parmetro mediante letras griegas, por ejemplo la media poblacional

    se representa mediantex y se lee como media poblacional de la variable aleatoria X, la

    varianza poblacional se representa mediante 2x y se lee como varianza poblacional de la

    variable aleatoriaX.

    En trminos prcticos un parmetro es un valor que resulta al emplear los valores que seobtiene de una poblacin.

    Ejemplo 2.5

    Si al obtener las calificaciones de los 300 alumnos que conforman la poblacin, estos se

    promedia, entoncesx = 14.78 es el parmetro correspondiente. Para su clculo se ha

    empleado la siguiente expresin, llamada media poblacional:

    N

    XN

    i

    i

    x

    == 1 (2.1)

    Obviamente queNtoma el valor 300, para este ejemplo.

    Si de estos 300 alumnos 198 son mujeres, entonces la proporcin poblacional de mujeres

    representada por x = 0.66 (66%). Para su clculo se ha empleado la siguiente expresin,

    llamada proporcin poblacional:

    N

    XN

    i

    i

    x

    == 1 (2.2)

  • 8/3/2019 Est Inf Aplicada

    26/166

    26

    Pero ahora la variable aleatoria se define como:

    =alumnosi

    alumnasiXi 0

    1

    En este caso el numerador de la expresin (2.2) es 198 yNtoma el valor 300.

    2.7. ESTADSTICO

    Se contrapone al parmetro, porque es un valor que se obtiene a partir de los valores

    muestrales, se puede obtener media y varianzas mustrales, por ejemplo.

    Los estadsticos son variables aleatorias por que estn sujetos a la fluctuacin de la muestra en

    relacin al valor poblacional que se asume es constante.

    Ejemplo 2.6

    Continuando con el ejemplo 2.4, al seleccionar una muestra aleatoria de tamao seis, una vez

    identificados los seis alumnos, obtienen las siguientes calificaciones 1x = 13, 2x = 10, 3x =

    13, 4x = 14, 5x = 11, 6x = 10 la media obtenida de los seis alumnos es de 11,83, llamada

    media muestral y se representa mediante x , cuya expresin es:

    n

    x

    x

    n

    i

    i== 1 (2.3)

    El numerador de la expresin (2.3) es la suma de los seis valores, que da 71, que dividido por

    6, resulta x = 11,83, es decir en promedio los alumnos han obtenido 11,83 de calificacin en

    la prueba de educacin ambiental.

  • 8/3/2019 Est Inf Aplicada

    27/166

    27

    La varianza de esta muestra aleatoria es 2,4722 y se representa mediante 2S , cuya expresin

    es:

    ( )

    n

    xx

    S

    n

    i

    i=

    = 1

    2

    2 (2.4)

    Para su clculo, disponemos de la tabla, 2.1, en la que mostramos paso a paso el uso de la

    expresin (2.4) sabiendo que x = 11,83:

    Tabla 2.1

    Clculos para obtener el valor de la varianza (ejemplo 2.6)

    Unidadix ( )xxi ( )

    2xx

    i

    1 13 1,17 1,3689

    2 10 -1,83 3,3489

    3 13 1,17 1,3689

    4 14 2,17 4,7089

    5 11 -0,83 0,68896 10 -1,83 3,3489

    Total 71 0,02* 14,8334

    Tericamente:

    ( ) 01

    ==

    n

    i

    ixx

    El numerador de la expresin (2.4) es la suma del cuadrado de las seis desviaciones de cada

    valor que toma la variable, respecto a su media aritmtica, que es igual a 14,8334, que

    dividido por 6 es justamente 2,4722.

  • 8/3/2019 Est Inf Aplicada

    28/166

    28

    La raz cuadrada, positiva, de la varianza se llama desviacin estndar o desviacin tpica,

    esto es:

    2SS += (2.5)

    Entonces, usando la expresin anterior (2.5) la desviacin estndar es S = 1,5723.

    2.8. DISTRIBUCIN MUESTRAL

    Sierra Bravo (1991) anota que la distribucin muestral:

    Est formada por estadsticos o valores determinados obtenidos de muestras: medias,varianzas, etc., acompaados de sus respectivas frecuencias relativas o probabilidades,

    o de la proporcin de veces que se repiten en el conjunto de todas las muestras

    posibles del mismo tamao obtenidas de la poblacin.

    De manera ms formal, Tsokos y Milton (1998) anotan que: () la distribucin de

    probabilidad del estadstico se llama distribucin muestral.

    Ejemplo 2.7

    Vamos a obtener la distribucin muestral de las calificaciones obtenidas en la prueba que

    mide la educacin ambiental de una poblacin hipottica compuesta por 3 estudiantes y que

    toman calificaciones iguales a: 1X = 13, 2X = 11, 3X = 07. Fijamos para una muestra de

    tamao 2, en la tabla 2.2 se muestra los posibles resultados de la muestra de tamao 2, as

    como su respectiva media muestral:

  • 8/3/2019 Est Inf Aplicada

    29/166

    29

    Tabla 2.2

    Resultados de posibles muestras de tamao 2

    Muestras

    Posibles

    Medias muestrales

    (media para cada muestra)

    13,11 12

    13,7 10

    11,13 12

    11,7 9

    7,13 10

    7,11 9

    Ahora se muestra la distribucin de frecuencias para los valores de la media muestral:

    Tabla 2.3

    Distribucin muestral de la media muestral

    Valor de las medias

    muestrales

    Frecuencia Frecuencia relativa

    9 2 2/6 = 0.33

    10 2 2/6 = 0.33

    12 2 2/6 = 0.33

    La distribucin muestral de la media muestral es la distribucin de frecuencias o de

    probabilidad, en este caso, de las frecuencias relativas de todas las medias muestrales

    posibles, obtenidas de muestras de tamao 2, de la poblacin de tamao 3.

    Por cultura estadstica estudiaremos algunos estadsticos y su distribucin de probabilidad

    (distribucin muestral).

  • 8/3/2019 Est Inf Aplicada

    30/166

    30

    2.8.1. MEDIA MUESTRAL

    La expresin (2.3), nos indica cmo se obtiene una media muestral. Veamos sus propiedades:

    PROPIEDADES DE LA MEDIA MUESTRAL

    Si X es una variable aleatoria con esperanza o media poblacional y varianza poblacional

    2 , entonces la media muestral, x tiene las siguientes propiedades:

    1. ( ) =xE

    2. ( ) nxV /2=

    3. La desviacin estndar de x , que se representa mediantex

    , conocida tambin como

    error estndar de la media muestral es igual a n/

    4. Sean

    XXXX ...,,,,321

    una muestra aleatoria de tamao n, de una distribucin con media

    poblacional y varianza poblacional 2 . Entonces para n grande, la variable aleatoria:

    n

    x

    /

    (2.6)

    Se distribuye aproximadamente como una normal estandarizada ( )1,0N . Se considera una

    buena aproximacin cuando 30n (Teorema del Lmite Central). De este modo, incluso an

    cuando la variable aleatoria X no est normalmente distribuida, podemos aplicarla en la

    Inferencia Estadstica.

    2.8.2. VARIANZA MUESTRAL

    A partir de cada muestra aleatoria de tamao n de X: nxxx ...,,, 21 tambin se puede calcular

    la varianza muestral, definida como:

  • 8/3/2019 Est Inf Aplicada

    31/166

    31

    ( )=

    =n

    i

    i xxn

    s1

    22

    1

    1(2.7)

    Cabe precisar, que algunos autores la llaman cuasivarianza.

    PROPIEDADES DE LA VARIANZA MUESTRAL

    Si X es una variable aleatoria con esperanza y varianza y 2 respectivamente, entonces

    para la varianza muestral de tamao n se cumple que:

    1. 22 =sE

    2. Si X tiene distribucin de probabilidad normal,( )

    2

    21

    sn es una variable aleatoria con

    distribucin chi-cuadrado con 1n grados de libertad.

    2.8.3.PROPORCIN MUESTRAL

    Consideremos una poblacin en la que existe una proporcin de elementos que tienen el

    atributo A (o pertenecen a la categora A ).

    Si se toma una muestra aleatoria de n elementos, de esa poblacin y se calcula el nmero An

    de elementos con el atributo A , entonces:

    nnp A= (2.8)

    Es la proporcin muestral de los elementos que tienen el atributo A en la muestra, esta

    proporcin muestral corresponde a una variable aleatoria.

  • 8/3/2019 Est Inf Aplicada

    32/166

    32

    PROPIEDADES DE LA PROPORCIN MUESTRAL

    1. ( ) =pE

    2. ( ) ( ) npV /1 =

    La desviacin estndar o error estndar de la proporcin muestral, se denota comop y

    es igual a n/)1(

    3. Para n suficientemente grande, la variable aleatoria:

    n

    p

    Z /)1(

    = (2.8.)

    Se distribuye aproximadamente como una ( )1,0N . Se considera una buena aproximacin

    cuando 30n (Teorema del Lmite Central).

    Ejemplo 2.8

    En una muestra aleatoria de 15 docentes de educacin secundaria, de la Institucin Educativa

    Martn Adn, se les aplico un cuestionario para recoger su opinin sobre el investigador

    educativo, se presenta la respuesta de 3 preguntas, de un total de 27:

    CUL ES LA DIFERENCIA ENTRE DESVIACIN ESTNDAR

    Y ERROR ESTNDAR?

    La diferencia es que la desviacin estndar describe la variabilidad de los valores de

    una variable, en cambio el error estndardescribe la precisin del estadstico.

  • 8/3/2019 Est Inf Aplicada

    33/166

    33

    Tabla 2.4

    Muestra aleatoria de 15 docentes de la Institucin Educativa Martn Adn (Lima)

    Docentes Edad (1) Investigador (2) Remuneracin (3)

    1 34 1 1

    2 38 1 1

    3 49 2 1

    4 42 1 1

    5 35 1 2

    6 44 2 1

    7 30 1 2

    8 36 1 1

    9 43 2 1

    10 47 2 1

    11 39 1 2

    12 46 2 1

    13 48 2 1

    14 36 1 2

    15 44 1 1

    (1) Edad en aos cumplidos del docente.

    (2) La profesin de investigador es profesin atractiva para:

    1. Docentes jvenes. 2. Docentes maduros.

    (3) El investigador educativo debe ser bien remunerado

    1. S. 2. No.

    Con esta informacin vamos a mostrar la diferencia entre desviacin estndar y error

    estndar.

  • 8/3/2019 Est Inf Aplicada

    34/166

    34

    MEDIA MUESTRAL

    La edad en aos cumplidos tiene distribucin con media poblacional, = 38,5 aos y

    varianza poblacional,2

    = 30 aos2

    .

    Usando la expresin 2.3 se obtiene x = 40,73 aos, y al usar la expresin 2.7 se obtiene 2s =

    33,21 aos2.

    Por tanto la desviacin estndar muestral de la edad es: 21,332 == ss = 5,76.

    En cambio el error estndar del estadstico media muestral, empleando la propiedad 3, es:

    87,3

    48,5

    15

    48,5===

    nx

    = 1,42 aos

    PROPORCIN MUESTRAL

    Para la segunda variable, interesa que el docente encuestado indique que la profesin deinvestigador es una profesin atractiva para docentes jvenes ( A ). La muestra aleatoria es

    igual a 15 docentes ( )15=n .

    En esta poblacin se asume que la proporcin poblacional de docentes que consideran que la

    profesin de investigador es una profesin atractiva para docentes jvenes es igual a 0,71

    ( )71,0= .

    De la tabla contamos queAn = 9, es decir, 9 docentes afirman que la profesin de

    investigador es una profesin atractiva para docentes jvenes, entonces empleando la

    expresin 2.8 se obtiene:

    15

    9=p = 0,6 (60%)

  • 8/3/2019 Est Inf Aplicada

    35/166

    35

    Esto es, el 60% de docentes encuestados afirman que la profesin de investigador es una

    profesin atractiva para docentes jvenes.

    El error estndar del estadstico p es:

    0137,015

    2059,0

    15

    )29,0(71,0

    15

    )71,01(71,0)1(===

    =

    =

    np

    = 0,1170

    2.9. ESTIMACIN

    La Inferencia Estadstica se clasifica como: Estimacin y Prueba de Hiptesis de parmetros

    estadsticos. En ambos casos hay una poblacin bajo investigacin y generalmente al menos

    un parmetro de esta poblacin, al que vamos a representar mediante la letra griega .

    Cuando no se tiene una nocin preconcebida sobre el valor de , se desea responder a la

    pregunta: Cul es el valor de ?

    En este caso el intentar conocer el valor de es en termino estadsticos, estimar el valor de

    es decir tratar de conocer el valor del parmetro en trminos prcticos.

    Sierra Bravo (1991) anota que:

    Estimacin proviene del latn estimatio y significa estimacin, precio y valor que se da

    a una cosa. En estadstica es la operacin que mediante la inferencia un parmetro,

    utilizando datos incompletos procedentes de una muestra, se trata de determinar el

    valor del parmetro. Pero los valores de la muestra estn sujetos al error muestral esto

    es a las fluctuaciones de la muestra.

    La estimacin de un parmetro puede ser, mediante una:

    1. Estimacin puntual.

    2. Estimacin mediante intervalos de confianza.

  • 8/3/2019 Est Inf Aplicada

    36/166

    36

    Para cualquiera de estas dos situaciones empleamos el estadstico que como ya se ha

    mencionado es una variable aleatoria.

    La aproximacin se hace utilizando estadsticos apropiados. A un estadstico empleado para

    aproximar o estimar un parmetro de la poblacin se le llama estimador puntual de y se

    denota mediante . De este modo por ejemplo, al estimador de la media , se le denotara

    por . Una vez que la muestra ha sido tomada y se han hecho algunas observaciones, se

    puede obtener el valor numrico del estadstico . A tal nmero se le denomina una

    estimacin puntual de . Ntese que hay una diferencia entre los trminos estimador y

    estimacin.

    Ejemplo 2.9

    Consideremos las variables edad en aos cumplidos ( )X y el docente considera que el

    investigador educativo debe ser bien remunerado ( )Y , para distinguir entre estimador y

    estimacin:

    Variable Parmetro Estimador Estimacin

    n

    x

    x

    n

    i

    i== 1

    x= = 40,73 aos

    X

    2 ( )

    =

    =n

    i

    i xxn

    s1

    22

    1

    1 22 s= = 33,21 aos2

    ESTIMADOR: Es el estadstico utilizado para generar una estimacin y es una variable

    aleatoria.

    ESTIMACIN: Es el valor que toma el estimador.

  • 8/3/2019 Est Inf Aplicada

    37/166

    37

    Y nn

    p A= 7333,0 == p (73,33%)

    PRUEBA DE HIPTESIS

    Proceso mediante el cual, a partir de los valores de una muestra aleatoria se decide si se

    rechaza o no el supuesto que plantea el investigador para el parmetro o parmetros de la

    poblacin o poblaciones bajo estudio, pero con cierta probabilidad de error (riesgo) por tomar

    una decisin.

    Ejemplo 2.10

    En cierta investigacin, se requiere estudiar el nivel de comprensin lectora en nios de 8

    aos de edad, que asisten a Instituciones Educativas estatales y privados, para tal fin se elige

    al azar una muestra de alumnos de cada tipo de Institucin Educativa (IE). Se pretende lograr

    los siguientes objetivos:

    1. Determinar el nivel promedio poblacional del puntaje de la prueba de comprensin lectora

    para tipo de IE.

    2. Verificar si el nivel promedio poblacional del puntaje de la prueba de comprensin lectora

    en nios de IE estatal es diferente de los nios de IE privados.

    Explicar cul rama de la Inferencia Estadstica emplear, para lograr cada objetivo.

    Solucin

    Previamente se requiere identificar:

  • 8/3/2019 Est Inf Aplicada

    38/166

    38

    Poblacin. Se trata de dos poblaciones bajo estudio:

    1: Nios de 8 aos de edad, que asisten a Instituciones Educativas Estatales.

    2: Nios de 8 aos de edad, que asisten a Instituciones Educativas Privadas.

    Muestra. Nios de 8 aos de edad seleccionados aleatoriamente e independiente de cada

    poblacin.

    Variable Aleatoria. Esta representada medianteXy se define como Puntaje de comprensin

    lectora obtenida mediante una prueba especial.

    Parmetros. En relacin a la variable aleatoria bajo estudio y considerando que se investiga

    para dos tipos de IE, los parmetros son:

    1 = Nivel promedio poblacional del puntaje de la prueba de comprensin lectora para nios

    de 8 aos de edad que asisten a IE Estatales.

    2 = Nivel promedio poblacional del puntaje de la prueba de comprensin lectora para nios

    de 8 aos de edad que asisten a IE Privados.

    1 = Desviacin estndar poblacional del puntaje de la prueba de comprensin lectora para

    nios que asisten a IE Estatales.2 = Desviacin estndar poblacional del puntaje de la prueba de comprensin lectora para

    nios que asisten a IE Privadas.

    Para lograr el objetivo 1. Se debe emplear la estimacin debido a que se requiere tener un

    valor aproximado de 1 y 2 empleando muestras aleatorias que se han obtenido de manera

    independiente de cada tipo de institucin educativa.

    Para el logro del objetivo 2. Se desea verificar que los promedios poblacionales 1 y 2 son

    diferentes a partir de muestras aleatorias, aritmticamente significa: 1 diferente de 2

    ( 1 2 ) o equivalentemente 1 - 2 = 0.

    En este caso se parte del supuesto que no existe diferencias entre el nivel promedio

    poblacional del puntaje de la prueba de comprensin lectora para nios que asisten a IE

  • 8/3/2019 Est Inf Aplicada

    39/166

    39

    Estatales y Privados. Por tanto se empleara la prueba de hiptesis estadstica, mediante el cual

    se somete a prueba 1 - 2 = 0.

    ESTADSTICA PARAMTRICA

    Segn Sierra Bravo (1991) es parte de la estadstica que exige determinados requisitos para

    emplear en la inferencia estadstica generalmente requiere para su uso el supuesto de

    normalidad es decir que las muestras aleatorias se extraen de poblaciones que estn

    normalmente distribuidas o aproximadamente.

    Ejemplo 2.11

    Se desea verificar si el tiempo promedio requerido para resolver un problema sencillo en

    nios de 10 aos de edad con secuelas neurolgicas derivadas de hiperbilirubenia al nacer, se

    incrementa despus de haber recibido una capacitacin especial para resolver problemas de

    ese tipo.

    En este caso se debe elegir una muestra aleatoria de la poblacin conformada por nios de

    esta poblacin, es decir, nios de 10 aos de edad con secuelas neurolgicas derivadas de

    hiperbilirubenia al nacer.

    La variable aleatoria bajo estudio X, es el tiempo, en minutos, para resolver un problema

    sencillo, cuyo parmetro se define como:

    = Tiempo promedio poblacional, en minutos, requerido para resolver un problema

    sencillo.

    Para estudiar a este parmetro se requiere evaluar a la muestra aleatoria de esta poblacin

    antes de la capacitacin especial y despus de la capacitacin especial, es decir los parmetros

    para este esquema, sujetos a estudio estadstico son:

  • 8/3/2019 Est Inf Aplicada

    40/166

    40

    1 : Tiempo promedio poblacional, en minutos, requerido para resolver un problema sencillo

    antes de la capacitacin.

    2 : Tiempo promedio poblacional, en minutos, requerido para resolver un problema sencilloantes de la capacitacin.

    En este caso la muestra aleatoria es relacionada, porque a cada unidad de la muestra se le

    evala bajo dos condiciones antes, y despus de la capacitacin especial.

    Para verificar el supuesto propuesto: la capacitacin especial incrementa el tiempo promedio

    requerido para resolver problemas sencillos en nios de esta poblacin a partir de muestrasrelacionadas, se aplica una prueba de hiptesis para someter a prueba: 1 : tiempo, en

    minutos, promedio poblacional requerido para resolver un problema sencillo 1 < 2 o

    equivalentemente 1 - 2 < 0.

    La Estadstica Inferencial nos da la herramienta llamada estadstica para someter a prueba la

    diferencia de medias poblacionales empleando muestras relacionadas, cuya aplicacin

    requiere que las diferencias de cada par de observaciones (tiempo empleado para resolver unproblema sencillo antes y despus de la capacitacin especial) debe tener distribucin normal

    de probabilidad. En este caso se est empleando la estadstica paramtrica debido a que debe

    cumplir con el supuesto de normalidad.

    ESTADSTICA NO PARAMTRICA

    Cuando no se da el supuesto de la normalidad se tiene dos alternativas, una de ellas esaproximar los valores de los datos a una distribucin normal para el cual a una serie de

    mtodos y la segunda alternativa es emplear los mtodos de la estadsticas no paramtricas, es

    decir, mtodos que no supone nada acerca de la distribucin poblacin muestreada por eso

    tambin a los mtodos de la estadstica no paramtrica se le llama de distribucin libre.

    Y que son excelentes cuando los tamaos muestrales son pequeos ( 10n ), asimismo estos

    mtodos se basan en el anlisis de los rangos de los datos que en las propias observaciones.

  • 8/3/2019 Est Inf Aplicada

    41/166

    41

    Ejemplo 2.12

    Considerando el caso anterior si las diferencias muestrales no cumplen con el supuesto de

    normalidad, cuya verificacin se realiza con herramientas estadsticas pertinentes, entonces se

    recurrir a la estadstica no paramtrica; y que se tratar en el captulo 6.

    EJERCICIOS PROPUESTOS

    1. Leer atentamente el siguiente resumen, del artculo de investigacin, titulado:

    COMPETENCIAS DOCENTES EN LOS PROFESORES DE MEDICINA

    DE LA UNIVERSIDAD MICHOACANA DE SAN NICOLS DE HIDALGO1

    RESUMEN

    Para la identificacin de un grupo de competencias docentes bsicas en los profesores que se

    desempean en la licenciatura en medicina en la Facultad de Medicina Dr. Ignacio Chvez,

    objetivo fundamental del presente trabajo, se utilizaron mtodos tericos y empricos. Se

    aplic una encuesta a una muestra seleccionada de docentes y alumnos. Se emplearon

    procedimientos estadsticos para el anlisis de los resultados y se elaboraron tablas. A partir

    de la identificacin de las necesidades de aprendizaje de los profesores estudiados, en relacin

    con la direccin del proceso enseanza-aprendizaje y los referentes tericos sobre el tema, se

    realiz un anlisis integrador para valorar los datos obtenidos, lo que permiti la

    caracterizacin de los docentes objeto de investigacin, en relacin con las competencias

    docentes bsicas propias de una gestin formativa pertinente. Se tomaron en consideracin los

    principios metodolgicos ms actuales acerca de la formacin de recursos humanos en laeducacin superior en sentido general y en particular en la educacin mdica superior.

    1 MANZO RODRGUEZ, Lidia, RIVERA MICHELENA, Natacha y RODRGUEZ OROZCO, Alain:Competencias docentes en los profesores de medicina de la Universidad Michoacana de San Nicolsde Hidalgo. Revista Cubana Educativa de Medicina Superior, Abril-Junio, 2006, Vol. 20, N 2.

  • 8/3/2019 Est Inf Aplicada

    42/166

    42

    A partir de este resumen:

    1.1. Defina la poblacin.

    1.2. Defina la muestra.

    1.3. Defina la(s) variable(s) aleatoria(s).

    1.4. Plantear un parmetro y su respectivo estadstico, segn su respuesta dada en 3.

    2. Leer atentamente el siguiente resumen, del artculo de investigacin, titulado:

    PERCEPCIN DE LOS ESTUDIANTES UNIVERSITARIOS

    DE SUS PROPIAS HABILIDADES DE INVESTIGACIN2

    RESUMEN

    El objetivo de esta investigacin fue identificar la percepcin que tienen los estudiantes

    universitarios respecto a sus habilidades de investigacin, para lo cual se utiliz un

    instrumento llamado Autoevaluacin de habilidades de investigacin (Rivera, Torres,

    Garca Gil de Muoz, Salgado, Arango, Caa y Valentn, 2005). Participaron 119 estudiantes

    de los cuales73.7 % fueron mujeres y 26.3 % hombres, entre ellos, el 88.2 % se encontraba

    realizando estudios de licenciatura y el 11.8 % de posgrado. Se cont con representantes de

    cuatro reas de conocimiento: Ciencia y tecnologa, Ciencias humanas, Ciencias econmico

    administrativas, y Educacin. La confiabilidad del instrumento aplicado fue alta (Alfa de

    Cronbach = 9557). Se encontr que la mayora de los estudiantes asignan calificaciones altasa sus habilidades de investigacin y que por lo general los hombres y las mujeres evalan sus

    habilidades de investigacin de manera semejante; cuando aparecen diferencias significativas,

    2 Mara Elena RIVERA HEREDIA [email protected] y Claudia Karina TORRESVILLASEOR [email protected] (Universidad Simn Bolvar).www.usb.edu.mx/investigacion/cif/proyectos/proyecto3/habilidades.doc

  • 8/3/2019 Est Inf Aplicada

    43/166

    43

    son los hombres quienes se asignan puntajes ms altos. Se discuten las diferencias entre los

    resultados arrojados por este cuestionario con los de otras estrategias de evaluacin.

    En base a este resumen, plantear como sera la aplicacin de la inferencia estadstica bajo el

    enfoque de:

    2.1. Estimacin de parmetros.

    2.2. Prueba de hiptesis de parmetros.

  • 8/3/2019 Est Inf Aplicada

    44/166

    44

    CAPTULO 3

    ESTIMACIN DE PARAMTROS

    3.1. INTRODUCCIN

    Los estimadores son variables aleatorias, veamos un ejemplo cuando se estima la varianza de

    una poblacin en base a una nuestra aleatoria difcilmente se puede esperar que el valor de la

    varianza que obtenemos, a partir de los valores de la muestra aleatoria extrada, sea

    exactamente igual al valor de la varianza poblacional 2 ; pero debemos esperar que ambos,

    la varianza muestral y la varianza poblacional, estn lo ms cerca posible; Esto es el valor del

    estadstico y el parmetro tomen valores muy similares.

    2s 2

    Pero el investigador no tiene la posibilidad o no puede disponer de los datos de toda la

    poblacin, entonces debe usar las diversas propiedades estadsticas de los estimadores para

    que decida cul es el estimador ms apropiado, cul expone a un riesgo menor, cul dar lamayor informacin al costo ms bajo, y as podemos seguir enunciando propiedades ptimas.

    Por tanto es necesario revisar o examinar las propiedades de los estimadores.

    3.2. PROPIEDADES DE LOS ESTIMADORES

    No se tiene la certeza que los estimadores tengan el valor del parmetro, por ello debemos

    considera sus propiedades.

    3.2.1. INSESGAMIENTO

    No hay estimadores perfectos que siempre nos van a dar los valores exactos del parmetro

    pero es razonable que un estimador debe hacerlo al menos en el promedio, esto es su valor

  • 8/3/2019 Est Inf Aplicada

    45/166

    45

    esperado debe ser igual al parmetro que se supone estima. Es este caso se dice que es

    estimador es insesgado.

    Formalmente un estadstico

    es un estimador insesgado del parmetro , cuando ( ) =

    E

    Ejemplo 3.1

    El estimador 2s es insesgado de 2 , por que:

    ( ) 22 =sE

    Es decir en promedio el estimador 2s es igual a 2

    3.2.2. PROPIEDAD DE EFICIENCIA

    Si tenemos que escoger uno entre varios estimadores insesgados de un parmetro dado, se

    suele tomar aquel cuya distribucin muestral tenga la varianza ms pequea, por tanto el

    estimador seleccionado de varianza ms pequea es eficiente.

    Ejemplo 3.2

    Sean 21 y , estimadores insesgados de , si sus varianzas respectivas son 21 )( yVV ,

    tal que ( ) ( )21 VV < , entonces 1 es un estimador eficiente, porque el estimador 1 tiene

    menor varianza que 2 .

    3.2.3. CONSISTENCIA

    Llamada tambin propiedad lmite de un estimador, se refiere a que cuando n es

    suficientemente grande, podemos estar prcticamente seguros de que el error entre el

    estimador y el parmetro ser menor que cualquier constante positiva. Formalmente: la

  • 8/3/2019 Est Inf Aplicada

    46/166

    46

    estadstica es un estimador consistente del parmetro si y solo si para cada c>0, se

    cumple que:

    1lim =

  • 8/3/2019 Est Inf Aplicada

    47/166

    47

    Ejemplo 3.4

    Consideremos los datos de la variable edad en aos cumplidos, del ejemplo 2.8, a fin de

    calcular la mediana, para ello previamente ordenamos los datos de manera ascendente.

    Orden 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

    Edad 30 34 35 36 36 38 39 42 43 44 44 46 47 48 49

    El dato que est en la posicin (orden) 8 es el valor de la mediana, es decir, =Me 42 aos y se

    interpreta como, el 50 % de docentes con edades ms bajas tienen como edad mxima 42

    aos.

    Recuerde que x = 40,73 aos, con respecto a la mediana esta subestimada, esto se debe a la

    presencia de edades extremas bajas.

    Slo por cuestiones didcticas, vamos a asumir que la edad 49 no es tal, sino es 68, veamos

    que ocurre con los valores de la media aritmtica y la mediana, observe ahora los datos

    ordenados de manera ascendente son:

    Orden 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

    Edad 30 34 35 36 36 38 39 42 43 44 44 46 47 48 68

    Ahora la x = 42 aos y est afectada por el valor extremo alto 58, la media se sobreestima,

    pero la mediana no cambia, por que el valor extremo alto no le afecta, ya que para el clculo

    de la mediana solo interesa el valor de la variable que est en el lugar o posicin central. Por

    tanto la mediana es una estadstica que tiene la propiedad de robustez, por que su valor no se

    afecta por valores extremos.

  • 8/3/2019 Est Inf Aplicada

    48/166

    48

    3.3. ESTIMACIN DE PARMETROS MEDIANTE INTERVALOS DE

    CONFIANZA

    Un intervalo de confianza es un intervalo estimador de un parmetro, cuyos extremos, el

    lmite inferior (LI) y lmite superior (LS) son funciones de la muestra, es decir depende

    solamente de valores muestrales.

    Un intervalo de confianza del parmetro es un intervalo [ ]LSLI, , que incluye al parmetro

    con cierto grado de incertidumbre establecido.

    Tomando en cuenta la distribucin del estimador, construir un intervalo de confianza es

    equivalente a plantear el enunciado probabilstico siguiente:

    [ ] = 1LSLIP (3.1)

    Donde es un nmero positivo pequeo y el valor ( )1 indica la proporcin esperada de

    las veces que el intervalo contendr al parmetro cuando el muestreo se repite un determinado

    nmero de ocasiones.

    Este valor (1-) se conoce como nivel de confianza. El nivel de confianza se fija de antemano

    y su valor debe ser grande. A menudo se usa como valores de como 0.10, 0.05, 0.01, de

    esta manera los niveles de confianza son 0.90, 0.95 y 0.99, respectivamente. A diferencia del

    estimador puntual que solo plantea un nico valor, el intervalo de confianza brinda un

    conjunto de posibles valores, respaldado por la probabilidad de que contenga el valor del

    parmetro.

    En las siguientes secciones trataremos acerca de la estimacin de parmetros mediante

    intervalos de confianza, de forma aplicada, para aquellos lectores que les interese el

    fundamento estadstico matemtico, recomendamos revisar en el este captulo bibliografa

    correspondiente.

  • 8/3/2019 Est Inf Aplicada

    49/166

    49

    La siguiente teora est basada en el libro de Freund, E. John, et al (2000) y brindamos las

    aplicaciones paso a paso a fin que se entienda el uso, el clculo y la interpretacin del

    intervalo de confianza.

    3.4. INTERVALO DE CONFIANZA PARA ESTIMAR LA MEDIA DE UNA

    POBLACIN NORMAL

    El parmetro , media poblacional, se obtiene de datos poblacionales, al estudiar una

    variable cuantitativa continua.

    En general la construccin del intervalo para estimar mediante intervalo a un parmetro,

    depende de los siguientes elementos:

    1. De la probabilidad o nivel de confianza que elija el investigador, y es la medida de certeza

    que consideramos a fin que el intervalo de confianza contenga el valor del parmetro.

    2. Del tamao(s) de la(s) muestra(s) aleatoria(s).

    3. Del error estndar del estimador.

    Las estimaciones mediante intervalos los haremos empleando los datos recolectados de la

    muestra aleatoria, que mediante los mtodos de la Estadstica Inferencial, se podr realizar

    conclusiones de la poblacin, es decir, los resultados de la muestra se generalizan para la

    poblacin, con cierta probabilidad de confianza.

    La ventaja de estimar aun parmetro mediante intervalo de confianza es que, para su clculo

    se considera la variabilidad del estimador puntual, llamado error estndar, del cual hemos

    tratado en la seccin 2.8.

  • 8/3/2019 Est Inf Aplicada

    50/166

    50

    Para interpretar al intervalo de confianza no solo debe realizarse en trminos cuantitativos

    sino se debe contextualizar y ser conscientes que la calidad de los datos, es decir su

    pertinencia, respecto a los objetivos para lograr en la investigacin o las hiptesis a

    verificarse, harn que los clculos obtenidos no sean fros, por el contrario estar indicando

    alguna propiedad respecto a la poblacin.

    3.4.1. CUANDO LA VARIANZA POBLACIONAL2 ES CONOCIDA

    Si x es la media de una muestra aleatoria de tamaon obtenida de una poblacin normal con

    varianza poblacional2

    conocida, entonces:

    +

    nzx

    nzx

    2/2/ , (3.1)

    Es un intervalo de confianza del ( )1 100 % para la media poblacional .

    RECUERDE

    Un intervalo de confianza o estimacin mediante intervalo de confianza es un conjunto

    de valores que probablemente contiene al valor del parmetro (expresin 3.1)

    RECUERDE

    Si los datos no se han recolectado adecuadamente, sin el debido cuidado, pueden

    resultar intiles, aunque se el tamao de la muestra sea grande.

  • 8/3/2019 Est Inf Aplicada

    51/166

    51

    En este caso la distribucin de probabilidad normal es el soporte para realizar la inferencia,

    mediante la estimacin por intervalo de confianza.

    Sus lmites son:

    Lmite inferior :n

    zx

    2/

    Lmite superior :n

    zx

    2/+

    Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error

    estndar de la media muestral, ver seccin 2.8.1.

    Los valores de los lmites contienen al estimador puntual x , al valor de este estimador para

    obtener los lmites inferior y superior se disminuye y adicionan

    z

    2/ respectivamente.

    La amplitud o rango del intervalo de confianza es:n

    z

    2/2 , esto significa que los posibles

    valores del parmetro , de una poblacin normal, basado en una muestra aleatoria de

    tamao n y cuando la varianza poblacional 2 es desconocida depende de dos factores: la

    probabilidad de confianza que elija el investigador y del error estndar del estimador puntual

    de , que es la x , esto es,n

    . Como tambin del valor del valor del estimador puntual del

    parmetro.

    En el siguiente grfico, se muestra la particin de la distribucin normal estandarizada para

    obtener un intervalo de confianza al ( )1 100 %.

  • 8/3/2019 Est Inf Aplicada

    52/166

    52

    Grfico N 3.1

    Particin de la distribucin normal estandarizada para obtener

    un intervalo de confianza para

    El valor 2/z es la cuantila (abscisa) de la distribucin normal estandarizada, tal que la

    probabilidad hacia la derecha es 2/ .

    Esta y el resto de cuantilas que se requieren para el clculo de los intervalos de confianza, los

    obtenemos mediante el software Excel. En el apndice se muestra la forma de obtenerlos.

    Ejemplo 3.5

    El director de la EAP de Educacin elige al azar a 16 alumnos de pregrado que estn

    matriculados en el curso Estadstica Aplicada a la Educacin y que asisten regularmente, con

    el objetivo de conocer si han comprendido el uso y la importancia de la estimacin de

    parmetros mediante intervalo de confianza. Las calificaciones obtenidas mediante una

    prueba pertinente (escala vigesimal) tiene distribucin normal con 2 = 7,43. El director

    desea saber cunto es la calificacin promedio para todos los alumnos que estn matriculados

    en el curso mencionado. Las calificaciones obtenidas de los 16 alumnos son:

    17 13 14 15 13 17 13 8 12 16 15 10 11 13 15 9

    )1,0(N

  • 8/3/2019 Est Inf Aplicada

    53/166

    53

    Solucin

    Primero identificamos la variable aleatoria:

    X: Calificacin de la prueba que mide la comprensin del uso y la importancia de la

    estimacin de parmetros mediante intervalo de confianza.

    Esta variable aleatoria tiene distribucin normal con parmetros:

    :Calificacin promedio poblacional

    2 = 7,43

    El nivel de confianza que se emplear es 0.95 o del 95%

    Para estimar empleamos la expresin 3.1, los valores de la abscisa normal estandariza se

    presenta en el siguiente grfico.

    Los valores requeridos son:x = 13,2 (estimador puntual de ), 2/z = 1,96 y 43,7

    2 == = 2,73.

    Los lmites del intervalo de confianza para son:

    Lmite inferior:n

    zx

    2/ = 86,1134,12,1316

    73,296,12,13 ==

    Lmite superior:n

    zx

    2/+ = 54,1434,12,1316

    73,296,12,13 =+=

    +

  • 8/3/2019 Est Inf Aplicada

    54/166

    54

    Por tanto se espera con un 95 % de probabilidad de confianza, que la calificacin promedio

    para todos los alumnos que estn matriculados en el curso Estadstica Aplicada a la Educacin

    y que asisten regularmente, tome valores entre 11,86 y 14,54.

    3.4.2. CUANDO LA VARIANZA POBLACIONAL, 2 , SE DESCONOCE

    Si x es la media de una muestra aleatoria de tamaon obtenida de una poblacin normal con

    varianza poblacional 2 desconocida, entonces:

    +

    n

    stx

    n

    stx 2/2/ , (3.2)

    Es un intervalo de confianza del ( )1 100 %, para la media poblacional .

    En este caso la distribucin de probabilidad t-Studentes el soporte para realizar la inferencia,

    mediante la estimacin por intervalo de confianza. Sus lmites son:

    Lmite inferior:n

    stx 2/

    Lmite superior:n

    stx 2/+

    Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error

    estndar de la media muestral, pero cuando la varianza poblacional, 2 , se desconoce, por

    tanto se usa como estimador de 2 a la cuasivarianza, seccin 2.8.2:

    ( )=

    =n

    i

    i xxn

    s1

    22

    1

    1

    La desviacin estndar muestral es: 2ss =

  • 8/3/2019 Est Inf Aplicada

    55/166

    55

    Los valores de los lmites contienen al estimador puntual x , al valor de este estimador para

    obtener los lmites inferior y superior se disminuye y adicionan

    st 2/ respectivamente.

    En el siguiente grfico, se muestra la particin de la distribucin t-Studentpara obtener un

    intervalo de confianza al ( )1 100 %.

    Grfico N 3.2

    Particin de la distribucint-Student para obtener

    un intervalo de confianza para

    El valor 2/t es la cuantila (abscisa) de la distribucin t-Studentcon n-1 grados de libertad, tal

    que la probabilidad hacia la derecha es 2/ .

    Ejemplo 3.6

    Como parte de la evaluacin de la calidad del aprendizaje en escolares del segundo grado de

    primaria de Instituciones Educativas estatales, el equipo evaluador ha elegido al azar a 20

    nios de esta poblacin. Se les aplico una prueba de aritmtica que consta de 30 problemas

    para este nivel, los autores de la prueba indican los escolares de este grado escolar debe

    emplear en promedio 40 minutos, para resolver estos problemas.

    )1( nt

    2/t 2/t

  • 8/3/2019 Est Inf Aplicada

    56/166

    56

    El equipo evaluador desea estimar el tiempo promedio que emplean todos los nios de este

    nivel de estudios para resolver esta prueba, si se sabe que el tiempo tiene distribucin normal.

    Los tiempos empleados por los alumnos son:

    50 48 48 55 40 52 57 55 47 46

    43 49 51 50 53 48 50 46 43 45

    Solucin

    Primero identificamos la variable aleatoria:

    X: Tiempo empleado para resolver los 30 problemas.

    Esta variable aleatoria tiene distribucin normal con parmetros:

    :Tiempo promedio poblacional empleado para resolver los 30 problemas.

    2 : Varianza poblacional del tiempo empleado para resolver los 30 problemas.

    No se dispone del valor de 2 .

    El nivel de confianza que se emplear es 0.95 o del 95%.

    Para estimar empleamos la expresin 3.2, los valores de la abscisa de la distribucin t-

    Studentcon n-1 = 19 grados de libertad se presenta en el siguiente grfico, que corresponde a

    la participacin de la distribucin t-Student.

    Los valores requeridos son:

    x = 48,8 2/t = 2,093 y 01,192 == ss = 4,36.

    - 093,2 093,2

    )19(t

  • 8/3/2019 Est Inf Aplicada

    57/166

    57

    Los lmites del intervalo de confianza son:

    Lmite inferior:n

    stx 2/ = 76,4604,28,48

    20

    36,4093,28,48 ==

    Lmite superior:nstx 2/+ = 84,5004,28,482036,4093,28,48

    =+=

    +

    Por tanto, se espera con un 95% de probabilidad de confianza que el tiempo promedio

    poblacional empleado para resolver los 30 problemas, est comprendido entre 46,76 y 50,84

    minutos. La estimacin intervlica indica que esta poblacin est fuera de control, por que la

    norma indica que el tiempo promedio poblacional empleado es de 40 minutos, valor que no

    pertenece al intervalo de confianza obtenido.

    3.5. INTERVALO DE CONFIANZA PARA ESTIMAR LA VARIANZA

    POBLACIONAL 2 DE UNA POBLACIN NORMAL

    Si 2s es la varianza de una muestra aleatoria de tamaon obtenida de una poblacin normal,

    entonces:

    2

    2/

    2

    22/1

    2

    )1(,)1(

    snsn (3.3)

    Es un intervalo de confianza del ( )1 100 %, para la varianza poblacional 2 .

    En este caso la distribucin de probabilidad Chi-cuadrado o Ji-cuadrado, es el soporte para

    realizar la inferencia, mediante la estimacin por intervalo de confianza; sus lmites son:

    Lmite inferior: 22/1

    2)1(

    sn

    Lmite superior: 22/

    2)1(

    sn

    Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error

    estndar estimado de la varianza muestral 2s .

  • 8/3/2019 Est Inf Aplicada

    58/166

    58

    Los valores de los lmites contienen al estimador puntual. En el siguiente grfico, se muestra

    la particin de la distribucin Chi-cuadrado para obtener un intervalo de confianza al ( )1

    100%, para 2 .

    Grfico N 3.3

    Particin de la distribucin Chi cuadradopara obtener

    un intervalo de confianza para 2

    Fuente: virtual.uptc.edu.co/.../libro/node104.htm (23.05.06)

    El valor2

    2/ es la cuantila (abscisa) de la distribucin Chi cuadrado tal que la probabilidad

    acumulada es igual a 2/ y el valor 2 2/1 es la cuantila (abscisa) de la distribucin Chi

    cuadrado tal que la probabilidad acumulada es igual a 2/1 , pero la distribucin Chi

    cuadrado tiene n-1 grados de libertad.

    Ejemplo 3.7

    Considerar el ejemplo 3.6, para estimar mediante intervalo de confianza a 2 , varianza

    poblacional del tiempo empleado para resolver los 30 problemas. Interprete.

    Solucin

    El nivel de confianza que se emplear es 0.95 o del 95 %. Para estimar 2 , mediante

    intervalo de confianza usamos la expresin 3.3; Los valores de la abscisa de la distribucin

    chi cuadrado con n-1 = 19 grados de libertad se presenta en el siguiente grfico:

  • 8/3/2019 Est Inf Aplicada

    59/166

    59

    Los valores de requeridos, para calcular el intervalo de confianza son:

    01,192 =s ; 2025,0

    = 8,91 =2975,0

    32,85.

    Los lmites son:

    Lmite inferior: 99,1085,32

    )01,19(19)1(2

    2/1

    2

    ==

    sn

    Lmite superior: 54,4091,8

    )01,19(19)1(2

    2/

    2

    ==

    sn

    Por tanto se espera con un 95% de probabilidad de confianza, que la varianza poblacional del

    tiempo empleado para resolver los 30 problemas, est comprendido entre 10,99 y 40,54

    minutos2.

    3.5. INTERVALO DE CONFIANZA PARA ESTIMAR LA PROPORCIN

    POBLACIONAL DE UNA POBLACIN BINOMIAL

    Si p es una proporcin de una muestra aleatoria n (grande) obtenida de una poblacin

    binomial con parmetro , entonces:

    +

    n

    ppzp

    n

    ppzp

    )1(,

    )1(2/2/ (3.4)

    Es un intervalo de confianza del ( )1 100%, para estimar la proporcin poblacional .

    2)19(

    8,91 32,85

  • 8/3/2019 Est Inf Aplicada

    60/166

    60

    Siendo p : Es el estimador puntual de , expresin 2.8 de la seccin 2.8.3.

    En este caso la distribucin de probabilidad normal estandarizada es el soporte para realizar la

    inferencia, mediante la estimacin por intervalo de confianza.

    Sus lmites son:

    Lmite inferior:n

    ppzp

    )1(2/

    Lmite superior:n

    ppzp

    )1(2/

    +

    Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error

    estndar estimado de la proporcin muestral.

    Los valores de los lmites contienen al estimador puntual p , al valor de este estimador para

    obtener los lmites inferior y superior se disminuye y adicionan

    ppz

    )1(2/

    respectivamente.

    En el siguiente grfico, se muestra la particin de la distribucin normal estandarizada para

    obtener un intervalo de confianza al ( )1 100%, para la proporcin poblacional.

    Grfico N 3.4

    Particin de la distribucin normal estandarizada

    para obtener un intervalo de confianza para

    )1,0(N

  • 8/3/2019 Est Inf Aplicada

    61/166

    61

    El valor 2/z es la cuantila de la abscisa normal estandarizada tal que la probabilidad hacia la

    derecha es 2/ .

    Ejemplo 3.8

    Se aplica un cuestionario que mide la actitud hacia la autoevaluacin de la calidad educativa a

    una muestra aleatoria de alumnos de la Facultad de Ciencias Matemticas. De un total de 364

    alumnos, 247 evidencian actitud positiva hacia la autoevaluacin.

    Se solicita que estime la proporcin de alumnos de esta Facultad con actitud positiva hacia la

    autoevaluacin de la calidad educativa.

    Solucin

    Primero identificamos la variable aleatoria:

    X: Actitud hacia la autoevaluacin de la calidad educativa, siendo la clase de inters actitud

    positiva.

    Esta variable aleatoria tiene distribucin binomial con parmetros n grande (n = 364) y :

    Proporcin poblacional de alumnos de la Facultad de Ciencias Matemticas, con actitud

    positiva hacia la autoevaluacin de la calidad educativa.

    El nivel de confianza que se emplear es 0.90 (90%).

    Para estimar empleamos la expresin 3.4, los valores de la abscisa de la distribucin

    normal estandarizada se presenta en el siguiente grfico:

  • 8/3/2019 Est Inf Aplicada

    62/166

    62

    Los valores requeridos, para el clculo del intervalo de confianza correspondiente son:

    == 364

    247p 0,6786, 2/z = 1,645.

    Reemplazando en la expresin 3.4, se obtiene lo siguiente:

    Lmite inferior:n

    ppzp

    )1(2/

    =

    6541,00245,06786,0364

    )6786,01(6786,0645,16786,0 ==

    Lmite superior:n

    ppzp

    )1(2/

    + =

    7031,00245,06786,0364

    )6786,01(6786,0645,16786,0 =+=

    Por tanto se espera que con un 90% de probabilidad de confianza, que la proporcin de

    alumnos de esta Facultad con actitud positiva hacia la autoevaluacin de la calidad educativa

    est comprendida entre 0,6541 (65,41%) y 0,7031 (70,31%).

  • 8/3/2019 Est Inf Aplicada

    63/166

    63

    3.5. INTERVALO DE CONFIANZA PARA ESTIMAR DIFERENCIA DE MEDIAS

    POBLACIONALES, 21 , DE POBLACIONES NORMALES

    Cuando en una investigacin deseamos comparar a dos grupos o poblaciones, empleando losvalores de una variable aleatoria, estamos realizando anlisis de diferencias.

    Estas poblaciones pueden ser independientes o relacionadas, por tanto las muestras aleatorias

    que servirn para realizar inferencias mediante intervalos de confianza tambin estn en ese

    sentido, veamos.

    3.5.1. USANDO MUESTRAS INDEPENDIENTES

    Proponemos el siguiente caso, el coordinador del curso Ciencia y Ambiente a fin de mejorar

    el rendimiento de sus alumnos dispone de dos mtodos de enseanza:

    1. Resolucin de problemas.

    2. Discusin de casos.

    El coordinador desea saber con cul mtodo los alumnos, de la Institucin educativa donde

    trabaja, obtienen mejor rendimiento; entonces realiza el estudio entre alumnos del tercer grado

    de secundaria de dos secciones. A una seccin le asigna aleatoriamente el mtodo resolucin

    de problemas y a la otra seccin, el mtodo discusin de casos.

    Es obvio que cada mtodo de enseanza se desarrolla independientemente uno del otro. A

    este tipo de diseo se le llama de muestras independientes y la comparacin se realiza en base

    al rendimiento de los dos grupos.

    El rendimiento de los alumnos se mide mediante una prueba diseada por el coordinador, que

    debe ser vlida y confiable.

  • 8/3/2019 Est Inf Aplicada

    64/166

    64

    3.5.1.1.CUANDO LAS VARIANZAS POBLACIONALES 21 Y22 SON

    DESCONOCIDAS PERO 2221 =

    Si 1x y 2x son las medias de muestras aleatorias independientes de tamaos 1n y 2n de

    poblaciones normales con varianzas poblacionales 21 y22 , conocidas e iguales, entonces:

    ( )21

    2/2111

    nnStxx p + (3.5)

    Es un intervalo de confianza del ( ) %1001 de probabilidad de confianza, para la diferencia21 .

    Donde:

    ( ) ( )

    2

    11

    21

    222

    2112

    +

    +=

    nn

    snsnS

    p(3.6)

    Es el estimador insesgado de la varianza comn.

    El valor 2/t es la cuantila (abscisa) de la distribucin t-Student con 221 + nn grados de

    libertad, tal que la probabilidad hacia la derecha es 2/ . La particin de la distribucin de

    probabilidad t-Studentes similar a la del grfico 3.2.

    Esto es la distribucin de probabilidad t-Studentes el soporte para obtener los lmites y son:

    Lmite inferior: ( )21

    2/2111

    nnStxx p +

    Lmite superior: ( )21

    2/2111nn

    Stxx p ++

  • 8/3/2019 Est Inf Aplicada

    65/166

    65

    Ejemplo 3.9

    En la enseanza es muy importante emplear las Tecnologas de la Informacin y las

    Comunicaciones (TICs) porque brinda resultados positivos en el aprendizaje de los alumnos,

    un investigador desea mostrar las ventajas para la enseanza de Historia del Per frente a la

    enseanza tradicional (expositor, pizarra, tiza y papelgrafo).

    Empleando las TICs no solo requiere los conocimientos mnimos sobre el hardware y el

    software a emplearse, sino buscar informacin relevante para la enseanza, crear materiales,

    digitales o multimedia para la docencia y la investigacin del curso que se imparte.

    Un equipo de investigadores ha desarrollado un software, PER, para la enseanza de

    Historia del Per, para los alumnos del cuarto grado de secundaria. Para verificarlo se

    selecciona una muestra aleatoria de tamao 40, con caractersticas similares. Veinte escolares

    se asignan al azar al grupo control (enseanza tradicional) y los otros veinte al grupo

    experimental (enseanza con el software PER), en ambos grupos ensean docentes que han

    sido debidamente capacitados y desarrollan el mismo contenido temtico. Al final del curso se

    aplica una prueba que mide el nivel de conocimientos sobre Historia del Per a cada grupo y

    se obtienen las siguientes calificaciones.

    13 9,5 12 13 11,5 12 9,5 12 10 13,5Grupo control

    11 13,5 11,5 10,5 9 12 8 12 10,5 15

    14,5 13,5 16,5 17 12 13,5 14 17,5 14 16Grupo experi-

    mental 17,5 15 15,5 13 17 15 15,5 16 14,5 14,5

    Calcule e interprete la estimacin de la diferencia de calificaciones promedios poblacionales

    para los dos grupos, sabiendo que las calificaciones para cada grupo tiene distribucin

    normal, con varianzas desconocidas e iguales.

    Solucin

    X: Calificacin de la prueba que mide el nivel de conocimientos sobr