teorema central del límite. - postdata-statistics€¦ · teorema central del límite. cálculo...

14
Teorema Central del Límite. Cálculo Numérico y Estadística. Grado en Química. U. de Alcalá. Curso 2014-2015. F. San Segundo.

Upload: others

Post on 26-Apr-2020

10 views

Category:

Documents


0 download

TRANSCRIPT

Teorema Central del Límite.

Cálculo Numérico y Estadística. Grado en Química. U. de Alcalá. Curso 2014-2015.

F. San Segundo.

Motivación de las variables aleatorias continuas.

En las variables aleatorias discretas hemos usado una tabla de densidad para ver como se

reparte la probabilidad entre los distintos valores de la variable. Pero, como hemos visto en el

caso de la binomial, a medida que el número de valores aumenta y las diferencias entre ellos

empiezan a resultar irrelevantes, cobra cada vez más sentido la idea de reemplazar los

recángulos de la tabla por el área bajo la grá�ca de una curva que describa la distribucion de

probabilidad.

2/14

Variables aleatorias continuas: la función de densidad.

Para que esa idea funcione necesitamos una función con estas propiedades:

Dada una función con esas propiedades, para calcular la probailidad de que la

variable aleatoria de�nida por tome un valor en el intervalo usamos

la integral:

Y decimos que es la función de densidad de la variable aleatoria

f

No negativa: para todo ; es decir, no toma valores negativos.

Probabilidad total igual a : el área total bajo la grá�ca de es 1:

· f(x) ≥ 0 x f

· 1 f

f(x)dx = 1∫ ∞

−∞

fX f (a, b)

P(a ≤ X ≤ b) = f(x)dx∫ b

a

f X

3/14

Interpretación de la función de densidad.

La función de densidad indica cómo se reparte la probabilidad total entre distintas zonas de

valores de la variable en el eje . Cuanto más alta sea la función de densidad en un intervalo,

mayor probabilidad hay de que tome un valor de ese intervalo.

XX

4/14

Ejemplo 1: un caso típico.

Dada la función , empezamos por ver su grá�ca (atención a las escalas de

los ejes):

GeoGebra es muy útil para explorar la grá�ca de una función, porque permite hacer zoom y

desplazarse de forma muy sencilla.

f(x) =2√

π(1 + )x4

f = function(x){sqrt(2) / (pi * (x^4 + 1))}

curve(f, from = -10, to = 10, col="red", lwd=3)

abline(h=0, lwd=3);abline(v=0, lwd=3) #ejes

5/14

Ejemplo 1: comprobación de la condición de integral total 1.

Vamos a empezar por usar varios programas para comprobar que se cumplen las condiciones

para usarla como función de densidad.

Pero no hay una forma fácil de hacer cálculos simbólicos.

en GeoGebra usaríamos: Integral[sqrt(2)/(pi * (x^4 + 1)), -∞, ∞] Usa la Vista

CAS para un resultado simbólico, o la Línea de entrada para un resultado numérico.

En Wolfram Alpha sería integrate sqrt(2)/(pi * (x^4 + 1)) from -oo to oo.

Este programa devuelve ambos valores, simbólico y numérico.

En R el cálculo numérico es:

·

·

·

integrate(f, -Inf, Inf)

## 1 with absolute error < 1.4e-05

6/14

Ejemplo 1: cálculo de la probabilidad de un intervalo.

Una vez que sabemos que es una función de densidad, podemos empezar a usarla para

calcular probabilidades. Por ejemplo, la probabilidad se corresponde con el

área bajo la curva entre y . Grá�camente (las escalas no son iguales):

Y se obtiene , como

puedes comprobar con cualquiera de los programas que hemos usado. En GeoGebra:

Integral[sqrt(2)/(pi * (x^4 + 1)), 0, 1]

P (0 < X < 1)x = 0 x = 1

P(0 < X < 1) = f(x)dx = ≈ 0.39027∫ 1

0

π + 2 ( )coth−1 2√4π

7/14

Ejemplo 2: función de densidad con soporte en un intervalo acotado.

Nos referimos a los casos en los que la función de densidad es igual a 0 fuera de un intervalo

acotado. Por ejemplo:

La grá�ca de la función es:

En el Tutorial05 hay detalles de cómo dibujar estas grá�cas.

f(x) = { 6 ⋅ (5x − 6 − )x2

0

si 2 < x < 3,

en cualquier otro caso.

8/14

Ejemplo 2: condición de integral total 1 y probabilidad de intervalos.

Puedes empezar comprobando que con esa de�nición

En GeoGebra usaríamos

Y para calcular, por ejemplo, la probabilidad usaríamos:

Se obtiene, aproximadamente, 0.792. Para intervalos no completamente contenidos en :

y estamos en el caso anterior.

f(x)dx = 6 ⋅ (5x − 6 − )dx = 1∫ ∞

−∞∫ 3

2x2

Integral[6 * (5 * x - 6 -x^2), 2, 3]

P (2.2 < X < 2.8)

Integral[6 * (5 * x - 6 -x^2), 2.2, 2.8]

(2, 3)

P (2.5 < X < 4) = f(x)dx = f(x)dx + f(x)dx = f(x)dx + 0 = f∫ 4

2.5∫ 3

2.5∫ 3

2.5∫ 3

2.5∫ 3

2.5

9/14

Función de distribución de una variable aleatoria continua.

La función de distribución de la variable aleatoria continua se de�ne mediante:

Esta ecuación muestra que (la f. de densidad es la derivada de la función de

distribución). En general es una función creciente sigmoidea (con forma de S), de aspecto

parecido a esta grá�ca:

F X

F(k) = P(X ≤ k) = f(x)dx.∫ k

−∞

(x) = f(x)F ′

F

10/14

Media y varianza de una variable aleatoria continua.

Las fórmulas que hemos visto en el caso discreto se pueden extender por analogía al caso

continuo, cambiando:

Así se obtienen estas dos expresiones:

Si es una variable aleatoria continua con función de densidad , entonces

la media de es el valor

mientras que la varianza de es:

sumas por integrales,

el valor de P(X = x) por

·

· f(x)dx

X f(x)X

μ = x ⋅ f(x)dx∫ ∞

−∞

X

= (x − μ ⋅ f(x)dx.σ2 ∫ ∞

−∞)2

11/14

Ejemplos.

Para calcular la media de la variable del Ejemplo 1 que hemos visto antes podemos usar

GeoGebra, con el comando

y se obtiene , como nos debería haber hecho ver la intuición. La varianza no es tan

evidente, pero la calculamos con:

y se obtiene . Para hallar la media de la del Ejemplo 2 sería:

y se obtiene . La varianza se calcula con:

y se obtiene .

μ X

Integral[x * sqrt(2)/(pi * (x^4 + 1)), -∞, ∞]

μ = 0

Integral[(x - 0)^2 * sqrt(2)/(pi * (x^4 + 1)), -∞, ∞]

= 1σ2 μ X

Integral[x * 6 * (5 * x - 6 -x^2), 2, 3]

μ = 52

Integral[(x -5/2)^2 * 6 * (5 * x - 6 -x^2), 2, 3]

120

12/14

Distribución uniforme.

La distribución uniforme es un tipo muy sencillo de variable aleatoria continua, diseñada para

que la probabilidad total se reparta de manera uniforme por un intervalo , de manera

que todos los subintervalos de sean igual de probables.

Para conseguir esto su función de densidad tiene que ser constante en el intervalo e

igual a fuera de ese intervalo. Como la probabilidad total tiene que ser se obtiene:

La media de la distribución uniforme en es, como cabría esperar,

Dejamos como ejercicio el cálculo de su varianza.

La variable uniforme corresponde a la idea intuitiva (pero incorrecta) de que "todos los puntos

del intervalo son igual de probables".

(a, b)(a, b)

(a, b)0 1

f(x) =⎧⎩⎨⎪⎪

1b − a

0

si a < x < b

en otro caso.

(a, b)

μ = .a + b

2

(a, b)

13/14

La aparente paradoja de las variables continuas.

¿Por qué hemos dicho que esa idea es incorrecta?

Porque si es una variable aleatoria cualquiera (no hace falta que sea uniforme) la

probabilidad de un punto cualquiera tiene que ser necesariamente :

Para ver porque es esto, imagínate que la probabilidad de un punto fuera extremadamente

pequeña, del orden de millonésimas. Aún en ese caso, cualquier intervalo contiene

in�nitos puntos. Así que al sumar el valor de la probabilidad de esos puntos por separado se

obtendría siempre un valor mayor que .

En las variables aleatorias continuas, conviene insistir en esto, son los intervalos los que

tienen probabilidad no nula, no los puntos. En la práctica, este carácter de las variables

continuas las hace mucho más adecuadas para describir los problemas del mundo real en los

que hay imprecisiones; en general, lo más a lo que podemos aspirar es a decir que el valor de

una cierta variable está contenido en un intervalo.

Xx0 0

P (X = ) = 0.x0

(a, b)

1

14/14