informática - gráficos estadísticos univariantes · informática - gráficos estadísticos...

Post on 26-Jun-2020

2 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

InformáticaGráficos estadísticos univariantes

Álvaro Romero Jiménez

Departamento de Ciencias de la Computación e Inteligencia ArtificialUniversidad de Sevilla

Próposito de los gráficos estadísticos

La excelencia en los gráficos estadísticos consiste en lacomunicación de ideas complejas con claridad, precisión yeficiencia. Algunos de los objetivos principales de un gráficoestadístico se describen a continuación:

2 / 20

Próposito de los gráficos estadísticos

1. Mostrar los datos.2. Inducir al observador a pensar acerca del contenido en

lugar de la metodología, el diseño gráfico o la tecnologíaque produjo el gráfico.

3. Evitar la distorsión en la comunicación de los datos.4. Presentar muchos números en un pequeño espacio.

3 / 20

Próposito de los gráficos estadísticos

5. Hacer que grandes conjuntos de datos tengan coherencia.6. Inducir a la comparación entre diferentes partes de los

datos.7. Revelar diferentes detalles de los datos, desde la

perspectiva global a los detalles más particulares.8. Tener un propósito razonablemente claro: la descripción,

la exploración, la tabulación o la decoración.9. Estar muy integrado con las descripciones estadísticas y

verbales del conjunto de datos.

4 / 20

Elementos principales

Figura: Descripción del gráfico

5 / 20

Elementos principales

Figura: Comparativa entre el número de solicitudes admitidas y rechazas por cadauno de los departamentos

6 / 20

RecomendacionesI Hacer que los datos sobresalgan. Evitar lo superfluo.I Utilizar elementos prominentes para mostrar los datos.I Hacer la región de datos menor que la región delimitada

por las escalas. Las marcas hacia afuera.I No congestionar la región de datos.I No exagerar el número de marcas (de 3 a 10 marcas).I Utilizar una línea cuando haya un valor que deba verse a

través del gráfico, pero que no interfiera con los datos.I Las etiquetas no deben interferir o congestionar el gráfico.I Evitar colocar claves en el interior. Colocar las notas en el

texto o la explicación.I Los símbolos o conjuntos de datos que se superpongan

deben poder ser reconocidos fácilmente.

7 / 20

Algunos ejemplos de gráficos engañosos

Figura: ¿The Times duplica en número de ventas al Daily Telegraph?

8 / 20

Algunos ejemplos de gráficos engañosos

Figura: ¿Se está produciendo un sobre-calentamiento?

9 / 20

Algunos ejemplos de gráficos engañosos

I Hay 30 millones de usarios de la XBox 360: el 11% son 3.3millones.

I Hay 20 millones de usuarios de la PS3: el 10% son 2 millones.

I Hay 50 millones de usuarios de la Wii: el 6% son 3 millones.

10 / 20

Parte II

Gráficos para variablescuantitativas

11 / 20

Qué buscar en un gráficode una variable cuantitativa

I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).

I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango

intercuartílico, ...).I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.I Granularidad (discretización) en los datos.

12 / 20

Qué buscar en un gráficode una variable cuantitativa

I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).

I Posición de los datos (media, mediana, moda, ...).

I Dispersión de los datos (varianza, desviación típica, rangointercuartílico, ...).

I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.I Granularidad (discretización) en los datos.

12 / 20

Qué buscar en un gráficode una variable cuantitativa

I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).

I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango

intercuartílico, ...).

I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.I Granularidad (discretización) en los datos.

12 / 20

Qué buscar en un gráficode una variable cuantitativa

I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).

I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango

intercuartílico, ...).I Valores atípicos (outliers) entre los datos.

I Conglomerados en los datos.I Granularidad (discretización) en los datos.

12 / 20

Qué buscar en un gráficode una variable cuantitativa

I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).

I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango

intercuartílico, ...).I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.

I Granularidad (discretización) en los datos.

12 / 20

Qué buscar en un gráficode una variable cuantitativa

I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).

I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango

intercuartílico, ...).I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.I Granularidad (discretización) en los datos.

12 / 20

Diagrama de dispersiónDatos: 115 117 120 123 126 129 132 135

139 142 146 150 154 159 164

13 / 20

Diagrama de dispersión

13 / 20

Diagrama de dispersión

13 / 20

Diagrama de dispersión

13 / 20

Diagrama de dispersión

13 / 20

Diagrama de dispersión

13 / 20

Diagrama de caja y bigote

14 / 20

Diagrama de caja y bigote

14 / 20

Diagrama de caja y bigote

14 / 20

Diagrama de caja y bigote

14 / 20

Diagrama de caja y bigote

14 / 20

Diagrama de caja y bigote

14 / 20

Histograma

15 / 20

Histograma

15 / 20

Histograma

15 / 20

Histograma

15 / 20

Histograma

Reglas para el número de intervalos:

I Regla de Sturges: dlog2 n + 1e(n: cantidad total de datos)

I Regla de Scott:3,5s

3√n

(n: cantidad total de datoss: desviación típica de los datos)

I Regla de Friedman-Diaconis: 2IQR

3√n

(n: cantidad total de datosIQR : rango intercuartílico de los datos)

15 / 20

Gráfico de densidad

16 / 20

Parte III

Gráficos para variables cualitativas

17 / 20

Diagrama de barras

18 / 20

Diagrama de puntos

19 / 20

Variable cuantitativa con valores individualizados

20 / 20

top related