informática - gráficos estadísticos univariantes · informática - gráficos estadísticos...

39
Informática Gráficos estadísticos univariantes Álvaro Romero Jiménez Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Upload: others

Post on 26-Jun-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

InformáticaGráficos estadísticos univariantes

Álvaro Romero Jiménez

Departamento de Ciencias de la Computación e Inteligencia ArtificialUniversidad de Sevilla

Page 2: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Próposito de los gráficos estadísticos

La excelencia en los gráficos estadísticos consiste en lacomunicación de ideas complejas con claridad, precisión yeficiencia. Algunos de los objetivos principales de un gráficoestadístico se describen a continuación:

2 / 20

Page 3: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Próposito de los gráficos estadísticos

1. Mostrar los datos.2. Inducir al observador a pensar acerca del contenido en

lugar de la metodología, el diseño gráfico o la tecnologíaque produjo el gráfico.

3. Evitar la distorsión en la comunicación de los datos.4. Presentar muchos números en un pequeño espacio.

3 / 20

Page 4: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Próposito de los gráficos estadísticos

5. Hacer que grandes conjuntos de datos tengan coherencia.6. Inducir a la comparación entre diferentes partes de los

datos.7. Revelar diferentes detalles de los datos, desde la

perspectiva global a los detalles más particulares.8. Tener un propósito razonablemente claro: la descripción,

la exploración, la tabulación o la decoración.9. Estar muy integrado con las descripciones estadísticas y

verbales del conjunto de datos.

4 / 20

Page 5: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Elementos principales

Figura: Descripción del gráfico

5 / 20

Page 6: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Elementos principales

Figura: Comparativa entre el número de solicitudes admitidas y rechazas por cadauno de los departamentos

6 / 20

Page 7: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

RecomendacionesI Hacer que los datos sobresalgan. Evitar lo superfluo.I Utilizar elementos prominentes para mostrar los datos.I Hacer la región de datos menor que la región delimitada

por las escalas. Las marcas hacia afuera.I No congestionar la región de datos.I No exagerar el número de marcas (de 3 a 10 marcas).I Utilizar una línea cuando haya un valor que deba verse a

través del gráfico, pero que no interfiera con los datos.I Las etiquetas no deben interferir o congestionar el gráfico.I Evitar colocar claves en el interior. Colocar las notas en el

texto o la explicación.I Los símbolos o conjuntos de datos que se superpongan

deben poder ser reconocidos fácilmente.

7 / 20

Page 8: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Algunos ejemplos de gráficos engañosos

Figura: ¿The Times duplica en número de ventas al Daily Telegraph?

8 / 20

Page 9: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Algunos ejemplos de gráficos engañosos

Figura: ¿Se está produciendo un sobre-calentamiento?

9 / 20

Page 10: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Algunos ejemplos de gráficos engañosos

I Hay 30 millones de usarios de la XBox 360: el 11% son 3.3millones.

I Hay 20 millones de usuarios de la PS3: el 10% son 2 millones.

I Hay 50 millones de usuarios de la Wii: el 6% son 3 millones.

10 / 20

Page 11: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Parte II

Gráficos para variablescuantitativas

11 / 20

Page 12: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Qué buscar en un gráficode una variable cuantitativa

I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).

I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango

intercuartílico, ...).I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.I Granularidad (discretización) en los datos.

12 / 20

Page 13: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Qué buscar en un gráficode una variable cuantitativa

I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).

I Posición de los datos (media, mediana, moda, ...).

I Dispersión de los datos (varianza, desviación típica, rangointercuartílico, ...).

I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.I Granularidad (discretización) en los datos.

12 / 20

Page 14: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Qué buscar en un gráficode una variable cuantitativa

I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).

I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango

intercuartílico, ...).

I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.I Granularidad (discretización) en los datos.

12 / 20

Page 15: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Qué buscar en un gráficode una variable cuantitativa

I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).

I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango

intercuartílico, ...).I Valores atípicos (outliers) entre los datos.

I Conglomerados en los datos.I Granularidad (discretización) en los datos.

12 / 20

Page 16: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Qué buscar en un gráficode una variable cuantitativa

I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).

I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango

intercuartílico, ...).I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.

I Granularidad (discretización) en los datos.

12 / 20

Page 17: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Qué buscar en un gráficode una variable cuantitativa

I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).

I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango

intercuartílico, ...).I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.I Granularidad (discretización) en los datos.

12 / 20

Page 18: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de dispersiónDatos: 115 117 120 123 126 129 132 135

139 142 146 150 154 159 164

13 / 20

Page 19: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de dispersión

13 / 20

Page 20: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de dispersión

13 / 20

Page 21: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de dispersión

13 / 20

Page 22: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de dispersión

13 / 20

Page 23: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de dispersión

13 / 20

Page 24: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de caja y bigote

14 / 20

Page 25: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de caja y bigote

14 / 20

Page 26: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de caja y bigote

14 / 20

Page 27: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de caja y bigote

14 / 20

Page 28: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de caja y bigote

14 / 20

Page 29: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de caja y bigote

14 / 20

Page 30: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Histograma

15 / 20

Page 31: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Histograma

15 / 20

Page 32: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Histograma

15 / 20

Page 33: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Histograma

15 / 20

Page 34: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Histograma

Reglas para el número de intervalos:

I Regla de Sturges: dlog2 n + 1e(n: cantidad total de datos)

I Regla de Scott:3,5s

3√n

(n: cantidad total de datoss: desviación típica de los datos)

I Regla de Friedman-Diaconis: 2IQR

3√n

(n: cantidad total de datosIQR : rango intercuartílico de los datos)

15 / 20

Page 35: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Gráfico de densidad

16 / 20

Page 36: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Parte III

Gráficos para variables cualitativas

17 / 20

Page 37: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de barras

18 / 20

Page 38: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Diagrama de puntos

19 / 20

Page 39: Informática - Gráficos estadísticos univariantes · Informática - Gráficos estadísticos univariantes Author: Álvaro Romero Jiménez Created Date: 3/10/2018 7:27:59 PM

Variable cuantitativa con valores individualizados

20 / 20