clarajuradorello.files.wordpress.com · web viewinforme estadístico: manipulación de variables y...

11
Informe estadístico: Manipulación de variables y Estadística descriptiva. (Seminario 5 y 6). 1

Upload: others

Post on 18-Jul-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: clarajuradorello.files.wordpress.com · Web viewInforme estadístico: Manipulación de variables y Estadística descriptiva. (Seminario 5 y 6). Clara Jurado Rello (Subgrupo 3, grupo

Informe estadístico: Manipulación de variables y

Estadística descriptiva. (Seminario 5 y 6).

Clara Jurado Rello (Subgrupo 3, grupo 1)

1

Page 2: clarajuradorello.files.wordpress.com · Web viewInforme estadístico: Manipulación de variables y Estadística descriptiva. (Seminario 5 y 6). Clara Jurado Rello (Subgrupo 3, grupo

Se ha llevado a cabo un estudio a 291 estudiantes de primero de enfermería de la Universidad de Sevilla, centros propios y adscritos, para conocer sus estilos de vida y activos en salud. Se han obtenido los datos de las encuestas realizadas y a continuación se analizarán determinados aspectos. Este estudio lo dividiremos en 4 cuestiones:

1. Análisis variables “malestares activos” y “peso”. (Página 3-4)

2. Filtro de sujetos. Interpretación gráfica apartado1. (Páginas 4-6)

3. Cambio de variable cuantitativa a cualitativa. (Páginas 7-8)

4. Descriptivo de frecuencias y porcentaje de las nuevas variables. Representación gráfica. Prevalencia del 50% centrales. (Página 8-10)

2

Page 3: clarajuradorello.files.wordpress.com · Web viewInforme estadístico: Manipulación de variables y Estadística descriptiva. (Seminario 5 y 6). Clara Jurado Rello (Subgrupo 3, grupo

1. Análisis variables “malestares activos” y “peso”

La primera cuestión que aborda el presente informe es el estudio del peso y malestares de los sujetos incluidos en el trabajo. El análisis se hace a partir de las variables cuantitativas recogidas como “malestaresactivos” y “peso”:

a) malestares activos:Escala cuantitativa, formada tras sumar las siguientes preguntas: ¿Con qué frecuencia has tenido en los últimos 6 meses: Dolor de cabeza, Dolor de estómago, Dolor de espalda, Bajo ánimo, Irritabilidad o mal genio, Nerviosismo, Dificultades para dormir, Sensación de mareo, Dolor de cuello o de los hombros, Ahogo, dificultad para respirar, Cansancio y agotamiento, Palpitaciones, Diarrea o problemas intestinales?, cada una de ellas con las siguientes categorías de respuesta:

1- “Casi todos los días”2- “Más de una vez a la semana”3- “Casi todas las semanas”4-“Casi todos los meses”5-“Rara vez”6-“Nunca”.

Por lo tanto, a más puntuación menos malestares

Tras los resultados obtenidos en el programa informático R commander sobre la variable numérica “malestares activos”, obtenemos los siguientes valores:

De los 291 sujetos que teníamos, se han tomado 279 (n) y 12 se han excluido (not available o NA). Hemos obtenido los siguientes datos:

- la media (mean): 43,45878- la desviación típica (sd): 9,574636

3

Page 4: clarajuradorello.files.wordpress.com · Web viewInforme estadístico: Manipulación de variables y Estadística descriptiva. (Seminario 5 y 6). Clara Jurado Rello (Subgrupo 3, grupo

- rango intercuartílico (IQR) =12- cuartiles:

● cuartil 1 (25%) = 38● cuartil 2 (50%) = mediana = 44● cuartil 3 (75%) = 50

- Rango: El mínimo es 10 y el máximo 65

La media y la mediana son muy similares, pero no iguales, por lo que su distribución es ligeramente asimétrica y sesgada a la izquierda.

b) Peso: Vector numérico, unidades en kg.

Tras los resultados obtenidos en el programa informático R commander sobre la variable numérica “peso”, obtenemos los siguientes valores:

De los 291 sujetos que teníamos, se han tomado 275 (n) y 16 se han excluido (not available o NA). Hemos obtenido los siguientes datos:

- la media: 62,75571- la desviación típica: 12,65981- cuartiles:

● cuartil 1 = 54● cuartil 2 = mediana = 60● cuartil 3 = 68

- Rango: El mínimo es 38 y el máximo 130.

La media y la mediana son muy similares, pero no iguales, por lo que su distribución es ligeramente asimétrica y sesgada a la derecha.

Presenta mayor dispersión la variable “peso” ya que tiene mayor desviación que la variable “malestaresactivos”: 12,65981>9,574636

4

Page 5: clarajuradorello.files.wordpress.com · Web viewInforme estadístico: Manipulación de variables y Estadística descriptiva. (Seminario 5 y 6). Clara Jurado Rello (Subgrupo 3, grupo

2. Filtro de sujetos. Interpretación gráfica apartado 1

La siguiente cuestión vamos a dividirla en 2 partes. En la primera vamos a filtrar sujetos con determinados requisitos y en el segundo elaboraremos las gráficas del apartado 1.

● Procedemos a filtrar los sujetos incluidos en el trabajo que no poseen una madre sanitaria y además poseen una altura mayor a 1,6m. Obtenemos como resultado 193 sujetos.

● A continuación, se han elaborado 2 gráficas correspondientes a las variables cuantitativas analizadas en el apartado anterior.

❏ Para la variable “malestares activos”, al ser una variable cuantitativa, hemos empleado un histograma.

5

Page 6: clarajuradorello.files.wordpress.com · Web viewInforme estadístico: Manipulación de variables y Estadística descriptiva. (Seminario 5 y 6). Clara Jurado Rello (Subgrupo 3, grupo

Interpretación

Es un histograma en el que el eje “X” representa la variable numérica “malestares activos” y en el eje “Y” el porcentaje en el que se encuentran esos datos. A mayor puntuación en la encuesta, menos malestares activos. Por lo tanto, podemos observar que casi el 50% de los sujetos ha obtenido en la encuesta una puntuación alrededor de 45, siendo la mínima puntuación 10 y la máxima 65. El pico más alto de sujetos se encuentra entre un 45-50 de puntuación.

❏ Para la variable “peso”, al ser una variable cuantitativa numérica continua, hemos empleado también un histograma:

6

Page 7: clarajuradorello.files.wordpress.com · Web viewInforme estadístico: Manipulación de variables y Estadística descriptiva. (Seminario 5 y 6). Clara Jurado Rello (Subgrupo 3, grupo

Interpretación

Es un histograma en el que el eje X representa la variable numérica “peso” en kg y en el eje Y el porcentaje en el que se encuentran esos datos. Por lo tanto, podemos observar como más del 40% de los encuestados tienen entre 50 y 60 kg. Alrededor del 70% tienen entre 50 y 70 kg. El mínimo es 30kg y el máximo 130kg. El pico más alto de sujetos está entre 50 y 60 kg.

3. Cambio de variable cuantitativa a cualitativa:

Para la siguiente cuestión, vamos a agrupar las variables del apartado 1 en 4 intervalos que corresponderán con dichos cuartiles, de esta manera convertiremos las variables originales cuantitativas en cualitativas.

● Variable “cuali_malestaresactivos”

Con la variable cuantitativa “malestaresactivos” crearemos la nueva variable cualitativa “cuali_malestaresactivos” y constará de los siguientes intervalos que han sido divididos de acuerdo a sus correspondientes cuartiles:

CUARTIL 1-> lo:38= “intervaloq1”

CUARTIL 2-> 38:44= “intervaloq2”

CUARTIL 3-> 44:50= “intervaloq3”

CUARTIL 4-> 50:hi= “intervaloq4”

El “intervaloq1” corresponderá al cuartil 1 y constará desde la mínima puntuación hasta 38, el “intervaloq2” corresponderá al cuartil 2 y constará desde la puntuación 38 a la 44, el “intervaloq3”

7

Page 8: clarajuradorello.files.wordpress.com · Web viewInforme estadístico: Manipulación de variables y Estadística descriptiva. (Seminario 5 y 6). Clara Jurado Rello (Subgrupo 3, grupo

corresponderá al cuartil 3 y constará desde la puntuación 44 a la 50 y el “intervaloq4” corresponderá al cuartil 4 y constará desde la puntuación 50 a la máxima.

● Variable “cuali_peso”

Con la variable cuantitativa “peso” crearemos la nueva variable cualitativa “cuali_peso” y constará de los siguientes intervalos que han sido divididos de acuerdo a sus correspondientes cuartiles:

CUARTIL 1-> lo:54= “intervaloq1”

CUARTIL 2-> 54:60= “intervaloq2”

CUARTIL 3-> 60:68= “intervaloq3”

CUARTIL 4-> 68:hi= “intervaloq4”

El “intervaloq1” corresponderá al cuartil 1 y constará desde la mínima puntuación hasta 54, el “intervaloq2” corresponderá al cuartil 2 y constará desde la puntuación 54 a la 60, el “intervaloq3” corresponderá al cuartil 3 y constará desde la puntuación 60 a la 68 y el “intervaloq4” corresponderá al cuartil 4 y constará desde la puntuación 68 a la máxima.

4.Descriptivo de frecuencias y porcentaje de las nuevas variables. Representación gráfica. Prevalencia del 50% centrales

Se ha realizado un descriptivo de frecuencias y porcentaje de las nuevas variables: “cuali_malestaresactivos” y “cuali_peso”. Para ello, empleamos las gráficas apropiadas para representarlas gráficamente e interpretarlas.

● Para el factor “cuali_malestaresactivos” emplearemos una gráfica de barras al ser una variable cualitativa y tener varias categorías. Para ello, utilizaremos el programa informático R Commander:

8

Page 9: clarajuradorello.files.wordpress.com · Web viewInforme estadístico: Manipulación de variables y Estadística descriptiva. (Seminario 5 y 6). Clara Jurado Rello (Subgrupo 3, grupo

Porcentaje: Frecuencias:

Interpretación:Es una gráfica de barras en la que el eje X representa los 4 intervalos del factor “cuali_malestaresactivos” y en el eje Y el porcentaje en el que se encuentran esos datos. Por lo tanto, podemos observar como el intervalo q3 contiene un mayor porcentaje de sujetos. Por lo tanto, como el intervalo q3 corresponde con el cuartil 3, el mayor porcentaje de sujetos corresponde a los que obtuvieron una puntuación en la encuesta entre 44 y 50.

Interpretación:Es una gráfica de barras en la que el eje X representa los 4 intervalos del factor “cuali_malestaresactivos” y en el eje Y la frecuencia con la que se encuentran esos datos. Por lo tanto, podemos observar como de nuevo, el intervalo q3 contiene un mayor número de sujetos. Por lo tanto, como el intervalo q3 corresponde con el cuartil 3, el mayor número de sujetos corresponde a los que obtuvieron una puntuación en la encuesta entre 44 y 50.

A continuación, para obtener la prevalencia de sujetos ubicados en el 50% central de la variable, al no ser simétrica no lo podemos obtener mediante el diagrama de cajas, por lo que calcularemos el rango intercuartílico (IQR) que contiene el número de sujetos entre el cuartil 1 (Q1) y el cuartil 3 (Q3), por lo que nos dará el 50% de valores centrales. Para calcularlo, tendremos que tener en cuenta el intervalo q2 ( ya que comprende desde el cuartil 1 al 2) y el intervalo q3 ( que

9

Page 10: clarajuradorello.files.wordpress.com · Web viewInforme estadístico: Manipulación de variables y Estadística descriptiva. (Seminario 5 y 6). Clara Jurado Rello (Subgrupo 3, grupo

comprende del cuartil 2 al 3). Mediante el programa informático R Commander obtenemos la distribución de frecuencias por intervalos del factor:

❖ intervaloq1= 71 sujetos

❖ intervaloq2=70 sujetos

❖ intervaloq3=76 sujetos

❖ intervaloq4=62 sujetos

Por lo tanto, sumando la frecuencia del intervalo q2(70) y q3(76), obtenemos el rango intercuartílico. Obtenemos que 146 es el número de sujetos ubicados en el 50% central de la variable. Para obtener la prevalencia aplicamos la Regla de La Place (número de casos favorables/número de casos posibles). Por lo tanto, 146/279= 0,52

● Para el factor “cuali_peso” emplearemos una gráfica de barras al ser una variable cualitativa y tener varias categorías. Para ello, utilizaremos el programa informático R Commander:

Porcentaje: Frecuencias:

10

Page 11: clarajuradorello.files.wordpress.com · Web viewInforme estadístico: Manipulación de variables y Estadística descriptiva. (Seminario 5 y 6). Clara Jurado Rello (Subgrupo 3, grupo

Interpretación:

Es una gráfica de barras en la que el eje X representa los 4 intervalos del factor “cuali_peso” y en el eje Y el porcentaje en el que se encuentran esos datos. Por lo tanto, podemos observar como los intervalos q1 y q2 son los que contienen un mayor porcentaje de sujetos. Por lo tanto, como el intervalo q1 y q2 corresponden con el cuartil 1 y 2, el mayor porcentaje de sujetos corresponde a los que pesan entre 38kg( peso mínimo obtenido) y 60 kg.

Interpretación:

Es una gráfica de barras en la que el eje X representa los 4 intervalos del factor “cuali_peso” y en el eje Y la frecuencia con la que se encuentran esos datos. Por lo tanto, podemos observar como de nuevo, los intervalos q1 y q2 son los que contienen un mayor número de sujetos. Por lo tanto, como el intervalo q1 y q2 corresponden con el cuartil 1 y 2 respectivamente, el mayor número de sujetos o frecuencia corresponde a los que pesan entre 38 y 60 kg.

A continuación, para obtener la prevalencia de sujetos ubicados en el 50% central de la variable, al no ser simétrica no lo podemos obtener mediante el diagrama de cajas, por lo que emplearemos el mismo método que con la variable “cuali_malestaresactivos” calculando el rango intercuartílico (IQR). Mediante el programa informático R Commander obtenemos la distribución de frecuencias por intervalos del factor:

❖ intervaloq1= 72 sujetos

❖ intervaloq2=72 sujetos

❖ intervaloq3=65 sujetos

❖ intervaloq4=66 sujetos

Repetimos el proceso de la anterior variable y, tras sumar el intervalo q2 y q3, obtenemos como resultado que 137 es la prevalencia de sujetos ubicados en el 50% central de la variable. Para obtener la prevalencia aplicamos la Regla de La Place. Por lo tanto, 137/275= 0,499 es la prevalencia.

11