numerical summary descriptive statisticswolfpack.hnu.ac.kr/spring2008/s4be08/descriptive4 sbe... ·...

6
Descriptive Statistics Numerical Summary (일변량, 측정형) 그래프와 통계량의 결합 Box (whisker) Plot 상자 수염 그림 5가지 기초 통계량 5 summary statistics (통계량 계산과 그래프 표현 관계) 치우침 최대값 X(n) Q3 중앙값 Q1 정규성 검정으로 치우침 검정 모평균에 대하여 대표본 : 치우침 무시하고 통계량 계산 소표본 정규분포 가정하거나 비모수(N P t i Di t F ) 1.5*IQR X(n) Q1 최소값 X(1) 이상치 Mild: 1.5IQR Imaginary line 소표본: 정규분포 가정하거나 비모수(Non-Parameteric, Dist Free) 검정통계량 사용 우로 치우침 해결: 로그 변환, 제곱 변환 죄로 치우침 해결: SQRT 변환, 1/X 변환 모분산에 대하여 IQR X(n) Q3 M Severe: 3IQR Imaginary line 분포의 형태: 확률밀도함수 f 치우침, 그러나 봉우리 개수 모름 (그래서 히스토그램 필요) 모분산에 대하여 변수 변환 후 분산 계산 why? 모집단 정규분포 가정 하에 검정통계량 χ 2 분포를 따른다. 비교 시에는 CV (변동계수) 이용 Q1 X(1) 두 집단 이상 측정형 관측치 비교 시 집단에 대한 상자 수염 그림을 그래프에 그려 비교 이상치 제외하고 통계량 계산 제외된 이상치가 가진 정보 분석 필요 (이상치인가 파악) 집단에 대한 상자 수염 그림을 그래프에 그려 비교 제외된 이상치가 가진 정보 분석 필요 (이상치인가 파악) 그래프 표현은 숫자 요약(통계량)을 올바르게 사용할 수 있는 사전 진 단 도수이다. 분석 및 추론의 시작은 적절한 그래프 그리기부터 http://wolfpack.hnu.ac.kr 한남대학교 통계학과 권세혁교수 Statistics for Business and Economics (Spring, 2008) 27

Upload: others

Post on 31-Dec-2020

12 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Numerical Summary Descriptive Statisticswolfpack.hnu.ac.kr/Spring2008/S4BE08/Descriptive4 SBE... · 2020. 11. 19. · Numerical Summary (일변량, 측정형) 그래프와통계량의결합

Descriptive StatisticsNumerical Summary (일변량, 측정형) 그래프와 통계량의 결합

Box (whisker) Plot 상자수염그림

5가지 기초 통계량 5 summary statistics

(통계량계산과그래프표현관계)

치우침최대값 X(n)

Q3

중앙값

Q1

정규성 검정으로 치우침 검정

모평균에 대하여

대표본 : 치우침 무시하고 통계량 계산

소표본 정규분포 가정하거나 비모수(N P t i Di t F )

1.5*IQR

X(n)Q1

최소값 X(1)

이상치

Mild: 1.5IQR Imaginary line

소표본: 정규분포 가정하거나 비모수(Non-Parameteric, Dist Free)검정통계량사용

우로치우침 해결: 로그 변환, 제곱 변환

죄로치우침 해결: SQRT 변환, 1/X 변환

모분산에 대하여

IQR

X(n)

Q3

MSevere: 3IQR Imaginary line

분포의 형태: 확률밀도함수 f

치우침, 그러나 봉우리 개수 모름 (그래서 히스토그램 필요)

모분산에 대하여

변수변환 후 분산계산 why? 모집단정규분포 가정 하에 검정통계량이 χ2 분포를 따른다.

비교시에는 CV (변동계수) 이용

Q1X(1)

두집단이상측정형관측치비교시

각집단에 대한 상자 수염 그림을 한 그래프에 그려 비교

이상치

제외하고 통계량 계산

제외된 이상치가 가진 정보 분석 필요 (왜 이상치인가 파악)각 집단에 대한 상자 수염 그림을 한 그래프에 그려 비교 제외된 이상치가 가진 정보 분석 필요 (왜 이상치인가 파악)

그래프 표현은 숫자 요약(통계량)을 올바르게 사용할 수 있는 사전 진단 도수이다. 분석 및 추론의 시작은 적절한 그래프 그리기부터

http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수

Statistics for Business and Economics (Spring, 2008)27

Page 2: Numerical Summary Descriptive Statisticswolfpack.hnu.ac.kr/Spring2008/S4BE08/Descriptive4 SBE... · 2020. 11. 19. · Numerical Summary (일변량, 측정형) 그래프와통계량의결합

Descriptive StatisticsHomework #4-2 Due 04.03.

in SPSS에서 Box-whisker 그리기#1 Injury.xls

125

100

World.xls is

#2

75

50

http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수

Statistics for Business and Economics (Spring, 2008)28

smallmidsizemidsize small

Page 3: Numerical Summary Descriptive Statisticswolfpack.hnu.ac.kr/Spring2008/S4BE08/Descriptive4 SBE... · 2020. 11. 19. · Numerical Summary (일변량, 측정형) 그래프와통계량의결합

Descriptive StatisticsNumerical Summary (이변량, 측정형) 상관계수

공분산 covariance

두 측정형(metric) 변수 간의 선형관계 척도(1) (2)

상관계수 l ti ffi i t ( )1

))(())())(((),(

−−−

=

−−=

∑n

yyxxYEYXEXEYXCOV

ii

(1) (2)

상관계수 correlation coefficient (ρ, r)

공분산 값은 변수의 측정 단위에 의존

측정 단위에 상관없는 측정 개념이 필요

)( YXCOV

(3)

두 변수의 선형관계 정도 척도

산점도의 타원의 폭이 좁을수록 상관계수는 에 근사

)()(),(),(YVXV

YXCOVYXCorr =

산점도의 타원의 폭이 좁을수록 상관계수는 ±1에 근사 (1), (2)

멀리 떨어진 관측치가 있으면 상관계수 값을 높인다. (3)

표본 수가 많아지면 상관계수가 커진다.

r 두 측정형 변수간의 관계

-1.0 완전한 음의 직선 상관관계

-0.8 강한 음의 직선 상관관계

-0.4 약한 음의 직선 상관관계

상관계수유의성검정

H0: ρ=0, Ha: ρ= ρ0 ≠0

검정통계량

0.4 약한 음의 직선 상관관계

0 직선 상관 관계가 아님

+0.4 약한 양의 직선 상관관계

+0.8 강한 양의 직선 상관관계

1 0 완전한 양의 직선 상관관계

)2(~1

22

−−

−= ntr

rnT

http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수

Statistics for Business and Economics (Spring, 2008)29

+1.0 완전한 양의 직선 상관관계

Page 4: Numerical Summary Descriptive Statisticswolfpack.hnu.ac.kr/Spring2008/S4BE08/Descriptive4 SBE... · 2020. 11. 19. · Numerical Summary (일변량, 측정형) 그래프와통계량의결합

Descriptive StatisticsHomework #5-1 Due 04.10.

각 문제에 대하여 상관계수 유의성 검정을 실시하시오.

아래 문제에 대해서는 산점도도 그리시오.

http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수

Statistics for Business and Economics (Spring, 2008)30

Page 5: Numerical Summary Descriptive Statisticswolfpack.hnu.ac.kr/Spring2008/S4BE08/Descriptive4 SBE... · 2020. 11. 19. · Numerical Summary (일변량, 측정형) 그래프와통계량의결합

Descriptive StatisticsCase Study 1 Health.xls Homework #5-2 Due 04.10.

http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수

Statistics for Business and Economics (Spring, 2008)31

Page 6: Numerical Summary Descriptive Statisticswolfpack.hnu.ac.kr/Spring2008/S4BE08/Descriptive4 SBE... · 2020. 11. 19. · Numerical Summary (일변량, 측정형) 그래프와통계량의결합

Descriptive StatisticsCase Study 2 Aisan.xls Homework #6 Due 2008.04.17

http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수

Statistics for Business and Economics (Spring, 2008)32