Transcript
Page 1: Numerical Summary Descriptive Statisticswolfpack.hnu.ac.kr/Spring2008/S4BE08/Descriptive4 SBE... · 2020. 11. 19. · Numerical Summary (일변량, 측정형) 그래프와통계량의결합

Descriptive StatisticsNumerical Summary (일변량, 측정형) 그래프와 통계량의 결합

Box (whisker) Plot 상자수염그림

5가지 기초 통계량 5 summary statistics

(통계량계산과그래프표현관계)

치우침최대값 X(n)

Q3

중앙값

Q1

정규성 검정으로 치우침 검정

모평균에 대하여

대표본 : 치우침 무시하고 통계량 계산

소표본 정규분포 가정하거나 비모수(N P t i Di t F )

1.5*IQR

X(n)Q1

최소값 X(1)

이상치

Mild: 1.5IQR Imaginary line

소표본: 정규분포 가정하거나 비모수(Non-Parameteric, Dist Free)검정통계량사용

우로치우침 해결: 로그 변환, 제곱 변환

죄로치우침 해결: SQRT 변환, 1/X 변환

모분산에 대하여

IQR

X(n)

Q3

MSevere: 3IQR Imaginary line

분포의 형태: 확률밀도함수 f

치우침, 그러나 봉우리 개수 모름 (그래서 히스토그램 필요)

모분산에 대하여

변수변환 후 분산계산 why? 모집단정규분포 가정 하에 검정통계량이 χ2 분포를 따른다.

비교시에는 CV (변동계수) 이용

Q1X(1)

두집단이상측정형관측치비교시

각집단에 대한 상자 수염 그림을 한 그래프에 그려 비교

이상치

제외하고 통계량 계산

제외된 이상치가 가진 정보 분석 필요 (왜 이상치인가 파악)각 집단에 대한 상자 수염 그림을 한 그래프에 그려 비교 제외된 이상치가 가진 정보 분석 필요 (왜 이상치인가 파악)

그래프 표현은 숫자 요약(통계량)을 올바르게 사용할 수 있는 사전 진단 도수이다. 분석 및 추론의 시작은 적절한 그래프 그리기부터

http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수

Statistics for Business and Economics (Spring, 2008)27

Page 2: Numerical Summary Descriptive Statisticswolfpack.hnu.ac.kr/Spring2008/S4BE08/Descriptive4 SBE... · 2020. 11. 19. · Numerical Summary (일변량, 측정형) 그래프와통계량의결합

Descriptive StatisticsHomework #4-2 Due 04.03.

in SPSS에서 Box-whisker 그리기#1 Injury.xls

125

100

World.xls is

#2

75

50

http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수

Statistics for Business and Economics (Spring, 2008)28

smallmidsizemidsize small

Page 3: Numerical Summary Descriptive Statisticswolfpack.hnu.ac.kr/Spring2008/S4BE08/Descriptive4 SBE... · 2020. 11. 19. · Numerical Summary (일변량, 측정형) 그래프와통계량의결합

Descriptive StatisticsNumerical Summary (이변량, 측정형) 상관계수

공분산 covariance

두 측정형(metric) 변수 간의 선형관계 척도(1) (2)

상관계수 l ti ffi i t ( )1

))(())())(((),(

−−−

=

−−=

∑n

yyxxYEYXEXEYXCOV

ii

(1) (2)

상관계수 correlation coefficient (ρ, r)

공분산 값은 변수의 측정 단위에 의존

측정 단위에 상관없는 측정 개념이 필요

)( YXCOV

(3)

두 변수의 선형관계 정도 척도

산점도의 타원의 폭이 좁을수록 상관계수는 에 근사

)()(),(),(YVXV

YXCOVYXCorr =

산점도의 타원의 폭이 좁을수록 상관계수는 ±1에 근사 (1), (2)

멀리 떨어진 관측치가 있으면 상관계수 값을 높인다. (3)

표본 수가 많아지면 상관계수가 커진다.

r 두 측정형 변수간의 관계

-1.0 완전한 음의 직선 상관관계

-0.8 강한 음의 직선 상관관계

-0.4 약한 음의 직선 상관관계

상관계수유의성검정

H0: ρ=0, Ha: ρ= ρ0 ≠0

검정통계량

0.4 약한 음의 직선 상관관계

0 직선 상관 관계가 아님

+0.4 약한 양의 직선 상관관계

+0.8 강한 양의 직선 상관관계

1 0 완전한 양의 직선 상관관계

)2(~1

22

−−

−= ntr

rnT

http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수

Statistics for Business and Economics (Spring, 2008)29

+1.0 완전한 양의 직선 상관관계

Page 4: Numerical Summary Descriptive Statisticswolfpack.hnu.ac.kr/Spring2008/S4BE08/Descriptive4 SBE... · 2020. 11. 19. · Numerical Summary (일변량, 측정형) 그래프와통계량의결합

Descriptive StatisticsHomework #5-1 Due 04.10.

각 문제에 대하여 상관계수 유의성 검정을 실시하시오.

아래 문제에 대해서는 산점도도 그리시오.

http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수

Statistics for Business and Economics (Spring, 2008)30

Page 5: Numerical Summary Descriptive Statisticswolfpack.hnu.ac.kr/Spring2008/S4BE08/Descriptive4 SBE... · 2020. 11. 19. · Numerical Summary (일변량, 측정형) 그래프와통계량의결합

Descriptive StatisticsCase Study 1 Health.xls Homework #5-2 Due 04.10.

http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수

Statistics for Business and Economics (Spring, 2008)31

Page 6: Numerical Summary Descriptive Statisticswolfpack.hnu.ac.kr/Spring2008/S4BE08/Descriptive4 SBE... · 2020. 11. 19. · Numerical Summary (일변량, 측정형) 그래프와통계량의결합

Descriptive StatisticsCase Study 2 Aisan.xls Homework #6 Due 2008.04.17

http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수

Statistics for Business and Economics (Spring, 2008)32


Top Related