numerical summary descriptive statisticswolfpack.hnu.ac.kr/spring2008/s4be08/descriptive4 sbe... ·...
Embed Size (px)
TRANSCRIPT
-
Descriptive StatisticsNumerical Summary (일변량, 측정형) 그래프와 통계량의 결합
Box (whisker) Plot 상자수염그림
5가지 기초 통계량 5 summary statistics
(통계량계산과그래프표현관계)
치우침최대값 X(n)
Q3
중앙값
Q1
정규성 검정으로 치우침 검정
모평균에 대하여
대표본 : 치우침 무시하고 통계량 계산
소표본 정규분포 가정하거나 비모수(N P t i Di t F )
1.5*IQR
X(n)Q1
최소값 X(1)
이상치
Mild: 1.5IQR Imaginary line
소표본: 정규분포 가정하거나 비모수(Non-Parameteric, Dist Free)검정통계량사용
우로치우침 해결: 로그 변환, 제곱 변환
죄로치우침 해결: SQRT 변환, 1/X 변환
모분산에 대하여
IQR
X(n)
Q3
MSevere: 3IQR Imaginary line
분포의 형태: 확률밀도함수 f
치우침, 그러나 봉우리 개수 모름 (그래서 히스토그램 필요)
모분산에 대하여
변수변환 후 분산계산 why? 모집단정규분포 가정 하에 검정통계량이 χ2 분포를 따른다.
비교시에는 CV (변동계수) 이용
Q1X(1)
두집단이상측정형관측치비교시
각집단에 대한 상자 수염 그림을 한 그래프에 그려 비교
이상치
제외하고 통계량 계산
제외된 이상치가 가진 정보 분석 필요 (왜 이상치인가 파악)각 집단에 대한 상자 수염 그림을 한 그래프에 그려 비교 제외된 이상치가 가진 정보 분석 필요 (왜 이상치인가 파악)
그래프 표현은 숫자 요약(통계량)을 올바르게 사용할 수 있는 사전 진단 도수이다. 분석 및 추론의 시작은 적절한 그래프 그리기부터
http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수
Statistics for Business and Economics (Spring, 2008)27
-
Descriptive StatisticsHomework #4-2 Due 04.03.
in SPSS에서 Box-whisker 그리기#1 Injury.xls
125
100
World.xls is
#2
75
50
http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수
Statistics for Business and Economics (Spring, 2008)28
smallmidsizemidsize small
-
Descriptive StatisticsNumerical Summary (이변량, 측정형) 상관계수
공분산 covariance
두 측정형(metric) 변수 간의 선형관계 척도(1) (2)
상관계수 l ti ffi i t ( )1
))(())())(((),(
−−−
=
−−=
∑n
yyxxYEYXEXEYXCOV
ii
(1) (2)
상관계수 correlation coefficient (ρ, r)공분산 값은 변수의 측정 단위에 의존
측정 단위에 상관없는 측정 개념이 필요
)( YXCOV
(3)
두 변수의 선형관계 정도 척도
산점도의 타원의 폭이 좁을수록 상관계수는 에 근사
)()(),(),(YVXV
YXCOVYXCorr =
산점도의 타원의 폭이 좁을수록 상관계수는 ±1에 근사 (1), (2)
멀리 떨어진 관측치가 있으면 상관계수 값을 높인다. (3)
표본 수가 많아지면 상관계수가 커진다.
r 두 측정형 변수간의 관계
-1.0 완전한 음의 직선 상관관계
-0.8 강한 음의 직선 상관관계
-0.4 약한 음의 직선 상관관계
상관계수유의성검정
H0: ρ=0, Ha: ρ= ρ0 ≠0
검정통계량
0.4 약한 음의 직선 상관관계
0 직선 상관 관계가 아님
+0.4 약한 양의 직선 상관관계
+0.8 강한 양의 직선 상관관계
1 0 완전한 양의 직선 상관관계
)2(~1
22
−−
−= ntr
rnT
http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수
Statistics for Business and Economics (Spring, 2008)29
+1.0 완전한 양의 직선 상관관계
-
Descriptive StatisticsHomework #5-1 Due 04.10.
각 문제에 대하여 상관계수 유의성 검정을 실시하시오.
아래 문제에 대해서는 산점도도 그리시오.
http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수
Statistics for Business and Economics (Spring, 2008)30
-
Descriptive StatisticsCase Study 1 Health.xls Homework #5-2 Due 04.10.
http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수
Statistics for Business and Economics (Spring, 2008)31
-
Descriptive StatisticsCase Study 2 Aisan.xls Homework #6 Due 2008.04.17
http://wolfpack.hnu.ac.kr한남대학교 통계학과 권세혁교수
Statistics for Business and Economics (Spring, 2008)32