STATA

표준화하기_횡단면과 패널데이터

은하수너머 2021. 9. 27. 05:59

1. 횡단면 데이터

 findit zscore

 zscore [variable name]  

https://www.reed.edu/psychology/stata/gs/tutorials/Zscores.html

 

Make Z-Scores in Stata - Stata Help - Reed College

Calculate Z-Scores in Stata Often it can be useful to transform your raw scores into Z-scores. Since this is a common need, someone has already done the coding for you; however, you may still need to install it. If you are working on a Reed-managed lab mac

www.reed.edu

https://youtu.be/FOgzlefIyh8

 gen income_std2=  ( Vi - mean)/sd 

 egen  income_std1 = std(incomde) 

 * mean 값이 정확하게 0으로 떨어지지 않을 수 있다. 또한  zscore와 std를 사용한 값, 그리고  계산식을 통해서 구한 값에

   차이가 생긴다. 예를 들어서,  mean 값과 sd 값을 소숫점 2째, 혹은 3째 자리 까지만 넣은 경우와 10자리까지 넣은 경우에 미세한 차이가 생기는 것이다. 즉 rounding error(반올림 오류) 때문이다.  

*  이 두 값을 같도록 만들어주고 싶다면 아래의 포스팅을 참조하자

https://www.stata.com/statalist/archive/2009-04/msg00047.html

 

st: Re: what does -egen std- do?

Date   Wed, 1 Apr 2009 22:06:52 +0200

www.stata.com

2. 패널 데이터 

foreach 문으로 작성하는게 일반적일 것 같은데, foreach 구문에 익숙하지 않은 경우가 많다. 

https://www.statalist.org/forums/forum/general-stata-discussion/general/235098-standardized-z-scores-with-panel-data

 

Standardized Z-scores with panel data - Statalist

 

www.statalist.org

 이런 경우에 

 bysort 패널변수 : egen mean=mean(oldvar)

 bysort 패널변수 :  egen sd=sd(oldvar)

 gen zscore=mean/sd 

 

 

 

 

'STATA' 카테고리의 다른 글

특정한 집단 별로 기초통계 구하기  (0) 2022.04.07
데이터 집계하기  (0) 2021.10.11
분위수 생성방법  (0) 2021.09.22
top/bottom coding 방법  (0) 2021.09.22
군집 분석 관련  (0) 2021.09.07