STATA 21

stata에서 preserve 명령 사용

1. preserve 명령어stata에서 preserve 명령을 실행한 후에는-일부 case만 불러오거나,-새로운 변수를 생성하거나,-일부 사례의 변수값을 바꾸더라도,다시 restore를 하면 원래의 데이터로 돌아가게 된다. 2. 수정한 데이터도 저장하고 싶다면?preserve 후에 새로운 변수도 만들고 여러 수정을 했는데이 수정된 데이터도 저장하고 싶다면?아래와 같이 사용하면 된다. preserve //데이터 수정 gen = // 등등등 * 임시파일로 저장해 두고 사용하고 싶다tempfile modified_data* 데이터 파일로 확실히 저장하고 싶다save `modified_data' restore

STATA 2025.01.14

stata table 명령어에서 frequency와 percent의 소수 이하 자리수를 다르게 표기하는 방법

stata table 명령어에서 frequency는 소숫점 없이, percent는 소숫점 2자리까지 표기하는 방법 1. Frequency(빈도)를 소수점 없이 표시하기: `nformat(%12.0fc)` 옵션2. Percent(백분율)를 소수점 2자리까지 표시하기: `pformat(%5.2f)` 옵션table 변수명, contents(freq) nformat(%12.0fc) contents(percent) pformat(%5.2f)

STATA 2025.01.06

중복되는 값들의 제거 방법

네, Stata에서 A 변수와 B 변수의 대응되는 값들 중 하나씩만 남기는 작업을 수행할 수 있습니다. 이를 위해 'duplicates' 명령어를 사용할 수 있습니다. 다음은 그 과정입니다:중복 제거 (첫 번째 관측치 유지):stataCopyduplicates drop A B, force이 명령어는 A와 B 변수의 조합을 기준으로 중복된 행을 제거하고, 각 조합의 첫 번째 관측치만 유지합니다.중복 제거 (마지막 관측치 유지):stataCopygsort A B -_nduplicates drop A B, force이 방법은 먼저 데이터를 정렬한 후 중복을 제거하여 각 조합의 마지막 관측치를 유지합니다.무작위 선택:stataCopybysort A B: gen random = runiform()bysort A ..

STATA 2025.01.04

가중평균을 구할 때의 tab과 table 명령어 차이

가중평균을 구할 때, tab과 table 명령어를 사용하여 구한 값에 차이가 생기는데 이 차이에 대해서는 많이 고려하지 않는 것 같다. 가중치의 처리 방식이 달라서 두 값은 다르게 나온다. - tabulate 및 대부분의 Stata 명령어는 aweight를 사용하며, 이는 분석할 때 사용되는 데이터의 관측치 수 N으로 합계를 재조정한 값이다. 따라서 tabulate의 결과는 가중치가 더 작은 n으로 구한 평균값이 된다. - 그러나 table 명령어는 pweight를 사용하는데, 가중치를 재조정하지 않고 원래의 가중치를 그대로 사용한다.

STATA 2024.01.27

가중치 부여 시 tab과 table의 결과값이 달라지는 문제

STATA에서 tab aweignt를 사용할 때와 table pweitht를 사용할 때의 결과값이 다르게 나타난다. 이는 빈도표뿐만 아니라 평균 등을 구할 때에도 동일하게 다르다. https://www.statalist.org/forums/forum/general-stata-discussion/general/1393818-weighted-tab-and-table-results-differ Weighted tab and table results differ - Statalist www.statalist.org 이 부분이 다소 애매한데, 명확하게 왜 그런지를 명쾌하게 설명한 포스팅은 아직 찾지 못했다. 위의 포스팅에서는 표준오차 계산에서 차이가 생기기 때문이라고 하고, robust 를 적용했을 때는 두 결과..

STATA 2024.01.07

다층분석_평균중심화

1. 독립변수의 평균중심화 독립변수의 평균중심화에 대해서 잘 설명해 놓은 포스팅 https://ukchanoh.wordpress.com/2015/07/08/multilevel-centering/ 다수준모형(Multilevel Model)에서 변수 중심화(centering)의 선택 다수준모형(Multilevel Model)은 주로 종단자료(longitudinal data)나 군집자료(clustered data)에 사용되는 분석방법으로, 학문 분야에 따라 혼합효과모형(Mixed-Effects Model), 위계모형(Hierarchical Model) 등으로 불 ukchanoh.wordpress.com 아래의 포스팅도 잘 정리해 놓았다. https://m.blog.naver.com/lucifer246/2211..

STATA 2023.01.27