더미변수 회귀분석 stata - deomibyeonsu hoegwibunseog stata

반품/교환 방법

  •  마이페이지 > 반품/교환 신청 및 조회, 1:1 문의, 고객만족센터(1544-3800), 중고샵(1566-4295)
  •  판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간
  •  출고 완료 후 10일 이내의 주문 상품
  •  디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품
  •  중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
반품/교환 비용
  •  고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임
  •  직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음

    단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제

    •  오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소
    •  오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소
  •  직수입 음반/영상물/기프트 중 일부는 변심 또는 착오로 취소 시 해외주문취소수수료 30%를 부과할 수 있음

    단, 당일 00시~13시 사이의 주문은 취소 수수료 면제

  •  박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유
  •  소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  •  소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등
  •  복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집
  •  소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  •  디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  •  eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가
  •  중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우
  •  LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등)
  •  시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  •  전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상
  •  상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에 따른 배상
  •  대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리

The idea of approximation

경제

stata 복습 2탄: 데이터 관리 기본 명령어

Econoim 2013. 6. 11. 09:44

** 이 책의 진짜 좋은 점은 회귀식을 돌렸을 때의 결과와 그 회귀식 결과를 직접 구하는 결과를 비교하게 하는 것이다. 계량 공부에도 좋은 책 같아 추천.

* stata 파일을 스프레드 시트 파일로 전환하기

outsheet using "c:\data\data4_8.txt", nolabel replace

* 데이터 끝에서부터 5번째에서 마지막 관측치 확인하기

list price in -5/L

list price in -5/-2

* gen으로 더미변수 만들기

gen var4= return>0

(0보다 크면 1 아니면 0)

* 범주형 변수 더미 만들기

tab race

tab race, nolabel

tab race, gen(dum_race_)  => 범주가 3개면 더미변수가 3개 생김(각각 0,1)

xi i.race, noomit prefix(dum_)

=> noomit 옵션은 범주형 3개 중 2개만 만드는 default 하지 말고, 3개 만들라는 것임

dum_race_1, dum_race_2, dum_race_3 이 생김, prefix가 없으면 _Irace_1, _Irace_2, _Irace_3 이 생김

* 요약통계량 보기

sum hh_A, detail

centile hh_A, c(10 20 30 40 50 60 70 80 90 100)

tabstat hh_J2, statistics

by year, sort: tabstat hh_A hh_F hh_J2 tobar, statistics(mean) by(inc100) columns(variables) format(%9.0f)

* return list로 stata에 내부저장된 scalar 값 이용하기

return list

gen lived_s = (lived - r(mean))/r(sd)

* 전기값

gen begin_n1=begin[_n-1]

* egen : 패널에서 기업별로 / 월별에서 연별로 변수만들기

by company, sort : egen float max_invest = max(invest)  => 기업별 최대값

by year, sort : egen float mean_invest = mean(invest)  => 연도별 평균값

by year, sort: egen float percent_invest=pc(invest) => 연도별 각회사의 투자금액이 전체 투자금액에서 차지하는 비중

by year, sort: egen float rank_invest = rank(invest) => 연도별 각 투자회사의 투자액이 몇번째로 작은지(혹은 큰지)

결측치가 하나라도 있을 경우에 이 변수들을 합하여 새로 만든 변수가 missing value가 많이 생기면 egen 활용

gen rtotaldebt = debt1 + debt2 + debt3  (4848 missing ..)

=> egen float rtotaldebt = rowtotal (debt1-debt3) 이라고 하면 됨

* n개 그룹으로 나누어 일련번호 부여하기

10개 그룹으로 나누어 최하위 그룹에 1, ~ 최상위에 10 부여하기

xtile income10 = income, nquantiles(10)

* 데이터 값을 다시 코딩하기

recode ybirth (min/1979=0) (1980/max=1), gen (ybirth2)

=> ybirth가 1979까지는 새로운 변수 ybirth가 0, 1980부터는 ybirth2이 1이 되도록/ 새로운 변수 ybirth2을 만들기

* data를 옆으로? 아래로? 붙이기

옆으로 붙이기=> merge hhid usig "c:\data\data6_14.dta", unique sort (두 데이터셋에 hhid를 일대일로 일치시키기)

=> 이렇게 옆으로 붙이면 1999년 데이터 옆에 2000년 데이터가 붙으므로, wide data type을 long type으로 변환시켜야 하며, 이 때는

reshape long income_ finincome_ propincome_, i(hhid) j(year) 라고 하면 됨

=> income_ finincome_ propincome_는 연도를 제외한 공통된 부분임

아래로 붙이기=> append using "c:\data\data6_12.data" (이 때 변수가 없으면 결측치 처리, 변수가 같으면 같은 것끼리 붙음)

* 난수생성하기

findit rnd

rndt 100 5 => 100개의 난수를 생성하되, t분포의 자유도가 5가 되도로고 만든다

*long shape으로 바꾸기

http://www.ats.ucla.edu/stat/stata/modules/reshapel.htm

==============================

Time series 관련 참고 명령어 추가 

* 변수 생성
generate time=q(1959q1)+_n-1
format time %tq;

* acf, pacf, corrgram

* 단위근 검정
varsoc

* arima / ardl /
if 명령어 대신 constraint  

  • 5049

더미변수 회귀분석 stata - deomibyeonsu hoegwibunseog stata

우선 sysuse cancer의 자료를 사용해봄

sysuse cancer, clear
더미변수 회귀분석 stata - deomibyeonsu hoegwibunseog stata

보통 이런 데이터가 있고 이를 카테고리화 시켜

“10 or less months”
“11 to 20 months”
“21 to 30 months”
“31 to more months”

의 식으로 카테고리로 나누기 위해서는 Dummy Variable을 만들 듯이 진행할 수 있다.

gen studyt=1
replace studyt=2 if studytime>10
replace studyt=3 if studytime>20
replace studyt=4 if studytime>30

하지만 Recode 라는 명령어를 사용하면 좀 더 간단하게 변환 가능하다.

recode studytime (min/10=1 “10 or less months”) (11/20=2 “11 to 20 months”) (31/max=4 “31 or more months”), gen(stime)
더미변수 회귀분석 stata - deomibyeonsu hoegwibunseog stata