더미변수 회귀분석 stata - deomibyeonsu hoegwibunseog stata

반품/교환 방법

  •  마이페이지 > 반품/교환 신청 및 조회, 1:1 문의, 고객만족센터(1544-3800), 중고샵(1566-4295)
  •  판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간
  •  출고 완료 후 10일 이내의 주문 상품
  •  디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품
  •  중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
반품/교환 비용
  •  고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임
  •  직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음

    단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제

    •  오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소
    •  오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소
  •  직수입 음반/영상물/기프트 중 일부는 변심 또는 착오로 취소 시 해외주문취소수수료 30%를 부과할 수 있음

    단, 당일 00시~13시 사이의 주문은 취소 수수료 면제

  •  박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유
  •  소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  •  소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등
  •  복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집
  •  소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  •  디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  •  eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가
  •  중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우
  •  LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등)
  •  시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  •  전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상
  •  상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에 따른 배상
  •  대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리

The idea of approximation

경제

stata 복습 2탄: 데이터 관리 기본 명령어

Econoim 2013. 6. 11. 09:44

** 이 책의 진짜 좋은 점은 회귀식을 돌렸을 때의 결과와 그 회귀식 결과를 직접 구하는 결과를 비교하게 하는 것이다. 계량 공부에도 좋은 책 같아 추천.

* stata 파일을 스프레드 시트 파일로 전환하기

outsheet using "c:\data\data4_8.txt", nolabel replace

* 데이터 끝에서부터 5번째에서 마지막 관측치 확인하기

list price in -5/L

list price in -5/-2

* gen으로 더미변수 만들기

gen var4= return>0

(0보다 크면 1 아니면 0)

* 범주형 변수 더미 만들기

tab race

tab race, nolabel

tab race, gen(dum_race_)  => 범주가 3개면 더미변수가 3개 생김(각각 0,1)

xi i.race, noomit prefix(dum_)

=> noomit 옵션은 범주형 3개 중 2개만 만드는 default 하지 말고, 3개 만들라는 것임

dum_race_1, dum_race_2, dum_race_3 이 생김, prefix가 없으면 _Irace_1, _Irace_2, _Irace_3 이 생김

* 요약통계량 보기

sum hh_A, detail

centile hh_A, c(10 20 30 40 50 60 70 80 90 100)

tabstat hh_J2, statistics

by year, sort: tabstat hh_A hh_F hh_J2 tobar, statistics(mean) by(inc100) columns(variables) format(%9.0f)

* return list로 stata에 내부저장된 scalar 값 이용하기

return list

gen lived_s = (lived - r(mean))/r(sd)

* 전기값

gen begin_n1=begin[_n-1]

* egen : 패널에서 기업별로 / 월별에서 연별로 변수만들기

by company, sort : egen float max_invest = max(invest)  => 기업별 최대값

by year, sort : egen float mean_invest = mean(invest)  => 연도별 평균값

by year, sort: egen float percent_invest=pc(invest) => 연도별 각회사의 투자금액이 전체 투자금액에서 차지하는 비중

by year, sort: egen float rank_invest = rank(invest) => 연도별 각 투자회사의 투자액이 몇번째로 작은지(혹은 큰지)

결측치가 하나라도 있을 경우에 이 변수들을 합하여 새로 만든 변수가 missing value가 많이 생기면 egen 활용

gen rtotaldebt = debt1 + debt2 + debt3  (4848 missing ..)

=> egen float rtotaldebt = rowtotal (debt1-debt3) 이라고 하면 됨

* n개 그룹으로 나누어 일련번호 부여하기

10개 그룹으로 나누어 최하위 그룹에 1, ~ 최상위에 10 부여하기

xtile income10 = income, nquantiles(10)

* 데이터 값을 다시 코딩하기

recode ybirth (min/1979=0) (1980/max=1), gen (ybirth2)

=> ybirth가 1979까지는 새로운 변수 ybirth가 0, 1980부터는 ybirth2이 1이 되도록/ 새로운 변수 ybirth2을 만들기

* data를 옆으로? 아래로? 붙이기

옆으로 붙이기=> merge hhid usig "c:\data\data6_14.dta", unique sort (두 데이터셋에 hhid를 일대일로 일치시키기)

=> 이렇게 옆으로 붙이면 1999년 데이터 옆에 2000년 데이터가 붙으므로, wide data type을 long type으로 변환시켜야 하며, 이 때는

reshape long income_ finincome_ propincome_, i(hhid) j(year) 라고 하면 됨

=> income_ finincome_ propincome_는 연도를 제외한 공통된 부분임

아래로 붙이기=> append using "c:\data\data6_12.data" (이 때 변수가 없으면 결측치 처리, 변수가 같으면 같은 것끼리 붙음)

* 난수생성하기

findit rnd

rndt 100 5 => 100개의 난수를 생성하되, t분포의 자유도가 5가 되도로고 만든다

*long shape으로 바꾸기

//www.ats.ucla.edu/stat/stata/modules/reshapel.htm

==============================

Time series 관련 참고 명령어 추가 

* 변수 생성
generate time=q(1959q1)+_n-1
format time %tq;

* acf, pacf, corrgram

* 단위근 검정
varsoc

* arima / ardl /
if 명령어 대신 constraint  

  • 5049

우선 sysuse cancer의 자료를 사용해봄

sysuse cancer, clear

보통 이런 데이터가 있고 이를 카테고리화 시켜

“10 or less months”
“11 to 20 months”
“21 to 30 months”
“31 to more months”

의 식으로 카테고리로 나누기 위해서는 Dummy Variable을 만들 듯이 진행할 수 있다.

gen studyt=1 replace studyt=2 if studytime>10 replace studyt=3 if studytime>20 replace studyt=4 if studytime>30

하지만 Recode 라는 명령어를 사용하면 좀 더 간단하게 변환 가능하다.

recode studytime (min/10=1 “10 or less months”) (11/20=2 “11 to 20 months”) (31/max=4 “31 or more months”), gen(stime)

Toplist

최신 우편물

태그