게시판

  • 글씨크기확대
  • 글자크기기본
  • 글씨크기축소
  • 인쇄

공지사항

STATA 통계 프로그램 한글 깨짐 현상 조치 방법

작성자 정보전산원 작성일 2019/03/07 조회수 2685
첨부파일
    첨부파일없음

(해당 내용은 14버전 기준으로 작성되었습니다.)

 

Stata 버전 14부터는 변수명도 한글을 사용할 수 있습니다.

이전 버전에서 작성된 파일을 버전 14에서 불러들일 때 변수 라벨(Variable Label) 및 값 라벨(Value Label)

한글이 포함되어 있을 경우 깨진 상태로 보입니다. (파일 자체는 문제 없음)

이 부분은 버그가 아니고 버전 14부터 지원하는 유니코드 때문입니다.

이때 커맨드 창에 다음과 같은 입력 과정을 거치면 제대로 변환됩니다.

 

작업하실 파일을 버전 14에서 파일을 먼저 불러들이지 않고 실행하시기 바랍니다.

 

clear

cd “폴더 경로  // 이전 버전에서 작성된 파일이 있는 폴더 경로입력 (: c:tempstata)

unicode encoding set korean

unicode translate 파일명, invalid

 

파일명부분에는 변환이 필요한 모든 파일이 가능합니다.

(*.dta / *.do / *.* / * / myfile.*) : 와일드 카드로 * 만 입력하시면 변환이 필요한 모든 파일이 자동으로 변환됩니다.

변환할 모든 파일을 한 폴더에 저장한 후 파일명 자리에 * 만 입력하시고 실행 하셔도 됩니다.

참고로 이전 버전에서 작성된 파일들은 바로 밑에 ‘bak.stunicode’라는 폴더에 원본 그대로 백업됩니다.

(* 문제가 없이 변환이 완료되면 이 백업 폴더는 나중을 위해 반드시 이름을 바꾸어 두시기 바랍니다.)

 

CSV 파일을 불러들일 경우 커맨드 창을 이용한다면 아래 명령어를 이용하시면 편리합니다.

import delimited “파일명.csv”, encoding(CP949) clear

만약 CP949으로 되지 않는다면 UTF-8로 바꿔서 해 보시기 바랍니다.

import delimited “파일명.csv”, encoding(UTF-8) clear

) import delimited “c:testfile_1.csv”, encoding(CP949) clear

import delimited “c:testfile_1.csv”, encoding(UTF-8) clear

 

Stata 14에서 새로 파일을 만들 때는 위와 같은 변환을 고민할 필요가 없습니다.

메뉴의 File Save as… → 하단의 파일 형식(Stata 13 or Stata 12)을 통해 이전 버전으로 저장해서 데이터 파일을

공유할 수 있습니다.

 

Stat/Transfer 13을 이용해 이전 버전 Stata 파일이나 다른 통계프로그램의 데이터를 변환할 경우에는

자동으로 유니코드로 변환합니다. 이때 Options(1) 부분의 Stata 출력 부분에 버전을 "14"로 지정해 놓으시기 바랍니다.

 

새로 버전 14에서 파일을 생성할 경우 이제부터 변수명을 한글로 입력해도 됩니다.

그리고 엑셀에서 변수명이 한글로 되어 있다면 그대로 메뉴의 File Import Excel spreed sheet(*.xls, *.xlsx)를 통해

변환이 가능합니다. (Import first row as variable names 항목 체크)

다음글 : MATLAB EXPO 2019 KOREA - Live Streaming (실시간 .. 정보전산원 2019/04/17
현재글 : STATA 통계 프로그램 한글 깨짐 현상 조치 방법.. 정보전산원 2019/03/07
이전글 : STATA 통계 프로그램 사용 안내 관리자 2019/02/01
a