한글5 윈도우에서 tar 한글 문제 NTFS 포맷의 하드를 리눅스에 물려 하드 안에 있던 내용을 tar로 묶어서 보관했다. 이 tar 파일을 윈도에서 7zip 으로 풀어보니 한글 파일명이 전부 깨진다. 인코딩 문제 같은데 이유를 잘 모르겠다. 리눅스는 utf-8로 사용하지 오래 됐고 윈도 7은 당연 utf-8 아닌가? tar 파일을 리눅스 상에서 풀어보면 한글이 잘 보이는 걸로 봐서는 윈도에서 풀어주는게 문제 같은데... 해결책을 검색해보니... 일단 리눅스에서 작업한 tar 명령에는 인코딩 관련 옵션이 없다. 있어도 할게 없지.. 어차피 utf-8 인데... 그럼 다시 윈도 쪽에서 할수있는게 뭘까를 생각해보자.. 7zip에서 해당 tar 파일을 열어보니 한글이 다 깨진다. 7zip 문제 같다. 하지만 7zip에는 인코딩 설정에 관한 옵션.. 2014. 6. 5. libhangul http://studyfoss.egloos.com/5140309 2014. 3. 16. utf, euc-kr 사용상의 애로사항 utf-8 의 경우 한글을 3바이트로 인지하고 euc-kr은 2바이트로 인지하기 때문에 빌드 머신과 타겟의 인코딩이 다를 경우 코딩시에 이 차이로 인해 발생하는 문제를 고려해야한다. 빌드 머신도 utf-8, 타겟 머신도 utf-8을 쓰도록 하자. utf-8이 네트웍 전송시 바이트 오더링으로 인한 문제도 발생하지 않고 가장 속편하다. 대량의 한글 데이타 처리를 할 때는 좀 고민을 해뱌아할지도 모르지만 요즘은 웹을 비롯한 대부분의 DB도 utf-8을 사용하는 추제가 아닌가 utf-8 => 유니코드 유니코드 => 완성형(euc-kr/ksc5601) (for bdf 폰트 출력)유니코드 => 조합형 (for fnt 폰트 출력) 완성형 => 조합형 조합형 => 완성형 2014. 1. 24. 각종 한글 코드표 * ks5601 (euc-kr) 완성형 코드표http://zbxe.bluegate.kr/42 * 유니코드 범위 목록http://ko.wikipedia.org/wiki/%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C_%EB%B2%94%EC%9C%84_%EB%AA%A9%EB%A1%9D * cp949 코드표 http://blog.naver.com/PostView.nhn?blogId=gimjoonbum&logNo=30125704965 * 한글 완성형(KS5601/KSX1001)의 코드 범위 A1A1h ~ ACFEh : 부호B0A1h ~ C8FEh : 한글CAA1h ~ FDFEh : 한자 * 부호 부분 A1A1h ~ A2E5h: 기호와 약자 몇가지A3A1h ~ A3FEh: 전각 문자A4A1h ~.. 2014. 1. 21. 이전 1 2 다음