운영_설치/기타17 [vim] .vimrc 여기저기서 따온거라 출처를 밝히기 어려움. set enc=utf-8" encoding"set encoding=utf-8 set fileencodings=utf-8,euc-kr" 자동으로 utf-8 인지 euc-kr 인지 판별해서 fileencoding 값을 정해줌" 저장할 때 새 파일이면 터미널의 인코딩대로 저장이 되고," 기존 파일이면 원래 파일 인코딩대로 저장된다. set ts=8 " 파일에 저장될 때의 tab sizeset sts=4" 편집하는 동안 보여질 tab sizeset sw=4" indent size set backspace=indent,eol,start "set nu " 줄번호set numberwidth=4" 줄번호 표시 간격set aiset ci set nobackup" backup 파.. 2014. 8. 4. 윈도우에서 tar 한글 문제 NTFS 포맷의 하드를 리눅스에 물려 하드 안에 있던 내용을 tar로 묶어서 보관했다. 이 tar 파일을 윈도에서 7zip 으로 풀어보니 한글 파일명이 전부 깨진다. 인코딩 문제 같은데 이유를 잘 모르겠다. 리눅스는 utf-8로 사용하지 오래 됐고 윈도 7은 당연 utf-8 아닌가? tar 파일을 리눅스 상에서 풀어보면 한글이 잘 보이는 걸로 봐서는 윈도에서 풀어주는게 문제 같은데... 해결책을 검색해보니... 일단 리눅스에서 작업한 tar 명령에는 인코딩 관련 옵션이 없다. 있어도 할게 없지.. 어차피 utf-8 인데... 그럼 다시 윈도 쪽에서 할수있는게 뭘까를 생각해보자.. 7zip에서 해당 tar 파일을 열어보니 한글이 다 깨진다. 7zip 문제 같다. 하지만 7zip에는 인코딩 설정에 관한 옵션.. 2014. 6. 5. 엔디안(endian) 과 바이트 오더링(byte ordering) MSB - Most Significanct Bit (가장 큰 비트 자릿수) LSB - Least Significant Bit (가장 작은 비트 자릿수) 리틀엔디안 - LSB가 낮은 쪽의 주소에 먼저 등장하는 경우의 비트열 빅엔디안 - MSB가 낮은 쪽의 주소에 먼저 등장하는 경우의 비트열 4byte 값 11223344 little endian 첫 바이트 (0~7 비트) : 44 두번째 바이트 (8~15비트) : 33 세번째 바이트 (16~23 비트) : 22 네번째 바이트 (24~31 비트) : 11 big endian 첫 바이트 (0~7 비트) : 11 두번째 바이트 (8~15비트) : 22 세번째 바이트 (16~23 비트) : 33 네번째 바이트 (24~31 비트) : 44 % x86 계열 cpu는 .. 2014. 4. 11. utf, euc-kr 사용상의 애로사항 utf-8 의 경우 한글을 3바이트로 인지하고 euc-kr은 2바이트로 인지하기 때문에 빌드 머신과 타겟의 인코딩이 다를 경우 코딩시에 이 차이로 인해 발생하는 문제를 고려해야한다. 빌드 머신도 utf-8, 타겟 머신도 utf-8을 쓰도록 하자. utf-8이 네트웍 전송시 바이트 오더링으로 인한 문제도 발생하지 않고 가장 속편하다. 대량의 한글 데이타 처리를 할 때는 좀 고민을 해뱌아할지도 모르지만 요즘은 웹을 비롯한 대부분의 DB도 utf-8을 사용하는 추제가 아닌가 utf-8 => 유니코드 유니코드 => 완성형(euc-kr/ksc5601) (for bdf 폰트 출력)유니코드 => 조합형 (for fnt 폰트 출력) 완성형 => 조합형 조합형 => 완성형 2014. 1. 24. 이전 1 2 3 4 5 다음