본문 바로가기

운영_설치/기타

utf, euc-kr 사용상의 애로사항


utf-8 의 경우 한글을 3바이트로 인지하고 euc-kr은 2바이트로 인지하기 때문에


빌드 머신과 타겟의 인코딩이 다를 경우 코딩시에 이 차이로 인해 발생하는 문제를 


고려해야한다.



빌드 머신도 utf-8, 타겟 머신도 utf-8을 쓰도록 하자.




utf-8이 네트웍 전송시 바이트 오더링으로 인한 문제도 발생하지 않고 가장 속편하다.


대량의 한글 데이타 처리를 할 때는 좀 고민을 해뱌아할지도 모르지만


요즘은 웹을 비롯한 대부분의 DB도 utf-8을 사용하는 추제가 아닌가






utf-8 => 유니코드


유니코드 => 완성형(euc-kr/ksc5601) (for bdf 폰트 출력)

유니코드 => 조합형 (for fnt 폰트 출력)


완성형 => 조합형


조합형 => 완성형



Calendar
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Archives
Visits
Today
Yesterday