프로젝트 초반에 꼭 고려해야 하는 요소가 있다. 바로 다국어처리 이다. 이 다국어 처리를 하기 위해서 꼭 알고 있어야 하는 개념이 아래 3가지 이다.
[1]Unicode
어렵게 생각하면 끝도 없다. 하지만 단순하게 생각해서 코드 테이블 인덱스 값이다. 모든 문자에 대해서 Unique한 넘버를 부여한것이 Unicode이다. 이 Unicodes는 플랫폼, 운영체제, 언어에 독립적이다.
Unicode provides a unique number for every character,
no matter what the platform,
no matter what the program,
no matter what the language
http://www.unicode.org/standard/WhatIsUnicode.html
[2]UTF-8
UTF 약어이고 원래 뜻은 (Unicode Transformation Format)이다. 즉, Unicode를 인코딩하는 방법이다.
8의미는 8비트 1바이트를 기준으로 인코딩한다는 의미이다.
중요한 점은 유니코드를 인코딩하는 방식중 하나라는 의미이다.
[3]UTf-16
UTF8과 동일하다.UTF 약어이고 원래 뜻은 (Unicode Transformation Format)이다. 즉, Unicode를 인코딩하는 방법이다.
16비트로 인코딩한다는 의미이다.
중요한 점은 유니코드를 인코딩하는 방식중 하나이다.
[UTf-8, UTF-16비교]
코드 범위(십육진법) | UTF-16BE 표현(이진법) | UTF-8 표현(이진법) | 설명 |
---|---|---|---|
000000-00007F | 00000000 0xxxxxxx | 0xxxxxxx | ASCII와 동일한 범위 |
000080-0007FF | 00000xxx xxxxxxxx | 110xxxxx 10xxxxxx | 첫 바이트는 110 또는 1110으로 시작하고, 나머지 바이트들은 10으로 시작함 |
000800-00FFFF | xxxxxxxx xxxxxxxx | 1110xxxx 10xxxxxx 10xxxxxx | |
010000-10FFFF | 110110yy yyxxxxxx 110111xx xxxxxxxx | 11110zzz 10zzxxxx 10xxxxxx 10xxxxxx | UTF-16 서러게이트 쌍 영역 (yyyy = zzzzz - 1). UTF-8로 표시된 비트 패턴은 실제 코드 포인트와 동일하다. |
'애자일(Agile)개발방법론' 카테고리의 다른 글
[ETC] 오픈소스 라이센스 정리 (GPL, LGPL, BSD, MIT 이란?) (0) | 2015.03.09 |
---|---|
[1] 애자일 개발 방법이란? (애자일 Overview, 미신) (0) | 2015.03.02 |
[4] C# 개발 표준(코딩 규칙) MS 권장 (0) | 2015.02.26 |
[3] C# 프로그램 권장하는 구조 (0) | 2015.02.26 |
[2]개발 표준-Capitalization Conventions (0) | 2015.02.23 |