이론 정리

한글 인코딩

OSC131 2019. 6. 4. 02:30
728x90
반응형

한글 인코딩

 

한글 인코딩이란?

 한글을 기계가 이해할 수 있는 형태로 변환하는 것

 

종류

 

1. 조합형

  자음, 모음 등을 하나의 문자로 인식하여 초성, 중성, 종성에 코드를 부여한 후 조합하는 방법

  한글의 창제 원리를 잘 반영하나, 타 문자 체계와 호환이 안되는 등의 이유로 사용 X

  ex) (ㅈ+ㅗ) + (ㅎ+ㅏ+ㅂ) + (ㅎ+ㅕ+ㅇ) - 8개의 문자

  

 

2. 완성형

  각 글자를 독립된 문자로 인식하여 각 글자에 코드를 부여하는 방법

  ex) ‘’ + ‘’ + ‘’ - 3개의 문자

 

  2.1 완성형 인코딩 종류

    EUC-KR(Extend unix code)

    - 1 Byte 단위의 문자(한글, 한자의 경우 2 Byte) 인코딩으로 한글, 한자, 영문 표현 가능

 

    UTF-8(Unicode Transformation Format)

    - 유니코드를 위한 1~4 Byte 문자 인코딩, 전 세계 문자 표현 가능

 

----

 

유니코드 : 세계 문자 인코딩을 위한 기준 및 협약 ( 알파벳, 한글을 포함한 모든 언어 + 기타)

아스키코드 : 문자 인코딩을 위한 기준 ( 알파벳 + 아라비아 숫자 + 기타 )

 

728x90
반응형