 |
 |
 |
 |
 |
|
 |
| 1. 코드의 개념 |
 |
 |
정보수신자가 서로 정보를 주고받는 과정에는 여러 가지 문제가
제기된다. 이 중에서 가장 중요한 것은 정보생산자가 부호화시킨 언어정보를
수신자가 같은 부호체계로 |
|
받아들일 수 있도록 하는 일이다. 언어행위에서는 언어기호의 형식과 내용은
비록 자의적 관계에 있지만 동일언어 화자와 청자간에 이미 약속되어 있는 것이기
때문에 의사소통에 문제가 발생하지 않는다. 그러나 정보전달에서는 양자 간의
부호체계가 다르면 정보전달행위는 가능하지 않다. 그러므로 정보생산자와 수신자
사이의 부호체계를 일원화 내지 표준화하지 않으면 안된다.
컴퓨터는 내부적으로 정보를 처리하기 위해 2진수 형태를 사용하기 때문에 인간이
사용하는 언어로는 사용할 수가 없다. 인간의 언어를 컴퓨터가 사용할 수 있도록
2진수의 대응관계를 정의하는데 이것을 문자코드라고 한다. 이때의 코드라는 개념은
비단 컴퓨터 내부 처리뿐만 아니라 컴퓨터 사이 또는 컴퓨터와 주변기기 사이의
정보 교환에도 마찬가지로 적용될 수 있다. 따라서 한글 코드란 한글을 컴퓨터
내부에서 2진수로 처리하도록 정의한 문자 집합을 말한다. 이때 한글 코드라고
하면 대개 한글뿐만이 아니라 영문자와 숫자, 한자와 각종 문장부호 등 한글과
함께 사용될 수 있는 모든 문자를 포함하는 것이 보통이다. 따라서 한글 코드란
광범위하게 생각하면 우리나라에서 쓰이는 문자들을 컴퓨터에서 표현하기 위한 대응
규칙이라고 할 수 있다. 다음에 로마자 A, B, C와 한글 ‘가, 각’의
코드 개념을 보이면 다음과 같다. |
| |
| 문자 |
2진수 |
16진수 |
10진수 |
| A |
0100
0001 |
41 |
65 |
| B |
0100
0010 |
42 |
66 |
| C |
0100
0011 |
43 |
67 |
|
| |
| 문자 |
2진수 |
16진수 |
| 가 |
1011
0000 1010 0001 |
B0A1 |
| 각 |
1011
0000 1010 0010 |
B0A2 |
|
| |
컴퓨터는 기본적으로 영어 문화권에서 만들어진 것이므로 컴퓨터를 쉽게 다루기
위해서 영어로 된 명령을 사용한다. 이러한 컴퓨터가 국내에 처음 들어 왔을
무렵에는 소수의 전문교육을 받은 사람들만이 컴퓨터를 다루었기 때문에 영어를
그대로 사용하였다. 그러다가 컴퓨터가 많이 보급되면서 차츰 한글로 된 명령과
한국어를 처리할 수 있는 프로그램이 필요하였다. 그런데 당시의 컴퓨터로 한국어를
처리하려면 여러 가지 어려운 문제가 있었다. 그중 가장 큰 문제는 기본적으로
컴퓨터는 1(8비트) 바이트 체계로 되어 있었기 때문에 최대한 표현할 수 있는
문자수가 256(28) 자였다는 점이다.
비트(bit)와 바이트(byte)라는 용어는 컴퓨터의 기억 단위를 나타내는
말이다. 비트는 메모리의 최소단위로서 1 또는 0 중에 어느 하나를 나타낸다.
비트의 개념은 흔히 ON/OFF로 표현된다. 컴퓨터 내부의 모든 전자회로는
이 비트 개념을 바탕으로 하고 있다. 8비트, 16비트 등 여러 개의 비트로
구성되어서 하나의 단위로 취급되는 비트 연쇄를 바이트라고 하지만, 일반적으로
8비트를 1 바이트라고 한다. 문자 코드에서는 8 비트를 하나의 단위로 취급해서
Octet라는 용어를 사용한다.
1 바이트를 사용하는 문자 코드에서는 논리적으로 256개의 문자를 정의할 수
있다. 미국에서 가장 많이 사용되었던 영문자 코드체계인 표준 ASCII (American
Standard Cord for Information Interchange)(ISO-646)에서는
로마자 대소문자(52자), 숫자(10자), 특수문자(34자), 제어문자(32자)를
합하여, 문자가 모두 128자밖에 되지 않기 때문에 이 문자들만으로서도 컴퓨터를
아무 불편 없이 쓸 수 있을 것이다. 그러나 현대 한글은 11,172자이므로
256자까지만 표현할 수 있는 1 바이트 체계로는 현대한글을 전혀 표현할 수
없었다. 그래서 능력 있는 개인이나 기업들이 하나둘씩 각각의 한글 처리 방법을
개발하였고, 다양한 한글 코드가 생겨났다. 이때까지만 해도 컴퓨터에서 한글을
사용한다는 것 자체가 대단한 일이었으므로 처리방법이나 구현원리 등은 그다지
중요한 문제가 아니었다.
그렇지만 정보를 공유하기 위해서는 이러한 한글코드가 통일되지 않으면 안되게
되었다. 그러나 그 표준화가 쉽지 않았다. 왜냐 하면 한글 코드는 그 방법이
너무 다양하여서 어떤 종류의 코드를 사용하는 것이 가장 효과적인가를 결정하기가
수월하지 않았기 때문이다.
한글 코드를 분류하는 기준은 여러 가지가 있지만 가장 중요한 기준은 한글 1음절을
표현하는데 조합 원리를 사용하는가, 필요한 바이트 수는 얼마인가, 8번째 비트를
사용하는가 하는 것 등이다. |
| |
| 2. 한글 코드란
무엇인가 |
 |
한글 코드 체계는 우리 민족의 문자. 우리 민족이 사용하고 있는 문자를
전산 체계화한 것을 말한다. 그것은 현대에 통용되는 문자뿐만 아니라 과거에
사용되어 오늘날 전해지고 있는 문자를 포함한다. 이러한 문자에는 다음과 같은
것들이 포함된다.
한글 : 한글 자모, 한글 음절, 한글 옛글자 자모, 한글 옛글자 음절, 기호
붙은 한글
한자 : 상용한자, 확장한자 및 이두 등
외국문자 : 영문자, 일본문자, 러시아문자, 몽고문자, 산스크리트문자 등
기호 : 문장부호, 약물, 화폐표기, 심볼 등 |
|
| |
 |
 |
 |
홍윤표 (연세대학교) |
|
 |
|
 |
 |
 |
 |
|