 |
| 1. 말뭉치의 활용
이유 |
 |
 |
모국어 화자의 직관이나 언어 능력만으로 설명하기 어려운 언어
현상에 대해서 설득력 있는 증거로서 이용되거나 실제 언어생활을 객관적으로
연구하는데 주로 이용된다. 말뭉치가 언어 |
|
| 연구에서 어떤 목적으로 주로 이용되는지를 구체적으로 정리하면 다음과 같다. |
| |
| ① 말뭉치는 긍정적인 증거를 제시함에 있어 매우 강력하다. 말뭉치는
자연적이고 실제적인 자료이기 때문에 긍정적 증거를 제시해줄 수 있다.
물론 수행 상의 오류를 포함할 수도 있지만, 이러한 오류의 빈도가
상당하다면 그 자료는 언어의 조직적인 측면을 보여주는 실제적인 증거라고
할 수 있다. |
| |
| ② 말뭉치는 사람의 직관이나 내성으로 볼 수 없는 언어의 조직적
성질을 볼 수 있게 한다. 컴퓨터 저장 장치와 프로그램의 발달로
대용량의 언어 자료를 저장하고 처리하는 것이 가능하다. 이렇게 모아진
많은 언어 자료는 언어 양상(pattern)을 보여 주고, 그것은
언어의 조직적 성질을 반영하는 경우가 많다. 따라서 우리의 직관이나
내성으로 볼 수 없는 언어의 내적 특성을 자료를 통해서 가시화할
수 있다. |
| |
| ③ 중간문법을 탐구하는 자료로서 중요한 의미를 가진다. 고도로
이론적인 생성 문법적 연구는 말뭉치를 통하여 국어학에서 실제적으로
필요한 학문으로 토착화하는 하나의 길을 찾을 수 있다. |
| |
| ④ 언어의 기능적인 측면을 밝히는데 효과적이다. 말뭉치는 실제적이고
자연적인 언어 형식을 제공하기 때문에 언어의 기능적인 측면, 특히
언어의 의미와 화용 기능을 밝히는데 아주 유용하다. |
|
| |
| 2. 말뭉치의 활용
분야 |
 |
(1) 언어학
말뭉치는 언어학 분야에서 가장 다양하게 이용될 수 있는데, 특히 언어적 특징을
통계화하고 계량적으로 기술하는데 많이 이용된다. 또한 언어 현상을 체계적이고
실증적으로 가시화하거나 언어적 직관을 뒷받침하는 증거로써 이용된다. 최근에는
언어의 기능과 의사소통의 특징을 밝히는 데에도 많이 이용하고 있으며, 언어의
활용적 특징을 살피는 데에도 다양하게 이용하고 있다. |
| |
(2) 사전 편찬
사전 편찬은 어휘 수집 작업에서부터 각 어휘의 문법 특징과 의미 및 용례 기술
등 다양하고 복잡하게 이루어지는데 이러한 모든 과정에서 말뭉치를 효율적으로
이용할 수 있다. 어휘 수집의 경우에는 말뭉치 자료를 통해서 기초 어휘를 선별할
수 있으며, 신조어를 비롯한 외래어, 전문 용어까지 폭넓게 수집할 수 있으며,
각 어휘의 문법 특징과 의미도 추출할 수 있다. 특히 용례 기술에 있어서는
가공된 형식이 아닌 실제적이고 자연스러운 언어 자료를 제공할 수 있다는 장점이
있다. |
| |
(3) 자연 언어 처리 및 정보 과학
자연 언어 처리 분야에서는 실제 언어 현상의 규칙을 찾아내어 이를 중심으로
하여 시스템을 개발하는데 이때 대량의 말뭉치 자료를 이용한다. 형태소 분석과
같은 기반 기술에서부터 번역이나 맞춤법 검사와 같은 응용 분야까지 다양한 분야에서,
말뭉치를 시스템 개발의 원천 자료로 이용함은 물론이고 시스템의 성능 향상이나
평가에서도 이용하고 있다.
정보 과학 분야도 마찬가지로, 기계 번역의 기초로 활용되는 전자 사전 개발에
있어서도 다양하고 실제적인 언어 현상을 반영하는 말뭉치 자료를 효율적으로 이용하고
있다. |
| |
(4) 언어 교육 분야
언어 교육 분야에서는 말뭉치로부터 용례 추출기를 사용하여 적절한 용례를 찾아내고
이것을 컴퓨터를 이용한 언어학습 (CALL: Computer-Assisted
Language Learning)의 형태로 이용한다. 과거에는 문법 학습 중심으로
이루어졌던 언어 교육이 최근에는 의사소통 및 과제 해결 중심으로 언어 교육의
목표가 달라지면서, 말뭉치는 좀더 현실적이고 실제적인 언어 교육의 자료로 이용되고
있다. |
| |
 |
 |
 |
홍윤표 (연세대학교) |
|
 |