최근에 논문을 읽다가 '접어(Clitics)'라는 단어를 자주 접하게 되었는데, 그 의미에 대해 자세히 알고자 이 논문을 읽게 되었습니다.
*본 내용은 필자의 이해가 담긴 글이기에 정확한 내용은 원문을 참고하시기 바랍니다.
채희락. (2007). 접어와 한국어 품사 분류: 품사 재정립 및 띄어쓰기 재고. 언어, 32(4), 803-826.
접어의 정의(Clitics)
본 논문에서는 접어를 음운론적 독립성이 없고, 통사적으로는 개별 단어라고 정의하고 있습니다. 저는 음운론적 독립성이 잘 와닿지 않아서 '자립 형태소'로 이해했습니다. 논문 안에서 많이 나오긴 하는데 어떤 뜻인지 검색해도 찾기 어려웠네요 ㅠㅠ 아시는 분 있으시면 댓글 남겨주세요!
통사적 개별 단어는 통사적으로 분석했을 때 분석의 기본 단위가 되는가에 중점을 두어 해석했습니다. 쉽게 구 구조를 분석한다고 할 때 분석 단위로 볼 수 있는가로 이해했습니다.
접어의 특징은 다른 단위들과 비교해 보면 더 잘 나타납니다. 본 논문에 따르면 접사와 단어 사이의 개념을 '접어'라고 합니다.
접사 - 접어 - 단어
그리고 이 단위는 좀 더 세분화 될 수 있습니다.
접사(굴절 접사 전형적 접사) - 구접사 - 접어(전형적 접어, 순접어) - 의존사 - 단어
왼쪽으로 갈수록 앞선 단위(주로 어근)와의 결합 제약이 크고, 오른쪽으로 갈수록 결합제약이 적으며 독립적으로 쓰일 수 있습니다.
각각의 예시를 간단히 살펴보면 다음과 같습니다.
(굴절)접사: '-았/었'
구접사: 격조사, '-이', '-를' , 구에 붙는 접사
순접어: 보조사, 후치사, '-도', '-만', '-에서'
의존사: 의존명사, '-것', '-수'
한국어 접어 분석, 새로운 품사 체계 제시
본 논문에서는 한국어의 접어에 대해 분석하고 이를 바탕으로 새로운 품사 체계를 제시합니다.
접어 vs 접사
접사와 구분되는 접어의 어휘적 속성은 다음과 같습니다.
- 선행 요소와 결합할 때 생산성이 높다. 더 다양한 요소들과 결합 가능하다.
- 결합하는 선행 요소는 주로 구/절 단위가 된다.
- 선행 요소의 단독 수식이 가능하다.
이와 같은 속성을 바탕으로 어떤 게 더 '접어'에 가까운 지 설명할 수 있다. 그리고 이를 바탕으로 기존의 품사 체계에서 '접어' 개념을 추가하여 분석합니다.
이 중 몇가지만 살펴보겠습니다.
우선 명사에서 단위성 의존명사인 '개', '마리', '채'와 '-짜리', '-쯤'과 같은 의존 명사를 접어로 보았는데, 여기선 이/그/저 와 같은 지시 관형사의 수식을 받을 수 없는 것이 주된 이유입니다. 독립된 단어나 의존사의 경우 지시 관형사의 수식을 받을 수 있다는 점과 비교해 보면 확실히 접어가 단어보다는 결합 제약이 존재한다는 것을 알 수 있습니다.
관형사 중 한자어 계통에 있어서 파생접사로 볼 수도 있는 애매한 어휘들을 접어로 보았습니다. 제 1호, 전/현- 대통령 등 '구'와 결합가능성, 뒤에 나오는 대상들의 다양성 등을 종합해 '접어 관형사'로 판단했다고 합니다.
접어 개념 도입의 장점
여러 장점들이 소개되었는데 그 중 한 가지를 소개하고자 합니다.
자연어 처리에 있어서 도움이 될 것 같은 장점을 골랐고, 이는 다음과 같습니다.
'친서방적', '주베트남 한국 문화원' 이 예시를 살펴봅시다.
'친서방적', '주베트남' 단어가 항상 뒤의 단어를 수식하는 역할을 한다는 점에서 관형어로 분석되기에 단어의 품사를 바꾸는 파생 접두사로 보아야 합니다. 그러나 한국어엔 이러한 파생 접두사에 대한 개념이 없습니다. 따라서 파생 접두사를 가정해야 하는데, 이를 '접어' 기준에 따라 분석하면 '파생 접두사' 개념을 추가하지 않고 해결할 수 있다고 합니다.
Mecab 형태소 분석기를 이용한 분석
친서방적(친-, 접사)
[('친서방', 'NNP'), ('적', 'XSN’)]
주베트남 한국 문화원(주-, 접사)
[('주', 'MM'), ('베트남', 'NNP'), ('한국', 'NNP'), ('문화원', 'NNG’)]
Mecab에선 주베트남의 '주'를 관형사로 분류하였습니다. crf를 사용하여서인지 아니면 분류 체계의 차이인지는 모르겠지만, 위와 같이 관형사로 분류될 수 있는게 하나로 묶여있는 경우보다 이후의 언어처리 작업에 용이할 것으로 생각됩니다.
참고: 꼬꼬마, 한나눔 형태소 분석
[('주', 'NNG'), ('베트남', 'NNG'), ('한국', 'NNG'), ('문화원', 'NNG')] - 꼬꼬마
[('주베트남', 'N'), ('한국', 'N'), ('문화원', 'N')] - 한나눔
접어 개념 도입과 현행 띄어쓰기 재고
접어 개념을 추가했을 때, 현행 띄어쓰기 기준에 있어서 일관성 부족하다고 합니다.
단위성 의존 명사의 경우 현행 기준에 따르면 띄어씁니다.
ex) 개, 대, 돈, 마리 등 – 띄어쓴다.
순서, 숫자와 같이 쓰이는 경우 붙여쓸 수 있다는 조항이 있습니다.
ex) 두시, 삼십분, 삼학년
‘-이다‘ 역시 품사 재분류를 통해 '접어'로 분석되었지만, 현재는 '조사'로 붙여써야 합니다.
'접어' 개념이 추가되면 이와 같은 띄어쓰기 불일치 역시 개선되어야 하겠습니다.
'접어'라는 개념이 생소했는데 이 논문을 통해 많이 알아가는 것 같습니다. 앞으로 자연어 처리에 적용하여 더 좋은 성능을 내는 데 도움을 줄 수 있을 지 고민해 봐야겠네요.
참고문헌
채희락. (2007). 접어와 한국어 품사 분류: 품사 재정립 및 띄어쓰기 재고. 언어, 32(4), 803-826.
'언어학' 카테고리의 다른 글
[언어학 개념 하나][형태론] 단어의 단위 (0) | 2021.10.01 |
---|---|
[논문 읽기] 언어 자료에 대한 통계 분석 (2) | 2021.01.27 |
[논문 읽기] 한국어 한자어의 문법적 특징 및 양상 (0) | 2021.01.15 |
[논문 리뷰] 포르투갈어의 유머 인식을 위한 코퍼스 및 기준 (0) | 2021.01.06 |
[언어학] 화용론. 직시(deixis) (0) | 2020.12.06 |
댓글