본문 바로가기
study_life

끝말잇기의 고수

by skyjwoo 2020. 12. 4.
728x90
반응형

끝말잇기와 직업이 연관 있을까?

www.youtube.com/watch?v=gH7sg5Gqe0w

최근 진용진이라는 유튜버의 영상 중에서 '끝말잇기'를 주제로 한 영상을 굉장히 재미있게 보았다. 

국어학자와 화학자 간의 끝말잇기 대결이었는데, 화학 연구원 분이 이기시긴 했으나, 그 뒤에 나오는 끝말잇기 고수들의 대결이 정말 충격적이었다. 특히 고수들의 대결을 살펴보면, 어릴 적 했던 끝말잇기 온라인 게임의 어휘와는 완전히 다른 어휘들을 선보였다. 사용된 단어들을 살펴보면, 다음과 같다. 

 

우선 국어학자와 화학자 사이의 대결에 사용된 단어들이다. 

 

국어학자 vs 화학자

 

<화학자 선공>

국카스텐 > 텐텐 > 텐미닛 > 닛케이지수 > 수산화나트륨 > 윰라대왕 > 왕성 > 성수 > 수산화칼륨

 

<국어학자 선공>

수명 > 명줄 > 줄넘기 > 기온 > 온스 > 스트론튬

 

한방단어로써 화학 용어가 제 역할을 다해주었다. 

 

이후 끝말잇기 고수와 화학자 분의 대결이 있었다. 

 

고수1 vs 화학자

 

<화학자 선공>

삼각대 > 대그릇

 

<고수1 선공>

진학 > 학벌 > 벌매듭

 

마지막으로 끝말잇기 고수 사이의 대결이 가히 충격적이다. 

 

고수1 vs 고수2

 

<고수2 선공>

감촉 > 촉륜 > 윤멸 > 멸균 > 균륜 > 균핵균 > 균륜 > 윤곽 > 곽인쇄 > 쇄소건즐 > 즐욕 > 욕식 > 욕중관수욕 > 욕식 > 식업 > 업시름 > 늠준 > 준민고택 > 택곽 > 곽재겸 > 겸지우겸 > 겸업 > 업종 > 종노릇 > 늣치 > 치읓

 

확실히 '끝말잇기'의 고수다움이 묻어난 것 같다. 

 

어떻게 하면 끝말잇기의 고수가 될 수 있을까? 이 결과를 보면 단순히 '어휘력'으로 단언할 수는 없을 것 같다. 화학자와 국어학자 역시 자신의 분야에 있어선 일반인보다는 훨씬 많은 어휘력을 가질 것이다.  필자는 '끝말잇기'라는 게임이 가진 특성이 고려된 어휘력이 중요하다고 생각된다.

 

 

끝말잇기에 대한 고찰, 분석

 

특정한 제한 없이, 명사, 사용 단어의 중복 제한만 존재한다고 가정할 때, 끝말잇기에서 중요한 글자는 맨 앞글자와 맨 뒷글자(끝말)이다. 또한 '한방단어'라고 해서 해당 끝말로 시작하는 단어가 없는 단어(또는 매우 적거나 자주 쓰이지 않아 떠올리기 힘든 경우)라는 개념이 존재한다. 이를 한 번 분석해 보고자 한다. 

 

이와 관련해서 한국어 단어들에 대해 한 번 조사해 보았다. 깃헙에서 재미있는 데이터를 찾아볼 수 있었다. 

github.com/korean-word-game/db

 

korean-word-game/db

국립국어원 표준국어대사전 표제어 DB. Contribute to korean-word-game/db development by creating an account on GitHub.

github.com

한국어와 북한어의 단어들을 정리해 놓은 데이터이다. 물론 어느 정도 인코딩 오류나 표기상 중복 단어 등의 문제가 있지만, 많은 데이터를 손쉽게 다룰 수 있기에 이 데이터로 분석해보고자 한다. 

 

데이터의 구조는 '단어, 품사' 열로 구성되어있고, 데이터 중 '명사'만을 추출하여 분석하였다.

중복을 제외한 총 단어 수는 268,854였다. 이 단어들의 맨 앞 글자와 뒷 글자만 모아 빈도 수로 정렬해 보았다. 맨 앞 글자의 종류는 총 1897개, 뒷 글자의 종류는 총 1844개였다. 

다음은 이 글자들의 상위 5개, 하위 5개 데이터를 뽑아보았다. 

 

상위 5개

시작 글자 끝 글자
글자 개수 글자 개수
3104 9585
2947 7904
2661 6828
2628 3970
2532 3409

 

하위 5개

시작 글자 끝 글자
순위 개수 순위 개수
1 1
1 1
1 1
1 1
1 1

이론상 국어 사전 전체 명사들에 대한 단어 분포이니 보통 사람들의 두뇌 속 단어 사전이 이와 같은 분포를 따른다고 보면, 상대방은 끝 글자 빈도 수가 높은 단어를 뱉을 확률이 높다. 즉, "-기, -이, -리, -지, -자"로 끝나는 단어를 말할 확률이 높다. 따라서 이 단어들로 시작하고, 시작 글자의 빈도수가 적은(없으면 더 좋음), 즉, 상대방이 말하기 어려울 "맣, 겜, 촙, 쫍, 묗"으로 끝나는 단어를 말하면 이길 수 확률을 높일 수 있다. 

 

 

 

그러나 상대방도 이러한 전략을 고려하며, 실제 단어 사용 빈도 수는 또 사전에 기록된 빈도 수와는 다르기에 여러 가지가 복합된 양상이 나타날 것으로 생각된다. 

 

이 데이터를 토대로 앞서 살펴본 끝말잇기 게임 속 사용된 단어들에 대해 분석해볼 것이다.

먼저, 게임을 종결지은 단어들에 대해 살펴보자. 

 

국어학자 vs 화학자

종결 단어 끝 글자[각주:1] 빈도 수(순위) 시작 글자 빈도 수(순위)
산화칼 2347(10위) 륨(윰) x[각주:2]
트론 1945(15위) x

 

고수1 vs 화학자

종결 단어 끝 글자 빈도 수(순위) 시작 글자 빈도 수(순위)
2308(10위) 3(1358위)[각주:3])
518(146위) 2(1502위)

 

 

고수1 vs 고수2

종결 단어 끝 글자 빈도 수(순위) 시작 글자 빈도 수(순위)
치읓 1595(26위) x

 

한방단어는 역시 한방 단어의 끝 글자로 시작하는 단어가 존재하지 않거나 매우 적게 존재한다. 또 그 단어가 게임에서 등장하기 위해서는 상대방이 한방 단어의 시작글자로 끝나는 단어를 말해야 하기에 시작글자의 빈도수는 어느 정도 있는 편이다. 즉, '대그릇'과 같은 단어가 나오기 위해선, 상대방이 '~대'와 같은 단어를 해야하기에 끝글자 빈도 수가 높은 단어일 수록 한방 단어로 쓰일 가능성도 높은 것이다. 

 

이제 각 참가자들의 사용 단어의 끝 글자와 해당 글자로 시작하는 단어의 빈도 수를 비교해 보고자 한다. 

국어학자 화학자 고수1 고수2
시작 글자[각주:4] 빈도 수(순위) 시작 글자 빈도 수(순위) 시작 글자 빈도 수(순위) 시작 글자 빈도 수(순위)
12(959위) 12(959위) 88(501위) 142(414위)
2525(6위) 15(892위) 132(430위) 82(518위)
531(151위) 0 105(467위) 132(430위)
606(125위) 827(84위) 98(481위) 63(560위)
2154(9위) 305(255위) 408(205위) 19(823위)
679(108위) 266(288위) 름(늠) 22(786위) 98(481위)
    0 56(587위) 90(498위)
    2532(5위) 141(415위) 22(786위)
    282(273위) 90(498위) 141(415위)
        릇(늣) 3(1357위) 874(79위)
        0 529(152위)
        287(267위)    
        2(1502위)    

 

각 참가자들의 위 글자들의 평균 빈도 수를 계산해 보면 다음과 같다. 

참가자 국어학자 화학자 고수1 고수2
각 단어 끝 글자로 시작하는 단어의 평균 빈도 수 1084.5 471 110.15 199.27

 

고수들은 확실히 빈도 수가 낮음을 알 수 있다. 즉, 고수들은 끝말잇기 단어를 선택함에 있어 다른 사람들이 끝말을 잇지 못할 법한 단어들을 계속해서, 순발력 있게 말한다고 볼 수 있다.

 

  1. 이 단어가 게임에서 나오기 위해선 상대방이 이 단어의 시작글자로 끝나는 단어를 말해야 한다. 따라서 끝 글자를 따진다. [본문으로]
  2. 이 데이터에는 없지만 '윰라대왕'이라는 단어가 존재한다고 한다.(염라대왕의 방언) [본문으로]
  3. 높은 순위로 보이지만, 아래 순위일 수록 같은 빈도수일 경우 가나다 순으로 순위가 매겨져 순위보단 빈도수가 더 의미 있을 듯하다. [본문으로]
  4. 게임에선 끝 글자로 사용되었음 [본문으로]
728x90
반응형

댓글