본문 바로가기
반응형

분류 전체보기101

[논문 읽기] 한국어 한자어의 문법적 특징 및 양상 한국어 화자로서 실생활에서 많은 한자어를 쓰지만, 다양한 표현들이 많다. 이번에 소개할 논문은 이 한자어들에 대하여 문법적인 특징을 규명하고자 한 논문이다. 분석에 사용된 데이터는 아래 국립 국어원에 올라온 데이터를 사용하였으며, 이 중 일부를 추려내었다고 한다. 전체 5965개의 어휘 중 동형동의어, 숫자, 고유명사, 의존 명사 등을 제외한 1724개의 한자어에 대해 분석이 이뤄졌다. 해당 데이터는 아래 링크에서 내려받을 수 있다. (▼한국어 학습용 어휘 목록) www.korean.go.kr/front/etcData/etcDataView.do?mn_id=46&etc_seq=71 국립국어원 축소 확대 기타 자료 상세보기 한국어 학습용 어휘 목록(엑셀 파일) 담당부서 한국어진흥과 등록일 2003. 6. 4.. 2021. 1. 15.
[논문 리뷰] 포르투갈어의 유머 인식을 위한 코퍼스 및 기준 LREC 2020에 올라온 논문 리뷰입니다. 리뷰할 논문의 제목은 다음과 같습니다. Corpora and Baselines for Humour Recognition in Portuguese - Hugo Gonçalo Oliveira, André Clemêncio, Ana Alves 교내 학회에서 1주일에 한 편씩 논문 리뷰를 진행하기로 했는데, 제목이 매우 매력적이어서 리뷰 대상으로 선정했다. 최근에 유머 관련 글도 쓰면서 유머를 어떻게 분석해야 할까에 대한 고민이 있었는데, 이 논문을 보니 꽤 재밌게 풀어낸 것 같다. I. 서론, 코퍼스 구축 이 논문의 연구 대상은 제목에서도 알 수 있다시피 포르투갈어의 유머 인식이다. 이를 위해 코퍼스를 구축하고 모델 생성 및 성능을 평가하였다. 이를 통해 향후 포어.. 2021. 1. 6.
블랙 서바이벌 영원회귀 리뷰글 분석(EDA) (feat. 도배글 처리) 최근 인기를 끌고 있는 게임 블랙 서바이벌 영원회귀의 steam 리뷰글에 대한 분석을 해보고자 한다. 전에 했던 보겸 유튜브 제목 EDA와 비슷한 방식으로 진행해보고자 한다. 실제 코드들은 아래 아래 글에서 확인해 볼 수 있다. skyjwoo.tistory.com/entry/%EC%9E%90%EC%97%B0%EC%96%B4-%EC%B2%98%EB%A6%AC-EDAExploratory-Data-Analysis 자연어 처리 EDA(Exploratory Data Analysis) EDA란? Exploratory Data Analysis의 약자로 데이터의 실질적인 분석 및 데이터를 활용한 작업 이전에 데이터의 분포 등 대략적인 정보를 파악하기 위한 작업. 이름에서도 알 수 있듯이 데이터를 탐색하 skyjwoo... 2021. 1. 4.
자연어 처리 EDA(Exploratory Data Analysis) EDA란? Exploratory Data Analysis의 약자로 데이터의 실질적인 분석 및 데이터를 활용한 작업 이전에 데이터의 분포 등 대략적인 정보를 파악하기 위한 작업. 이름에서도 알 수 있듯이 데이터를 탐색하는 과정이라 볼 수 있다. 주로 시각화와 함께 이뤄진다. 자연어 처리에서의 EDA 일반적인 수치 데이터에 대한 EDA가 가장 쉽게 찾아볼 수 있지만, 자연어 처리에 대한 EDA는 떠올리기 힘들었다. 따라서 이번 글에서는 자연어 처리에서의 EDA에 대해 직접 수행해본 결과를 공유해 보고자 한다. 주로 문자열의 길이 통계나품사, 토큰 등의 단위로 구분한 후 이에 대한 통계가 이용되는 듯하다. 본문은 다음 자료를 참고하였다. 영문 데이터에 대한 EDA에 대한 내용이어서 한국어 자연어처리에 맞게 몇.. 2020. 12. 17.
python pandas 기본 정리 항상 찾아서만 쓰다가 정리해 놓을 필요성이 느껴져서 자주 쓰는 함수들을 정리해 보았다. 1. DataFrame 만들기 1) tuple로 구성된 list를 이용해서 만들기 # DataFrame 만들기 ## tuple들의 list를 이용해서 만들기 goal_rank = [(1, '도미닉 칼버트-르윈', 11, '애버튼'), \ (2, '손흥민', 10, '토트넘'), \ (3, '모하메드 살라', 9, '리버풀' ), \ (3, '제이미 바디', 9, '레스터시티'), \ (5, '패트릭 뱀포드', 8, '리즈 유나이티드'), \ (5, '해리 케인', 8, '토트넘')] df1 = pd.DataFrame(goal_rank, columns = ['순위', '이름', '득점 수','소속팀']) df1.head.. 2020. 12. 11.
pyinstaller FileNotFoundError: [Errno 2] No such file or directory: [16716] Failed to execute script 오류 pyinstaller로 .py 파일을 .exe로 빌드하려다 오류가 발생했다. 제목에도 나와있는 것처럼 위와 같은 문제가 발생했을 때 어떻게 해결했는 지 공유하고자 한다. 간단히 .spec 파일을 수정해주고, .spec 파일로 빌드해주면 된다. 처음에 pyinstaller 파일이름.py 로 빌드를 하면 .spec 파일이 생성될 것이다. 이 .spec파일을 문서 편집기 등으로 열면 다음과 같은 코드가 나오는데(일부만 뽑았다.) 이 중 datas 부분에 빌드 과정에서 빠진 파일과 코드에서 요구하는 폴더 구조를 넣어주면 된다. a = Analysis(['ui.py'], pathex=['C:\\Users\\YJW2\\Documents\\NLP\\poetry_rhymer'], binaries=[], datas=[].. 2020. 12. 6.
반응형