반응형 t-테스트1 [논문 읽기] 언어 자료에 대한 통계 분석 오늘 정리할 논문은 언어의 통계적 분석 방법에 대한 내용들에 대해 정리해 놓은 논문입니다. 나온 지 조금 시간이 지난 논문이지만, 기초적인 통계와 주의해야할 사항들이 잘 정리되어 있다고 생각됩니다. 본문은 아래의 논문을 참고하여 작성하였습니다. 신효필. (2005). 언어 자료의 통계 분석과 관련된 몇 가지 고려사항들. 어학연구, 41(3), 655-682. 이항 분포 코퍼스 내에서 특정, 단어나 문장이 나타날 확률은 어떻게 계산할까요? 이산 확률 변수의 이항분포(Binomial Distribution)을 사용한다고 합니다. 여기서 p는 해당 단어가 등장할 확률을 나타내며, n은 전체 코퍼스 단어 수, m은 특정 단어가 등장할 횟수 라고 볼 수 있겠네요. p값은 추정치인 p̂를 사용한다고 합니다. 예를 .. 2021. 1. 27. 반응형 이전 1 다음