Loading [MathJax]/jax/output/CommonHTML/jax.js
본문 바로가기
반응형

분류 전체보기102

이름 유사도 구하기 - soundex algorithm Soundex 알고리즘이란? 최근 소리를 기준으로 이름 사이의 유사도를 어떻게 구할 수 있을까 고민하던 중에 한 알고리즘을 발견하게 되었다. 제목에서도 알 수 있다시피 "soundex algorithm"이 바로 그것이다. 생각보다 복잡한 식이 요구되지 않고, 필자도 쉽게 구현할 수 있어서 구현해 보았고, 간단하면서도 재밌는 결과가 나왔다. 이 알고리즘의 목적은 영어 이름에서 철자가 다르지만 소리가 같은 이름들을 동등하게 또는 유사하게 취급하고자 하는 것이라고 한다. DB에서 검색할 때 자주 쓰이는 알고리즘이며, 여러 다른 나라에서 변이형이 존재하고, 또 metaphone, double metaphone 등의 발전된 알고리즘도 존재한다고 한다. (출처: 위키피디아) Soundex가 적용되기 좋은 예를 생각.. 2020. 8. 2.
[알고리즘] 백준. ATM #11399, 검문 #2981 단계적으로 풀기에서 그리디 알고리즘 파트의 문제인 "ATM"과 수학3 파트 문제인 "검문"을 풀어보았다. ATM 예를 들어 다음과 같이 사람들이 ATM 앞에서 업무를 처리하기 위해 줄을 섰다고 하자. 그리고 밑의 숫자는 각 사람들이 업무를 보는 데 걸리는 시간이다. 각 사람들이 자신의 업무를 마치는 데까지 걸리는 시간은 다음과 같다. 이를 단순화 시켜보면, "기다리는 시간+자신의 업무 시간"만큼의 시간이 걸린다. 문제에서 요구하는 것은 모든 사람이 자신의 업무를 마치는 데 걸리는 시간을 최소화 시키도록 사람들을 줄 세우고 싶은 것이고, 그렇게 줄을 섰을 때 마지막 사람이 자신의 업무를 마칠 때까지 걸린 시간을 구하고자 하는 것이다. 위에서 "기다리는 시간+자신의 업무 시간"을 살펴보면, 결국 우리가 줄일.. 2020. 6. 28.
[데이터베이스] RAID RAID(Redundant Array of Inexpensive Disks): 보조기억장치의 성능과 신뢰성을 향상시키기 위한 디스크 구성 방법이다. 성능 향상을 위해 디스크를 병렬적으로 구성하며, 조합 패턴에 따라 레벨 0, 1, 5로 구분되고 이 패턴들을 한 번 더 조합하여 10, 0+1 등으로 디스크를 구성할 수 있다. RAID 구성 별 특징 RAID level 0 Striping을 한다. 이는 여러 개의 디스크를 하나의 디스크처럼 동작하도록 한다는 것이다. 데이터를 디스크의 개수만큼 분할하여 저장하거나 불러온다. 예를 들어 File A를 5개의 disk에 분할하여 저장한다면, A1, A2, A3, A4, A5로 나뉘어져 5개의 disk에 저장될 것이다. 이 데이터를 읽어들.. 2020. 6. 17.
[언어학] 의미론. 10. formal semantics(형식 의미론) 이번 장에서는 형식 의미론, 그 중에서도 술어 논리에 대해 다룬다. 형식 의미론이라는 것은 논리값(참, 거짓)으로 문장의 의미를 나타내고자 하는 이론이다. 명제 논리(propositional logic) 표현의 한계 => 술어 논리의 필요성 의미론을 하기 위해서는 모두(전 세계 사람들이)가 이해 가능한 언어(metalanguage)로의 번역이 필요하다. 이를 가능케 해 주는 것이 바로 술어 논리이다. 명제 논리는 문장 자체의 의미가 정해졌을 때, 문장의 결합으로 생성되는 또 다른 문장의 의미를 추론할 수는 있지만, 문장 내 구성 요소들의 의미들까지는 설명하지 못한다. 이를 가능케 하고자 한 것이 바로 술어 논리(predicate logic)이다. 술어 논리 역시 명제 논리에서 쓰던 논리 기호들이 쓰인다... 2020. 6. 16.
[언어학] 의미론. 9. 의미 구성 요소(Meaning Components) 이번 챕터에서는 의미를 어떻게 연구할 것인가에 대한 몇몇 이론들을 다루고자 한다. Componential Analysis(성분 분석 이론): 단어의 뜻풀이에 대해 의미 자질들을 바탕으로 의미를 설명하고자 한다. 단어의 의미는 semantic component(semantic primitives, 원시소, 기본소)로 구성되어 있다고 본다. 1) 의미 구성 요소(semantic components)는 어휘의 관계의 특성을 잡아내는 데 효율적이다. 2) 의미 구성 요소를 알아내야지만 통사적, 형태론적 처리 과정에 대한 범위를 정확하게 묘사할 수 있다. 3) 의미 구성 요소가 우리 마음 속에 내재하는 심리적 구조를 이루고 있다. 예시) woman: [FEMALE] [ADULT] [HUMAN] man: [MALE.. 2020. 6. 15.
[데이터베이스] 함수적 종속성의 적용 함수적 종속성의 추론 규칙 주어진 함수적 종속성으로 추가적으로 성립하는 다른 함수적 종속성들을 추론할 수 있다. 암스트롱의 추론 규칙들 가장 기본이 되는 규칙이다. 이 규칙들을 바탕으로 다른 모든 추론 규칙들을 추론해 낼 수 있다. A1. 재귀성의 규칙 YX,XY. A2. 부가성의 규칙 XY,XZYZ. A3. 이행성의 규칙 XY,YZ,Z. 위의 규칙들을 다음 릴레이션을 통해 설명해 보고자 한다. A B C 1 1 ㄱ 1 2 ㄴ 1 2 ㄹ 2 1 ㄴ 1 2 ㄹ A1. 재귀성의 규칙은 어찌 보면 당연하다. AB(.. 2020. 6. 14.
반응형