지식/통계학
통계학 용어 정리 (영어 <-> 한국어)
Grara
2025. 5. 22. 23:38
event
sample space
mutually exclusive - disjoint
non mutually exclusive- joint - independence
product rule
complement rule
general product rule
Prior - Event - Posterior
Naive Assumption
확률 관련 용어 정리
Event (사건)
- 개념: 확률 실험에서 일어날 수 있는 특정 결과 또는 결과들의 집합을 의미
- 예시: 주사위를 던졌을 때 '짝수가 나오는 것', '5가 나오는 것', '앞면이 나오는 것' 등이 사건
Sample Space (표본 공간)
- 개념: 어떤 확률 실험에서 발생할 수 있는 모든 가능한 결과들의 집합
- 예시: 주사위를 한 번 던졌을 때 나올 수 있는 모든 눈금 {1, 2, 3, 4, 5, 6}이 표본 공간이 됨
Mutually Exclusive / Disjoint (상호 배타적 / 배반 사건)
- 개념: 두 개 이상의 사건이 동시에 일어날 수 없을 때 이 사건들을 상호 배타적이라고 함 (겹치는 부분이 없음)
- 예시: 주사위를 한 번 던졌을 때 '홀수가 나오는 사건'과 '짝수가 나오는 사건'은 동시에 일어날 수 없으므로 상호 배타적
상호 비배타적 (Non Mutually Exclusive)
- 개념: 두 개 이상의 사건이 동시에 일어날 수 있을 때를 의미
- 예시: 주사위를 던졌을 때 '짝수가 나오는 사건'과 '3보다 큰 수가 나오는 사건({4, 5, 6})'은 동시에 일어날 수 있음 (4, 6이 겹침).
결합 사건 (Joint Event)
- 개념: 두 개 이상의 사건이 모두 동시에 일어나는 사건을 의미
- 예시: '짝수가 나오면서 동시에 3보다 큰 수가 나오는 사건'은 {4, 6}이 됨
독립 (Independence)
- 개념: 두 사건이 서로 영향을 주지 않을 때를 의미. 한 사건이 일어나는 것이 다른 사건이 일어날 확률에 아무런 영향을 미치지 않음.
- 예시: 동전을 두 번 던졌을 때, 첫 번째 던진 결과가 두 번째 던진 결과에 아무런 영향을 주지 않는다면 두 사건은 독립.
확률 계산 규칙
Product Rule (곱셈 규칙)
- 개념: 두 독립적인 사건이 동시에 일어날 확률을 계산할 때 사용, 각 사건의 확률을 단순히 곱
- 수식: P(A and B)=P(A)×P(B) (A와 B가 독립일 때)
- 예시: 동전 앞면이 나올 확률(0.5)과 주사위 6이 나올 확률(1/6)은 서로 독립이므로, 둘 다 동시에 일어날 확률은 0.5×(1/6)=1/12
Complement Rule (여사건 규칙)
- 개념: 어떤 사건이 일어나지 않을 확률은 '1에서 그 사건이 일어날 확률을 뺀 것'과 같다는 규칙
- 수식: P(not A)=1−P(A) 또는 P(A^c)=1−P(A)
- 예시: 비가 올 확률이 0.3이라면, 비가 오지 않을 확률은 1−0.3=0.7
General Product Rule (일반 곱셈 규칙)
- 개념: 두 사건이 독립이 아닐 때(종속적일 때), 즉 한 사건이 다른 사건에 영향을 미칠 때, 두 사건이 동시에 일어날 확률을 계산하는 규칙. 조건부 확률을 사용.
- 수식: P(A and B)=P(A)×P(B∣A) (P(B∣A)는 A가 일어났을 때 B가 일어날 조건부 확률)
- 예시: 카드 52장 덱에서 (1) 에이스를 뽑고, (2) 다시 에이스를 뽑을 확률:
- 첫 번째 에이스를 뽑을 확률: 4/52
- 첫 번째 에이스를 뽑은 후, 두 번째 에이스를 뽑을 확률: 3/51 (카드 수가 줄어들었기 때문)
- 두 사건이 모두 일어날 확률: (4/52)×(3/51)
베이즈 정리 관련 용어
Prior (사전 확률)
- 개념: 새로운 증거를 얻기 전에 어떤 사건에 대해 우리가 이미 알고 있는, 혹은 가정하는 초기 확률.
- 예시: "어떤 질병에 걸릴 확률" (아무 정보 없이 일반적인 확률)
Event (사건 / 증거)
- 개념: 여기서는 우리가 새롭게 관찰하거나 얻게 되는 정보 또는 증거를 의미.
- 예시: "검사 결과 양성 판정을 받는 것"
Posterior (사후 확률)
- 개념: 새로운 증거(Event)가 주어진 후에 업데이트된, 즉 수정된 확률. 사전 확률에 증거의 영향을 반영하여 계산.
- 예시: "검사 결과 양성 판정을 받았을 때, 실제로 그 질병에 걸렸을 확률" (사전 확률보다 더 정확해진 확률)
Naive Assumption (나이브 가정)
- 개념: 베이즈 분류기(특히 나이브 베이즈 분류기)에서 사용되는 핵심 가정.
- 내용: "어떤 클래스(결과)가 주어졌을 때, 해당 클래스를 나타내는 모든 특징(증거)들은 서로 독립이다" 라고 가정하는 것.
- 예시: 스팸 메일 분류 시, "스팸"이라는 클래스가 주어졌을 때, '광고'라는 단어와 '무료'라는 단어가 나타나는 것은 서로 독립이라고 가정하는 것. 실제로는 독립이 아닐 가능성이 높지만, 이 가정을 통해 계산을 매우 단순화하여 효율적인 모델을 만들 수 있습니다. (그래서 '나이브', 즉 순진하다는 이름이 붙었습니다.)
- 모델의 복잡성을 대폭 줄여주고, 계산을 효율적으로 만들며, 데이터 부족 문제를 완화하여 실제 적용 가능성을 높이는 강력한 도구