지식/통계학
-
몬티 홀 문제 이해하기(Monty Hall problem)지식/통계학 2025. 5. 26. 22:42
몬티 홀 문제(Monty Hall Problem)는 확률과 조건부 확률에 대한 우리의 직관이 얼마나 틀릴 수 있는지를 보여주는 유명한 퍼즐 문제이다. 더 자세한 내용은 해당 나무위키 페이지를 확인해도 좋을 듯 싶다. 상황 설정:당신은 TV 게임 쇼에 참가했습니다.앞에는 3개의 문이 있습니다.이 중 하나의 문 뒤에는 고급 자동차가 있고, 나머지 두 문 뒤에는 염소가 있습니다. 자동차를 골라야 합니다.사회자 몬티 홀은 자동차가 어느 문 뒤에 있는지 알고 있습니다.게임 진행:당신은 문 하나를 선택합니다. (예: 1번 문 선택)당신이 선택한 문을 열기 전에, 사회자 몬티 홀은 당신이 선택하지 않은 나머지 두 문 중에서 염소가 있는 문 하나를 열어줍니다. (사회자는 자동차가 있는 문은 절대 열지 않습니다.)이제 ..
-
통계학 용어 정리 (영어 <-> 한국어)지식/통계학 2025. 5. 22. 23:38
eventsample space mutually exclusive - disjointnon mutually exclusive- joint - independenceproduct rulecomplement rulegeneral product rulePrior - Event - PosteriorNaive Assumption 확률 관련 용어 정리 Event (사건) 개념: 확률 실험에서 일어날 수 있는 특정 결과 또는 결과들의 집합을 의미예시: 주사위를 던졌을 때 '짝수가 나오는 것', '5가 나오는 것', '앞면이 나오는 것' 등이 사건Sample Space (표본 공간)개념: 어떤 확률 실험에서 발생할 수 있는 모든 가능한 결과들의 집합예시: 주사위를 한 번 던졌을 때 나올 수 있는 모든 눈금 {1, 2,..
-
통계적으로 최적의 소개팅 횟수 생각해보기 (비서 문제)지식/통계학 2025. 5. 3. 20:51
비서 문제(Secretary Problem)는 알려진 수의 대상들 중에서 가장 뛰어난 대상을 순차적으로 선택할 때 성공 확률을 최대화하는 최적 정지(Optimal Stopping) 문제의 고전적인 사례이다. 이 문제는 다양한 현실의 순차적 의사결정 상황에 적용될 수 있다. 1. 비서 문제의 정의비서 문제는 다음과 같은 조건을 갖는다.n명의 후보자가 존재하며, n 값은 사전에 알려져 있다.후보자들은 무작위 순서로 한 명씩 순차적으로 등장한다.각 후보자가 등장할 때마다 그 자리에서 즉시 '선택(채용)'하거나 '거절'해야 한다.한 번 거절된 후보자는 다시 선택할 수 없다.현재 등장한 후보자에 대해 알 수 있는 정보는 현재까지 등장한 후보자들 중 그의 상대적인 순위뿐이다. 전체 n명 중 그의 절대적인 순위는 알..
-
대수의 법칙 (큰 수의 법칙) - 정의와 원리, 실제 사례지식/통계학 2025. 4. 18. 22:21
1. 정의대수의 법칙(Law of Large Numbers)은 통계학 및 확률론의 기본적인 정리 중 하나이다. 동일하고 독립적인 확률 실험을 반복할 때, 시행 횟수가 충분히 커지면 그 결과들의 산술 평균은 해당 실험의 기댓값(이론적 평균)에 가까워진다는 것을 수학적으로 기술한다.2. 핵심 원리반복 시행: 동일한 조건 하에서 독립적으로 시행(trial)을 반복한다.표본 평균: 각 시행에서 얻어진 결과값들의 산술 평균을 계산한다.기댓값으로의 수렴: 시행 횟수(표본 크기)가 증가함에 따라, 이 표본 평균은 해당 확률 변수의 기댓값으로 확률적으로 수렴한다. 즉, 시행 횟수가 많아질수록 표본 평균과 기댓값의 차이가 0에 가까워질 확률이 높아진다.예를 들어, 잘 구성된 동전을 던지는 시행에서 앞면(H=1) 또는 뒷..
-
통계의 오해: 주사위 6번을 던지면 한번은 1이 나온다.지식/통계학 2025. 4. 15. 00:18
우리는 확률을 계산할 때, 장기적인 결과를 단기적인 결과에도 적용해버리는 실수를 하곤 한다. 예를들어, 주사위를 굴렸을 때, 1이 나올 확률은 1/6이라고는 하지만, 이 확률은 장기적인 경향성을 나타내는 것이다. 1000번을 던진다면 한 167번 정도는 1이 나오더라라는 것이다. 그렇다면 만약 6번을 던진다고할 때 1은 무조건 한번은 나오나? 대답은 "아니오"다. 즉, 주사위를 6번 던져서 1이 나올 확률이 1/6이라고 해서 반드시 한 번 나와야 한다고 믿는 것은 확률에 대한 오해이다. * 도박사의 오류: 과거의 사건들이 미래의 독립적인 사건에 영향을 미친다고 믿는 오류 주사위를 매번 새롭게 굴리는 것은 독립 시행이다. 즉, 과거의 사건이 미래의 사건에 영향을 주지 않고, 매 순간마다 1이 나올 확률 1..
-
평균을 구하는 다양한 방법 (산술평균, 기하평균, 조화평균, 제곱 평균, 가중 평균)지식/통계학 2025. 3. 16. 21:08
1. 산술 평균 (Arithmetic Mean) 가장 일반적으로 사용되는 평균입니다. 모든 값을 더한 후 값의 개수로 나눕니다. 수식: 평균 = (값1 + 값2 + ... + 값n) / n 예시: 1, 2, 3, 4, 5의 평균 = (1 + 2 + 3 + 4 + 5) / 5 = 3 $$ \frac{x_1 + x_2 + \cdots + x_n}{n} $$ 2. 기하 평균 (Geometric Mean) 비율이나 성장을 나타내는 데이터를 다룰 때 유용합니다. 모든 값을 곱한 후 값의 개수에 해당하는 제곱근을 구합니다. 수식: 평균 = (값1 * 값2 * ... * 값n)^(1/n) 예시: 2, 8의 기하 평균 = (2 * 8)^(1/2) = 4 $$ \sqrt[n]{x_1 \times x_2 \times \..