ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 대수의 법칙 (큰 수의 법칙) - 정의와 원리, 실제 사례
    지식/통계학 2025. 4. 18. 22:21

    1. 정의

    대수의 법칙(Law of Large Numbers)은 통계학 및 확률론의 기본적인 정리 중 하나이다. 동일하고 독립적인 확률 실험을 반복할 때, 시행 횟수가 충분히 커지면 그 결과들의 산술 평균은 해당 실험의 기댓값(이론적 평균)에 가까워진다는 것을 수학적으로 기술한다.

    2. 핵심 원리

    • 반복 시행: 동일한 조건 하에서 독립적으로 시행(trial)을 반복한다.
    • 표본 평균: 각 시행에서 얻어진 결과값들의 산술 평균을 계산한다.
    • 기댓값으로의 수렴: 시행 횟수(표본 크기)가 증가함에 따라, 이 표본 평균은 해당 확률 변수의 기댓값으로 확률적으로 수렴한다. 즉, 시행 횟수가 많아질수록 표본 평균과 기댓값의 차이가 0에 가까워질 확률이 높아진다.

    예를 들어, 잘 구성된 동전을 던지는 시행에서 앞면(H=1) 또는 뒷면(T=0)이 나올 확률은 각각 0.5이다. 이 시행의 기댓값은 0.5이다. 시행 횟수가 적을 때는 앞면이 나온 비율(표본 평균)이 0.5와 크게 다를 수 있다. 그러나 시행 횟수를 N번으로 늘릴수록, 표본 평균은 N이 커짐에 따라 0.5로 수렴한다.

    3. 실제 적용 사례

    대수의 법칙은 이론적인 개념을 넘어 다양한 실제 분야에서 중요한 원리로 적용된다.

    보험 산업: 보험사는 다수의 가입자 데이터를 기반으로 사고 발생 확률, 평균 손해액 등 위험률을 추정한다. 가입자 수가 많을수록(시행 횟수 증가), 실제 발생하는 총 보험금 지급액은 대수의 법칙에 따라 예측된 기댓값에 가까워진다. 이는 보험사가 안정적으로 위험을 관리하고 적정 보험료를 산정하는 근거가 된다.


    카지노 및 게임 산업: 카지노 게임은 일반적으로 카지노 측에 약간의 확률적 우위(하우스 엣지)를 가지도록 설계된다. 개별 게임의 결과는 무작위적이지만, 장기간에 걸쳐 수많은 게임이 반복 시행되면 대수의 법칙에 따라 카지노의 실제 수익률은 이론적인 기댓값(하우스 엣지에 따른 수익률)으로 수렴한다.


    여론조사 및 통계 조사: 모집단의 특성(예: 특정 정책 지지율)을 파악하기 위해 표본 조사를 실시한다. 대수의 법칙에 따라 표본의 크기가 클수록 표본에서 얻어진 통계량(예: 표본 지지율)은 모집단의 실제 모수(실제 지지율)에 더 가깝게 추정될 확률이 높아진다. 따라서 조사의 신뢰도를 높이기 위해 충분한 크기의 표본이 요구된다.


    제조업 품질 관리: 생산 공정에서 전체 제품의 불량률을 추정하기 위해 표본 검사를 수행한다. 검사하는 표본의 크기가 클수록, 표본 불량률은 대수의 법칙에 따라 실제 전체 제품의 불량률(모 불량률)에 더 정확하게 근접한다.

    4. 대수의 법칙을 방해하는 요인

    대수의 법칙의 기본 전제는 독립시행과 동일한 확률 분포이다. 이 두가지가 검증되지 않거나 이 두 가지 전제가 오염된다면 결과는 다르게 나타난다. 대표적인 예로 보험업계의 역선택이 있다. 대수의 법칙이 보험에서 효과적으로 작동하려면, 보험 가입자 그룹(표본 집단)이 보험사가 예상하는 위험 수준을 가진 전체 잠재적 가입자 그룹(모집단)을 잘 대표해야 한다. 즉, 가입자들의 위험 수준이 비교적 무작위적으로 분포되어 있어야 평균 위험률(기대 손실률)을 정확하게 예측하고 이를 기반으로 보험료를 산정할 수 있다.

    하지만 역선택이 있다면 이야기가 달라진다. 가입자는 자신의 건강 상태나 위험 수준에 대해 보험사보다 더 잘 알고 있다(정보 비대칭). 따라서 보험의 경우 그 보험이 보장하는 고위험군이 더 가입하고자 하는 유인이 있다. 반대로 저위험군은 가입하고자 하는 요인은 적어진다. 결과적으로, 역선택이 발생하면 보험 가입자 풀(pool)은 전체 인구 집단의 평균 위험보다 높은 위험을 가진 사람들로 편중될 가능성이 커져버린다.

     

    보험사는 일반적인 인구 집단의 평균 위험률을 기반으로 보험료를 산정했지만, 실제 가입자들은 그보다 높은 위험을 가진 사람들이 많으므로, 실제 발생하는 보험금 지급액(실제 손실률)이 보험사가 예측했던 기대 손실률보다 높아지게 되고, 대수의 법칙 자체는 여전히 동작하겠지만, 가입자 수가 많아지면 실제 손실률은 가입한 고위험군 위주 집단의 실제 평균 위험률로 수렴하게 될 것이다. 하지만 이 수렴값이 보험사가 처음에 예상했던 전체 인구의 평균 위험률과는 다르기 때문에, 보험사가 대수의 법칙을 적용하여 안정적인 운영을 하려는 예측과는 달리 분포가 변하며 다른 결과를 초래한다. 

    5. 시사점

    대수의 법칙은 단일 사건이나 단기적 결과를 예측하는 것이 아니라, 많은 시행이 이루어졌을 때 나타나는 장기적인 평균적 경향성을 설명한다. 반복적인 무작위 사건에서 개별 결과는 변동성이 크지만, 전체 결과의 평균은 시행 횟수가 증가함에 따라 특정 값(기댓값)으로 수렴하여 안정성을 보인다. 대수의 법칙은 각 시행이 독립적이라는 가정 하에 성립한다. 이전 결과가 다음 시행의 확률에 영향을 미치지 않으며, 이는 '도박사의 오류'(Gambler's Fallacy)와 명확히 구분된다.

    6. 요약

    대수의 법칙은 무작위적으로 보이는 현상 속에서 장기적인 규칙성과 예측 가능성을 제공하는 확률론의 핵심 원리이다. 이는 많은 시행 횟수를 통해 개별 사건의 불확실성을 극복하고 평균적인 결과를 안정적으로 예측할 수 있게 하며, 보험, 금융, 통계 조사, 품질 관리 등 다양한 분야에서 시스템의 안정성을 확보하고 합리적인 의사결정을 내리는 이론적 기반을 제공한다.

Designed by Tistory.