서론
빅데이터나 머신러닝 등 데이터를 분석할 때 사용되는 이론이나 프로그램 함수들은 많은 수가 확률에 기반하고 있다.
확률을 공부함으로써 단순히 분석 프로그램을 돌리고 결과를 받아보는 것보다 깊은 통찰력을 얻을 수 있을 것이다.
목표
확률이란 무엇인가?
확률을 어떻게 계산하는가?
정의
확률은 크게 고전적 정의와, 공리적 정의로 나뉜다.
고전적 정의(수학적 정의)는 일상생활에서 흔히 쓰이는 개념으로 전체사건과 발생사건의 비율로 계산한다.
공리적 정의는 고전적 정의의 숨은 전제인 모든 사건의 발생 가능성이 같다는 가정에 의문을 제시하여 나온 정의이다.
공리적 정의는 3가지 명제로 정의되는데, 간단히 요약하면
1) 확률은 0에서 1 사이의 값이다.
2) 전체 표본공간의 확률은 1이다.
3) 표본공간 내의 각각의 사건들의 확률을 다 더하면 1이된다.
예시
예를 들면, 주사위를 던져서 1부터 6까지의 숫자 중 한가지가 나올 확률은 고전적 정의에선 1/6이다.
공리적 정의에서도 모든 사건의 발생 가능성이 같기 때문에 1/6으로 동일하다.
하지만 현실세계의 문제는 사건의 발생 가능성이 다른 경우가 훨씬 많다.
포장된 과자를 샀을 때, 안에 들어있는 과자의 수의 확률같은 경우
과자의 개수가 100개에서 150개 사이라고 할때, 구매한 과자의 수가 125개일 확률과 150개일 확률이 같을까?
자동화된 공장에서 정해진 공정에 따라 포장되는 과자의 수는 평균값에 가까울 확률이 크고, 많이 들었거나 적게 들은 경우는 평균값의 확률보다 더 낮을 것이다.
정리
확률은 모든 사건의 발생가능성이 같은경우 부분/전체로 구하거나 다른경우 각각의 확률을 측정해서 계산한다.
용어
표본공간 : 통계적 실험의 모든 가능한 결과의 집합
사건 : 표본공간의 부분집합
고전적 확률 : 사건의 원소수를 표본공간의 원소수로 나누어서 구한 확률
공리적 확률 : 고전적 확률을 일반화시킨 확률
출처
위키백과, https://ko.wikipedia.org/
위키백과, 우리 모두의 백과사전
위키백과:대문 위키백과, 우리 모두의 백과사전. 위키백과 우리 모두가 만들어가는 자유 백과사전문서 555,093개와 최근 기여자 2,121명 사랑방 다른 분들과 의견을 교환해봐요! 질문방 지침으로
ko.wikipedia.org
이긍희,박진호,확률의 개념과 응용(KNOUPRESS)
'통계학 > 확률론' 카테고리의 다른 글
[5분확률] 확률변수와 확률분포 (0) | 2022.06.12 |
---|---|
[5분확률]베이즈 정리 (0) | 2021.10.25 |
[5분확률]조건부확률 (0) | 2021.10.15 |