통계(2)
-
[궁금사전] 기계학습과 선형 판별 분석(Linear Discriminant Analysis, LDA)
오늘은 선형 판별 분석(Linear Discriminant Analysis, LDA)을 간략히 생각해 보겠습니다. LDA는 통계, 패턴 인식, 기계 학습에서 객체 간의 차이점을 찾는 데 사용되는 방법입니다. 예측 변수 세트가 있고 응답 변수를 여러 클래스 중 하나로 분류하려고 할 때 자주 사용됩니다. 이제 LDA는 어떻게 작동할까요? 데이터에 대해 두 가지 가정을 합니다. 1. 각 예측 변수의 값은 정규 분포를 따릅니다. 즉, 특정 예측 변수에 대한 값의 분포를 시각화하기 위해 히스토그램을 만든 경우 대략 "종 모양"을 갖게 됩니다. 2. 각 예측 변수는 동일한 분산을 갖습니다. 이는 실제 데이터에서는 거의 발생하지 않으므로 일반적으로 LDA 모델을 실제로 피팅하기 전에 동일한 평균과 분산을 갖도록 각 ..
2023.12.31 -
[궁금사전] 승산비 (Odds ratio)
[과학체험] 현미경 체험 캠프 현미경 체험 캠프에 대해 공유하고자 한다. 이 캠프에서는 중고등학생을 대상으로 현미경의 작동 원리와 사용법을 배우고, 다양한 시료를 관찰하고 생각하는 시간을 갖게 된다 참가 신청서 링 nv2ngn.tistory.com Odds ratio: 두 사건 A와 B 사이의 연관 강도를 정량화하는 통계 Odds ratio(승산비): 승산비(OR)는 두 사건 A와 B 사이의 연관 강도를 정량화하는 통계다. 승산비는 B가 있을 때 A의 승산과 부재 시 A의 승산의 비율로 정의된다. 또는 동등하게(대칭으로 인해) A가 있을 때 B의 승산과 A가 없을 때 B의 승산의 비율이다. 두 사건은 OR이 1인 경우에만 독립적이다. 한 이벤트의 배당률은 다른 이벤트가 있든 없든 동일하다. OR이 1보다..
2023.01.27