[궁금사전] 머신러닝과 F1 점수(F1 score) 의미와 계산

2025. 5. 22. 21:55카테고리 없음

728x90
반응형

 

출처: pixabay

 

 

 

안녕하세요?

 

NV2NGN입니다.

 

요즘 AI와 함께 빅데이터가 부상하고 있습니다.

바이오 분야 역시 많은 데이터를 다루는 만큼 빅데이터 분석과 밀접한데요.

 

바이오 분야에서 빅데이터 분석은 질병 예측, 신약 개발, 맞춤형 치료 등 정밀의료의 핵심 기술로 부상하고 있습니다. 

유전체, 전사체, 단백질체 등에서 생성되는 방대한 데이터를 분석하면 질병의 원인을 정밀하게 규명하고, 환자 맞춤형 치료 전략을 세울 수 있습니다. 

 

예를 들어, 암 환자의 유전체 데이터를 분석해 특정 유전자 돌연변이를 타깃으로 하는 약물을 설계하는 것이 가능해졌습니다. 

 

향후 인공지능과의 융합으로 진단의 정확도는 높아지고, 치료 시간과 비용은 크게 절감될 전망입니다.

 

 

 

 

빅데이터 분석 특히 머신러닝(Machine Learning)에서 사용되는 F1 score에 대해 살펴보겠습니다.

 

먼저, 

머신러닝이란 (Machine Learning)?

머신러닝(Machine Learning)은 사람의 명시적인 프로그래밍 없이도 데이터를 통해 컴퓨터가 스스로 학습하고 예측하거나 판단할 수 있도록 만드는 기술입니다. 쉽게 말해, 데이터를 보고 패턴을 익히는 컴퓨터 학습 방법이라 하겠습니다.

 

(1) 지도학습(Supervised Learning): 입력과 정답(라벨)을 같이 학습

예: 질병 예측(입력: 유전자 데이터, 출력: 질병 유무)

(2) 비지도학습(Unsupervised Learning): 정답 없이 데이터만으로 패턴이나 군집 발견

예) 유사한 환자군 클러스터링

(3) 강화학습(Reinforcement Learning): 보상과 벌을 통해 학습

예) 로봇이 장애물을 피하며 걷기 학습

 


F1 score는 정밀도(Precision)와 재현율(Recall)의 조화 평균으로,  분류 문제에서 모델의 성능을 종합적으로 평가하는 지표입니다.

정밀도: 예측한 양성 중 실제 양성 비율
재현율: 실제 양성 중 예측이 양성인 비율

F1 score = 2 × (Precision × Recall) / (Precision + Recall)

빅데이터 분석에서 데이터가 불균형(예: 질병 환자 비율이 극소수)한 경우, 단순한 정확도보다 F1 score가 모델의 성능을 더 정확히 반영합니다. 특히 바이오 분야처럼 false negative(질병 놓침)가 치명적인 상황에서 F1 score는 중요한 성능 지표로 사용됩니다.

 

F1 스코어는 0과 1 사이의 값을 가지며, 1에 가까울수록 모델의 성능이 좋음을 의미합니다.

F1 스코어는 정밀도와 재현율 간의 균형을 고려하기 때문에, 둘 중 하나가 낮을 경우 F1 스코어도 낮아집니다.

이는 모델이 양성 예측을 얼마나 잘하는지와 실제 양성을 얼마나 잘 찾아내는지를 동시에 고려하는 지표입니다.

 

F1 score는 머신러닝에서 매우 널리 사용되는 성능 평가 지표입니다.

특히 분류 문제(classification)에서 모델이 얼마나 잘 작동하는지를 측정할 때 사용됩니다.

# F1 score가 사용되는 대표적 상황

1) 이진 분류(Binary classification): 예를 들어, 환자가 암인지 아닌지를 분류할 때
2) 다중 분류(Multi-class classification): 여러 질병 중 하나를 예측하는 경우에도 클래스별로 F1 score를 계산할 수 있습니다.

불균형 데이터셋: 예를 들어, 전체 데이터의 1%만이 양성(positive) 클래스일 때, 단순한 정확도는 의미가 없어지고 F1 score가 더 중요해집니다.

# F1 score가 중요한 이유
정밀도(precision)가 높더라도 재현율(recall)이 낮으면 실제 중요한 양성을 놓칠 수 있고, 반대로 재현율만 높고 정밀도가 낮으면 너무 많은 false positive가 발생합니다. F1 score는 이 두 가지를 균형 있게 고려하기 때문에, 의료 진단, 사기 탐지, 이상 탐지 등에서 신뢰성 있는 성능 평가 지표로 사용됩니다.

요약하면, F1 score는 머신러닝 분류 모델의 성능을 평가하기 위해 사용되는 핵심 지표 중 하나입니다.

 

관련 논문을 살펴보겠습니다.

 

 

 

Machine learning for genetics-based classification and treatment response prediction in cancer of unknown primary - PubMed

Cancer of unknown primary (CUP) is a type of cancer that cannot be traced back to its primary site and accounts for 3-5% of all cancers. Established targeted therapies are lacking for CUP, leading to generally poor outcomes. We developed OncoNPC, a machine

pubmed.ncbi.nlm.nih.gov

 

 

Nat Med. 2023 Aug;29(8):2057-2067. doi: 10.1038/s41591-023-02482-6. Epub 2023 Aug 7.
원발 부위 미상의 암에 대한 유전학 기반 분류 및 치료 반응 예측을 위한 머신 러닝(Machine learning for genetics-based classification and treatment response prediction in cancer of unknown primary).

 

원발성 미상의 암(Cancer of unknown primary, CUP)은 원발 부위까지 추적할 수 없는 암 유형으로, 전체 암의 3-5%를 차지합니다. CUP에 대한 확립된 표적 치료법이 부족하여 일반적으로 예후가 좋지 않습니다. 연구진은 3개 기관의 22가지 암 유형에 걸쳐 36,445개 종양의 표적 차세대 시퀀싱(next-generation sequencing, NGS) 데이터로 훈련된 머신 러닝 분류기인 OncoNPC를 개발했습니다.

 

종양학 NGS 기반 원발성 암 유형 분류기(OncoNPC)는 보류된 종양 샘플에서 높은 신뢰도 예측에 대해 가중 F1 점수 0.942를 달성했으며, 이는 모든 보류된 샘플의 65.2%를 차지했습니다. Dana-Farber Cancer Institute에서 수집한 971개 CUP 종양에 적용했을 때 OncoNPC는 종양의 41.2%에서 높은 신뢰도로 원발성 암 유형을 예측했습니다. 

 

OncoNPC는 또한 예측된 암 유형에 대해 다유전자 생식세포계열 위험이 유의하게 높고 생존 결과가 유의하게 다른 CUP 하위군을 확인했습니다. 특히, OncoNPC에서 예측한 암 유형과 일치하는 1차 완화의도 치료를 받은 CUP 환자의 예후가 유의하게 더 좋았습니다(위험비(hazard ratio, HR) = 0.348; 95% 신뢰구간(CI) = 0.210-0.570; P = [수식: 본문 참조]). 더 나아가, OncoNPC는 유전체 유도 치료를 받을 수 있었던 CUP 환자 수를 2.2배 증가시켰습니다. 따라서 OncoNPC는 뚜렷한 CUP 하위군에 대한 증거를 제공하고, CUP 환자 관리를 위한 임상적 의사결정 지원의 가능성을 제시합니다.

 

 

이번 글에서는 머신러닝과 F1 점수에 대해 살펴보았습니다.

 

읽어 주셔서 감사합니다.

 

 

 

 

반응형