-
[2022/04/08][짤막한 이야기 - AUC]짤막한 이야기 2022. 4. 8. 09:56728x90반응형
[2022/04/08][짤막한 이야기 - AUC]
“AUC(Area Under ROC Curve)”는 ROC 그래프의 밑넓이를 의미한다. 이 또한 인공지능 및 분류 분야에서 중요하게 여겨지는 지표 중 하나이다.
“ROC(Receiver Operating Characteristic)”는 “FPR(False Positive Ratio, 위양성율)”를 X축으로, “TPR(True Positive Ratio, 양성율)”를 Y축으로 만들어지는 그래프이다.
ROC 그래프로 생성되는 곡선(혹은 직선)에 대하여 해당 선의 아래의 면적을 구하는 것이 AUC의 기본 정의이며, TPR이 Y축이고 FPR이 X축이기 때문에 그래프가 “┌” 모양에 가까울 수록 넓이가 1에 가까워지며, 이 분류기의 분류 성능이 좋다고 할 수 있다.
그림에서의 “Perfect Classifier”가 그 경우에 해당하며, TPR이 1, FPR이 0에 가까울수록 AUC는 1에 가까워져 성능이 좋다고 할 수 있는 것이다.
반대로 가장 안좋은 분류기는 어떠한 경우에서 양성과 음성을 판단할 확률이 완전히 랜덤할 때를 의미한다.
양성과 음성 판단 확률이 랜덤한 경우를 “Random Classifier”라고 할 수 있으며, 이 경우는 분류기로써의 기능을 전혀 하지 못한다.
ROC 그래프에서는 빨간 점선(대각선으로 쭉 올라가는)이 이 경우에 해당하며, 따라서 가장 성능이 안좋은 분류기는 AUC가 0.5에 가까워진다.
ROC 그래프의 밑넓이를 구하는 것은 여러 방법이 있을 수 있지만, 파이썬에서는 API를 제공하여 그 값을 쉽게 구할 수 있기 때문에 문제가 되지 않는다.
AUC를 높여 분류기의 성능을 높이기 위해서는 하이퍼파라미터를 미세하게 조정하거나 학습(Train)에 활용되는 데이터셋의 크기를 늘려 분류 모델이 더욱 효과적으로 동작할 수 있도록 만드는 것이 있다.
[관련된 짤막한 이야기 - 정확도[2022/04/06]]
#이야기 #루니프 #핀 #핀툴 #오탐 #미탐 #False #True #Negative #Positive #Accuracy #ROC #AUC #프로그래머 #해커 #개발자 #분석가 #코딩 #인공지능728x90반응형'짤막한 이야기' 카테고리의 다른 글
[2022/04/13][짤막한 이야기 - F1-Score] (0) 2022.04.13 [2022/04/12][짤막한 이야기 - 정밀도 & 재현율] (0) 2022.04.12 [2022/04/06][짤막한 이야기 - 정확도] (0) 2022.04.06 [2022/04/05][짤막한 이야기 - 오탐 & 미탐] (0) 2022.04.05 [2022/04/04][짤막한 이야기 - 악성코드 탐지] (0) 2022.04.04