ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [2022/04/06][짤막한 이야기 - 정확도]
    짤막한 이야기 2022. 4. 6. 18:20
    728x90
    반응형

    [2022/04/06][짤막한 이야기 - 정확도]

    “정확도(Accuracy)”는 인공지능 혹은 분류 분야에서 주로 사용되는 용어이다.
    분류 수행 결과의 정확도를 의미하는 지표로써 가장 간단하게 계산할 수 있는 지표 중 하나이기 때문에 많이 활용된다.
    “이진 분류(Binary Classification)”에서 분류 결과는 양성(True Positive, 이하 TP)과 음성(True Negative, 이하 TN)이 나올 수 있다.
    그런데 이 결과가 진짜 맞을수도 있고 분류기가 잘못 분류한 것일 수도 있다.
    양성이라고 했지만 사실 실제로는 음성(위양성, False Positive, 이하 FP)일수도 있으며, 음성이라고 했지만 사실 실제로는 양성(위음성, False Negative, 이하 FN)일수도 있는 것이다.
    이진 분류의 결과는 TP, TN, FP, FN 중 하나이며, 이 4개의 지표를 모두 더하면 분류 대상 파일 전체의 수와 같다.
    Accuracy = (TP + TN) / (TP + TN + FP + FN)으로 계산할 수 있으며, (전체 파일 수)에서 (옳게 분류한 수)의 비율을 계산하는 것이다.
    이진 분류의 경우 양성과 음성을 판단하는 기준을 점수계산이라고 하는데, 점수는 0에서 1 사이의 실수값이다.
    기본적으로는 0.5점을 초과하면 1(양성)로, 0.5점 이하이면 0(음성)으로 판단한다.
    그런데 이 기준점수(임계치라고 함, Threshold)인 0.5는 사용자가, 혹은 분류기가 임의로 설정할 수 있는 값이다.
    이 임계치를 0.1로 설정한 경우는 이 분류기에서 음성으로 나올 확률이 매우 낮아진다.
    반대로 이 임계치를 0.9로 설정한 경우에는 이 분류기에서 음성이 매우 많이 나올 것이다.
    Accuracy의 경우 이 기준점수를 어떻게 설정하느냐에 따라 매우 달라지게 될 것이다.
    특히 Accuracy의 값을 최대로 높여줄 수 있는 최적의 임계치를 Max Accuracy Threshold라고 한다.
    이는 f(x) = (Threshold, Accuracy)로 매우 많은 Threshold 설정이 필요하다.
    [관련된 짤막한 이야기 - 악성코드 탐지[2022/04/04]]
    #이야기 #루니프 #핀 #핀툴 #오탐 #미탐 #False #True #Negative #Positive #Accuracy #프로그래머 #해커 #개발자 #분석가 #코딩 #인공지능

    728x90
    반응형
Designed by Tistory.