분류 전체보기
-
[2022/04/12][짤막한 이야기 - 정밀도 & 재현율]짤막한 이야기 2022. 4. 12. 16:59
[2022/04/12][짤막한 이야기 - 정밀도 & 재현율] “정밀도(Precision)”와 “재현율(Recall)”은 인공지능 및 분류 분야에서 사용되는 지표 중 하나이다. 정밀도는 “정확도(Accuracy)”와는 다른 개념으로 분류기가 양성(Positive)이라고 분류한 것 중에서 실제 양성인 것의 비율을 의미한다. 분류기가 양성이라고 분류하는 경우는 “실제로 양성인데 양성으로 분류(TP)”하는 경우와 “실제로는 음성인데 양성으로 분류(FP)”하는 경우의 두 가지 뿐이다. 즉, Precision = TP / (TP + FP)의 수식이 성립한다. 반면 재현율이란 실제로 양성인 것 중에서 분류기가 양성으로 분류한 것의 비율을 의미한다. 실제로 양성인 경우의 수는 “분류기가 양성으로 올바르게 분류(TP)”..
-
[2022/04/08][짤막한 이야기 - AUC]짤막한 이야기 2022. 4. 8. 09:56
[2022/04/08][짤막한 이야기 - AUC] “AUC(Area Under ROC Curve)”는 ROC 그래프의 밑넓이를 의미한다. 이 또한 인공지능 및 분류 분야에서 중요하게 여겨지는 지표 중 하나이다. “ROC(Receiver Operating Characteristic)”는 “FPR(False Positive Ratio, 위양성율)”를 X축으로, “TPR(True Positive Ratio, 양성율)”를 Y축으로 만들어지는 그래프이다. ROC 그래프로 생성되는 곡선(혹은 직선)에 대하여 해당 선의 아래의 면적을 구하는 것이 AUC의 기본 정의이며, TPR이 Y축이고 FPR이 X축이기 때문에 그래프가 “┌” 모양에 가까울 수록 넓이가 1에 가까워지며, 이 분류기의 분류 성능이 좋다고 할 수 있다..
-
[2022/04/06][짤막한 이야기 - 정확도]짤막한 이야기 2022. 4. 6. 18:20
[2022/04/06][짤막한 이야기 - 정확도] “정확도(Accuracy)”는 인공지능 혹은 분류 분야에서 주로 사용되는 용어이다. 분류 수행 결과의 정확도를 의미하는 지표로써 가장 간단하게 계산할 수 있는 지표 중 하나이기 때문에 많이 활용된다. “이진 분류(Binary Classification)”에서 분류 결과는 양성(True Positive, 이하 TP)과 음성(True Negative, 이하 TN)이 나올 수 있다. 그런데 이 결과가 진짜 맞을수도 있고 분류기가 잘못 분류한 것일 수도 있다. 양성이라고 했지만 사실 실제로는 음성(위양성, False Positive, 이하 FP)일수도 있으며, 음성이라고 했지만 사실 실제로는 양성(위음성, False Negative, 이하 FN)일수도 있는 것이..
-
[2022/04/05][짤막한 이야기 - 오탐 & 미탐]짤막한 이야기 2022. 4. 5. 07:18
[2022/04/05][짤막한 이야기 - 오탐 & 미탐] “오탐(False Positive)”과 “미탐(False Negative)”은 악성코드 탐지 분야에서 중요하게 여겨지는 지표 중 하나이다. 탐지와 관련된 분야이기 때문에 오”탐”과 미”탐”이라는 글자를 사용하였지만, 엄밀히는 위양성, 위음성이라는 단어로 더 많이 알려져있다. 반대말은 “양성(True Positive)”과 “음성(True Negative)”이다. 간혹 4개의 용어(양성(TP), 음성(TN), 위양성(FP), 위음성(FN))와 의미를 헷갈리는 경우가 많은데, 이 경우에는 헷갈릴 필요없이 뒤에 있는 단어부터 해석하면 된다. True Positive는 뒤에서부터 해석하면 “양성(Positive)이라고 판단했는데, 그것이 맞았다(True)...
-
[2022/04/04][짤막한 이야기 - 악성코드 탐지]짤막한 이야기 2022. 4. 4. 14:59
[2022/04/04][짤막한 이야기 - 악성코드 탐지] “악성코드 탐지(Malware Detection)”는 특정한 프로그램이 악성코드인지 아닌지 판단하는 분야이며, 매우 중요한 한편 아직도 연구할 거리가 많은 분야이다. 보통 악성코드 탐지는 안티바이러스(Anti-Virus) 소프트웨어에서 수행하는 것으로 알려져있다. 악성코드 탐지를 위한 방법은 다양하지만, 대표적으로 많이 활용되는 방법은 두 가지이다. “시그니처 기반 탐지(Signature-based Detection)”와 “행위 기반 탐지(Behavior-based Detection)”의 두 가지이다. 시그니처 기반 탐지는 탐지 대상인 프로그램 내부에 특정한 바이트열(Byte Sequence)이 존재하는지 확인하는 것이다. 이 때 존재를 확인해야하..
-
[2022/04/04][짤막한 공지 - COVID-19]짤막한 공지 2022. 4. 4. 09:48
[2022/04/04][짤막한 공지 - COVID-19] 안녕하세요, 루니프입니다. 지난 3월말부터 금일까지 코로나19에 확진되어 격리중에 있었습니다. 증상도 매우 경미하였으며 현재까지 건강에 아무 문제가 없는 상황이지만, 해당 자가격리 기간 동안 아무런 짤막한 이야기도 포스팅하지 못하였습니다. 금일부터는 자가격리가 해제되었기 때문에 다시금 짤막한 이야기를 꾸준히 포스팅하고자 합니다. ※ 금일의 짤막한 이야기는 저녁 전후로 포스팅 될 예정입니다. #공지 #루니프 #핀 #핀툴 #코로나19 #COVID19 #프로그래머 #해커 #개발자 #분석가 #코딩
-
[2022/03/24][짤막한 이야기 - 직접분기문&간접분기문]짤막한 이야기 2022. 3. 24. 19:53
[2022/03/24][짤막한 이야기 - 직접분기문&간접분기문] “분기문(Branch Statement)”은 대상이 되는 주소로 제어권을 이동하는 어셈블리어를 의미한다. 이와 유사한(하지만 같지는 않은) 개념으로는 “호출문(Call Statement)”도 있다. 이 또한 대상이 되는 주소로 제어권을 이동하는 어셈블리어이다. 흔히 잘 아는 분기문은 “jmp”와 같은 옵코드로 구성되고 호출문은 “call”과 같은 옵코드로 구성이 된다. 그런데 프로그램 자체가 파일 상태에서 이미지 상태로 변환될 때, 즉, 하드디스크에서 메모리 상으로 적재될 때(=실행이 될 때)에는 그 적재 시작위치가 간간히 바뀔 수 있다고 하였다. 그리고 특정한 라이브러리(DLL)로부터 API를 사용하는 경우 해당 라이브러리도 메모리 상에서..
-
[2022/03/23][짤막한 이야기 - 어셈블리어]카테고리 없음 2022. 3. 23. 18:29
[2022/03/23][짤막한 이야기 - 어셈블리어] “어셈블리어(Assembly)”는 너무나도 잘 알려져있으면서도 또 공부하기 싫은 분야이기도 하다. 오늘 포스팅 할 주제는 어셈블리어를 공부하라는 내용이 아니고, 어셈블리어의 특성 때문에 발생하는 분석 방해 기술이다. 어셈블리어는 기계어(Machine Code, 보통 16진수로 표현함)를 “그나마” 사람이 읽기 편하게 조금 더 “번역”해놓은 컴퓨터용 언어에서 개선된 인간용 언어이다. 어셈블리어는 일반적으로 옵코드(OpCode)와 오퍼랜드(Operand, 피연산자)로 나뉘어서 구성된다. 그림에서의 첫 번째 줄을 예로 들면, 0x6A와 0x00이 각각 옵코드와 오퍼랜드인 것이다. 두 번째 줄은 0x68이 옵코드이고 0x00 0x20 0x40 0x00이 오퍼..