[네이버 부스트 캠프] AI-Tech - Lv3 데이터 제작(2)

November 9, 2021

학습 기록

일반화 성능 : 성능평가는 새로운 데이터가 들어왔을 때 얼마나 잘 동작하는지 측정하는 것
ex) 미국에서 잘 작동하는 자율주행 알고리즘이 한국에서 잘 작동될까?

성능 평가 시 데이터 분리 방법

Data -> train-test split -> train-test split -> Validation split (k-fold + ensemble)

성능 평가 시 추가 분석 내용 (정량 평가)

Recall : 실제 Truth 일 때, 예측 결과가 Truth인 경우
Precision : 예측 Truth 일 때, 실제 Truth인 경우

tmp

(예시)
tmp

글자 검출 모델 평가 방식의 구성 요소 검출 모델 평가 다이어그램

두 영역 간의 매칭 판단 방법 (매칭 행렬 계산) + 매칭 행렬에서 유사도 수치 계산 방법 (유사도 계산)

tmp

두 영역 간 매칭 판단 방법 (기본 용어 예시)

실제 사용되는 정량 평가 방식 (가장 많이 사용되는 방식 중 하나)

매칭 행렬의 한 셀마다 Area Recall, Area Precision을 구합니다. (2개의 수치 확보)
셀 중에 area recall >= 0.8 and area precision >= 0.4 조건을 충족시키면 1 아니면 0 값으로 관계 행렬 값을 바꿈
Binary map이 완성됐으면, 아래의 그림과 같이 판단.. (?)
(질문) 무슨 얘기지? 어떤 방식으로 학습을 시키는지 이해가 안감.