[네이버 부스트 캠프] AI-Tech - Lv2 week1(5)

학습기록 - 30

오늘 할 일

  • Object Detection - R-CNN 관련

1. 강의 복습 내용

object detection

  • Semantic Segmentation 과 Instance, Panoptic Segmentation의 차이는 개체를 구별하는 지에 따라 달라진다.
  • Segmentation에서 좀 더 구체적이고 기본적인 기술
  • Classification + Box localization
  • OCR 기술 등등

Traditional Methods

  • Gradient - based detector : 경계선을 이용한 detect
  • Selective Search
    • 색, Gradient 등의 분포를 기준으로 비슷한 영역끼리 합쳐준다. (Segmentation)
    • 위에서 구별된 영역을 bounding box로 해서 구별, Object의 후보군으로 추천

R-CNN

  • Extract Region proposals (Selective Search) → warped ( 224 * 224 ) → CNN features → Classify (by SVM) + B
  • 여기서 Selective Search란 룰 베이스 알고리즘으로, 주변 픽셀의 유사도를 기준으로 2천여개의 물체가 ‘있을 법한’ 박스를 찾는 것을 의미.
  • region들 각각 CNN에 넣어야 하기 때문에, 속도가 느리다. 별도의 hand-design (selective search) 때문에 성능 향상의 한계
  • Bounding box regression이 들어가는 건가? → 포함은 된다.

Untitled

Fast R-CNN

  • CNN에서 Convolution layer까지 feature map을 뽑아낸다.
  • CNN을 먼저 돌린 후, feature map을 통해, ROI pooling layer 선정한다고 생각하자. (by 피어세션)
  • ROI(resion of interest) pooling layer : fixed dimension을 가질 수 있도록 Resampling
  • bbox & softmax for each ROI
  • Selective Search (hand design) 이 있기 때문에 성능 한계

Untitled

Faster R-CNN

  • Region proposal (Selective Search) 했던 것을 NN으로 대체. 모든 part들이 neural network를 이용. (end to end 학습)
  • IoU (Intersetion over Union) : 두 박스의 교집합을 합집합으로 나눠준 값!
    • 비율과 스케일이 다른 Anchor boxes를 이용한다.
    • IoU with GT > 0.7 → positive sample
    • IoU with GT < 0.3 → negative sample

      Untitled

  • Region Proposal Network (RPN) , Selective Search 대신!
    • Non-Maximum Suppression (NMS) : resion proposal에서 IoU에 기준에 맞지 않는 box는 제거하는 방식

      Untitled

  • Single-stage detector, two-stage detector
    • R-CNN 은 Single-Stage Regression을 말하는 건가? 동시에, Fast R-CNN은 two-stage ?

      Untitled

    • Box regression을 통한 ROI pooling의 차이
    • YOLO, SSD ????
  • Two-stage detector
    • Focal Loss : Loss 값에 따라 학습에 차이를 둔다.
    • RetinaNet :
  • Detection with Transformer
    • DETR

      질의에 대한 응답 (object queries), 이 응답을 통해 prediction을 출력

      Untitled

    • Detection Box 표현 대신에 그 위치를 찾는 방법 (Detecting objects as points)

2. 고민 내용, 결과 (과제 수행 과정, 결과물 정리)

과제

3. 피어세션 정리

[ 2021년 9월10일 목요일 회의록 ]

✅ 오늘의 피어세션 (모더레이터: 임성민)

  1. 강의 요약
    • 발표자: 임성민
    • 내용: Object Detection

📢 내일 각자 해올 것

  1. 모더레이터: 임성민 - 강의 5 강
  2. 필수 과제 리뷰, 질문

📢 내일 우리 팀이 해야 할 일

  1. 톡방 이용한 질문 확인

📢 토의 내용

  • 팀 회고 & R-CNN 관련 내용

4. 학습 회고

  • 강의 내용은 정말 가볍게 느껴졌는데 막상 까면, 그냥 가볍게만 설명했던 것 같다. 논문을 직접 하나씩 뜯어봐야 한다고 생각했다. 두렵지만, 해야하는게 맞겠지.?!
    그리고 뭔가 처지는 이 느낌은.. 뭘까!