AI의 한 종류로, vision 데이터들에서 의미 있는 정보를 추출하고 이를 이해한 것을 바탕으로 여러가지 작업을 수행하는 것
규칙 기반의 이미지 처리 알고리즘 ( Ex. OpenCV )
이미지에 기반한 연산이며, 흑백 이미지에서 일반적으로 수행
Contour : 같은 색깔 및 intensity를 가지는 연속적인 경계점들로 이루어진 curve
고전 컴퓨터 비전을 활용하여 raw image에서 객체의 contour를 추출
딥러닝 모델 사용 X -> 딥러닝 모델 학습을 위한 데이터 가공 시 활용 가능
컴퓨터 비전의 태스크를 해결할 때 필요한 이미지의 특성을 담고 있는 정보들을 지칭함.
이미지에서 중요한 Feature를 추출(extract)할 수 있도록 훈련됨
역할 : 주어진 비전 태스크를 잘 수행할 수 있는 압축된 Visual Feature를 산출하는 것
구조 : low-level -> mid-level -> high-level
압축된 Feature를 목표하는 태스크의 출력 형태로 만드는 과정을 수행
모델이 어디를 보고 있는지 시각화 할 수 있는 방법을 제시
사물 각각의 Bounding Box 위치와 Category를 예측
Region Proposals 및 Feature Extractor를 거치며 object detection 수행
Region Proposals 없이, Feature Extractor만을 이용한 object detection 수행
우리가 예측한 Bounding Box 와 실제 Bounding Box 값의 차이를 계산
IOU = Area of intersection / Area of Union
Selective Search 기법으로 2000개의 Roi(Region of Interests)를 추출
각 Roi 에 대하여 동일한 크기의 이미지로 변환
Region Proposals 마다 각각의 Backbone (CNN)에 넣어서 결과를 계산
SVM : 각 Region Proposals 마다 SVM으로 Class 분류 결과 예측
각 Roi 영역에 대하여 Max Pooling을 이용
고정된 크기의 Vector 생성
Feature Map을 기반으로 물체의 위치 예측
K개의 Anchor Box를 이용
Sliding Window 방식으로 Feature Map에 적용
중복된 경계 Bbox 를 제거하여 최종 객체 감지 결과를 정리하고 정확도를 높이는 기술
- Single Shot Architecture : YOLO는 객체 감지를 위한 단일 신경망 아키텍처를 사용
- 이미지를 그리드로 나누고, 그리드 셀 별로 Bounding Box 와 해당 객체의 클래스 확률 예측
Pixel-wise 로 각각의 class 를 예측하여 물체 Category 별로 분할
IoU = Area of Intersection / Area of Union
IoU = TP / ( TP + FP + FN )
Backbone를 통해 Features 추출
Feature Map 을 확장하여 입력 이미지와 동일한 크기의 Segmentation Map 생성
Upsampling 의 결과와 Backbone의 중간 Layer에서 나오는 Feature Map과 결합
입력 이미지를 Downsampling
이미지의 공간 정보를 계층적으로 추상화 및 중요한 Feature 추출
Encoder 가 추출한 Feature를 Upsampling
Upsampling하여 Segmentation Map 생성
Encoder와 Decoder 간의 정보 전달
Decoder에서 Upsampling된 Feature와 동일한 해상도의 Encoder Feature를 결합
Natural Language Processing - 04 [ 2025년03월10일 ]
Natural Language Processing - 03 [ 2025년03월07일 ]
Natural Language Processing - 02 [ 2025년03월06일 ]
Natural Language Processing - 01 [ 2025년03월05일 ]
Computer Vision - 02 [ 2025년02월14일 ]