컴퓨터 비전에서 receptive field는 피처 맵의 특정 픽셀 (또는 신경망의 뉴런)이 반응하는 입력 이미지의 특정 영역을 의미한다. 이 개념은 신경과학에서 유래되었지만 Convolutional Neural Networks (CNNs)에서 입력 이미지가 특정 계층의 출력에 얼마나 영향을 미치는지 설명하기 위해 널리 사용된다. 뉴런의 receptive field은 컨볼루션 필터의 크기, 보폭(strides), 레이어 수에 따라 결정된다. 네트워크 깊숙히 들어갈 수록 receptive field가 증가하므로 더 깊은 층에 있는 뉴런은 이미지의 더 많은 부분에서 더 많은 정보에 액세슬 할 수 있다. 이는 가장자리나 질감뿐만 아니라 모양이나 물체와 같은 더 복잡한 특징을 인식하는 데 도움이 된다. rece..
컴퓨터 비전에서 Image Pyramid는 이미지를 반복적으로 다운샘플링 (일반적으로 2의 배수)하여 해상도가 점차 낮아지는 이미지 시퀀스를 생성하는 이미지의 다중 스케일 표현이다. 이 구조는 알고리즘이 다양한 수준의 디테일로 이미지를 처리할 수 있게 해주므로 object detection, image matching, texture analysis 같은 다양한 작업에 유용하다. Pyramid에는 크게 두 가지 유형이 있다.Gaussian Pyramid:Pyramid의 각 레벨은 Gaussian Filter를 사용해 noise와 detail을 줄이기 위해 이전 레벨을 매끄럽게 하고(smoothed) 다운샘플링한 버전이다.주로 다양한 스케일로 글로벌 이미지의 특징을 캡처하는 것이 목표인 응용에 사용된다...
컴퓨터 비전에서 NCC는 두 이미지(또는 이미지 패치) 간의 유사성을 측정하는 Normalized Cross-Correlation (정규화된 교차 상관관계)의 약자다. 템플릿 매칭 (template matching) 및 이미지 정렬 (image alignment) 작업에서 일반적으로 사용되며, 템플릿과 이미지 섹션 간에 가장 잘 일치하는 것을 찾는 것이 목표다. NCC에 관련된 단계는 아래와 같다.Normalization: 비교 대상인 템플릿과 이미지 패치는 모두 평균을 빼고 표준편차로 나누어 정규화된다. 이렇게 하면 발기와 대비가 다른 효과가 제거된다.Cross-correlation: 템플릿과 이미지 패치의 정규화된 버전을 곱하고 합산해 상관 관계 점수를 계산한다. 그 결과는 유사성의 척도로서 점수가..
- Total
- Today
- Yesterday
- The Economist
- min heap
- DICTIONARY
- 이코노미스트 에스프레소
- Android
- 티스토리챌린지
- 머신 러닝
- ml
- 이코노미스트
- Hash Map
- defaultdict
- The Economist Espresso
- vertex shader
- 리트코드
- 딕셔너리
- 투 포인터
- tf-idf
- java
- I2C
- 안드로이드
- Python
- 소켓 프로그래밍
- Computer Graphics
- leetcode
- C++
- join
- 오블완
- machine learning
- socket programming
- 파이썬
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |