AI/Baseline

CSPDarknet53, Mish 활성화, Cross-stage partial connections

아인샴 2024. 3. 4. 13:18

2024.03.04 - [AI] - YOLO v1~v8까지 정리 해보자

-Yolov4에서 도입했다고 하길래 나도 한 번 알아보자. 

 

CSPDarknet53

-CSPDarknet은 Cross Stage Densenet의 Densenet부분을 Darknet으로 바꾼 것이라고 한다. 그냥 Densenet과 CSP Densenet의 구조적 차이는 아래와 같다.

Input X0를 전부 다쓴다.
X0를 x0' 과 x0''로 나눠서 x0''는 기존 (A)의 x로 쓰고, x0'는 마지막 transitation Layer에서 concat해서 쓴다.

X0전체를 처리하지 않았기 때문에 (처리하지 않은 x0가 그대로 적용되었음), Partial DenseNet이라고 한다. 

출처 : https://yonghoney.github.io/YOLOv4/

  • CSP란 네트워크 일부 계측에서 feature map을 두 부분으로 나누고 한 부분을 직접 다음 계층으로 전달, 나머지는 여러 계층을 통과시킨 후 이전에 분리된 부분과 다시 합치는 방식을 의미한다. 이러한 구조가 계산 효율성을 높이고 정보의 흐름과 그라디언트 전파를 개선하는데 도움이 된다고 한다. 
  • 53은 네트워크내의 Conv 계층의 수를 나타낸다고 한다. 

 

Mish 활성화

이젠 Relu보다 좋은 것들이 많이 나왔나 보다. (yolo4가 몇년전인데 ㅠ) 

 

ㅇㅇ

unbounded above란 함수의 출력값이 위로 무제한이란뜻. 구글에서 발표한 Swish함수

swish 함수 구조; b=0이면 identity 함수 b=∞이면 ReLU가 된다.

에 기반한 함수라고 한다. 

]

출처 : https://eehoeskrap.tistory.com/440

https://hongl.tistory.com/213

https://keyog.tistory.com/30

 

Cross-stage partial connections

-위에서 설명한 Cross-stage partial network에서 parital 부분을 이야기 하는 것으로 보인다.