Colab에서 모델 학습을 시키기엔 무리가 있다고 판단했다. YOLOv5는 학습을 시작하기 전에 Train, Val, Test Dataset을 스캐닝 하는 시간이 있는데, 문제는 Google Drive에 마운트를 한 코랩 환경에서는 이 이미지를 하나하나 스캔하는게 매우매우매우 오래걸렸다. 평소 컴퓨터에서 스캐닝이 몇분만에 끝나는 반면에 코랩에서는 3만장 로드하는데 20시간이나 걸렸다(...) 그래서 컴퓨팅 인스턴스를 대여하기로 맘 먹었다. 처음엔 AWS나 Google Cloud에서 제공하는 머신러닝 인스턴스를 사용해 볼 까 했는데, JSON으로 라벨링을 또 따로해서 뽑아야 하고 결과물이 ONNX로 나왔기에 걸렀다. 어차피 변환하면 돼서 상관은 없는데 처음 해보는 거라 프로젝트를 혹여나 망칠 수 있을 것 ..
AI hub에서 받은 데이터 셋 중 가장 첫번째 사진이다. 우선 AI hub에서 제공하는 Dataset의 XML은 자체 양식대로 되어 있는 듯 했는데, 처음에 Roboflow에 올려서 전부 변환하려다가 좀 형식이 다르기도 하고 불안해서 직접 코딩해서 포맷을 YoloV5 라벨링용으로 바꾸기로 했다. 이 사진 파일에 대한 Annotation은 다음과 같았다. 1 2 3 4 5 6 7 8 9 10 ... Colored by Color Scripter cs image 태그 안에 attribute로 사진 파일 이름, 가로폭과 세로폭이 저장되어 있고 자식 태그로 Bounding box( ) 가 있음을 확인 할 수 있었다. 바운딩 박스 태그에는 가려짐 여부(occluded = "1" 일시 가려짐), 좌상단 우하단 좌..
지난 2022년도 2학기동안 짧은 시간이었지만 CV 공부를 조금 했었다. 사실 전혀 관심이 없었던 분야였는데 (아예 모르기도 했고) 드론팀에 속해있던 나는 제어쪽은 다른 학부연구생의 몫이 되었으니 비전쪽을 한번 공부해보는게 어떻겠냐고 교수님께서 제안하셨고, 뭐라도 해보자 싶어 공부를 시작했다. 처음엔 Yolo 논문을 주시고 일주일간의 논문 리뷰 시간을 가졌는데 처음 보는 개념이다보니 엄청 생소했던 기억이 난다. mAP, CNN, Darknet, IOU 등등 모르는 개념이 천지였고 특히 CNN(Convolutional neural network)의 원리에 대해 이해하는데 매우 골치를 썩혔다. 그래서 그냥 암기를 하고 매일같이 읽다보니까 어느순간 불꽃 튀듯이 조금 이해가 가기 시작했다. 논문 리뷰후에 YOL..