KT 에이블스쿨 : 5차 미니프로젝트 (6일차) - 얼굴인식 마지막 날
5차 (2) 미니프로젝트
6일차 : 24.05.02 (목)
5차 미프 끝, , ,
5차는 2개의 미니프로젝트를 했는데,
시계열 데이터, 얼굴인식 딥러닝 모델을 실습했ㄷr
시계열 데이터는 좀 어려웠지만, 얼굴인식 딥러닝은 수업때 배운걸 해서 문제없이 진행했고
덕분에 처음으로 여유로웠던 미니프로젝트였다 !
정리
유명인 얼굴 인식
유명인 얼굴인식 모델은 성능이 잘 안나왔다. .
epochs를 150번까지 해봤지만, 리소스의 한계가 있어서 많이는 돌리지 못했다.
유명인 얼굴 인식 모델리을 하면서, 성능이 낮아 문제가 많았다.
특히, 다른 조원이 150 epochs까지 돌린 모델의 best.pt를 내가 가져와 다시 epochs 추가학습 시키면 mAP가 처음부터 다시 시작했다.
그래서 detection이 더 잘 안되는 문제가 있었다.
이에 대한 이유로는 학습데이터와 검증데이터간의 차이가 있다.
학습데이터는 심하게 augmentation된 데이터인 반면에 검증데이터는 각도만 틀어진 이미지이기에 차이가 발생하는 것이다.
아래의 augmentation에 대한 설명처럼 과적합되는 문제를 해결하기 위해 사용하는 것인데 우리조는 augmentaion을 별도로 하지는 않았다.
데이터 증강(Data Augmentation)
CNN 모델의 성능을 높이고 오버피팅을 극복하는 방법
다양한 유형의 학습 이미지 데이터 양을 늘리는 것
하지만 이미지 데이터의 경우 학습 데이터 량을 늘리는 것은 쉽지가 않아, 원본 이미지를 변형해서 학습하는 것임
우리 조는 3개의 모델을 활용해 조원 얼굴을 인식했다.
1) 유명인 얼굴을 인식한 모델의 가중치를 불러와서 성능을 확인했을때가 가장 낮았음
2) 사전학습이 되지 않은 yolo 모델을 불러와 학습시켰을때
3) ms coco로 사전학습된 yolo 모델 위에 다시 학습시켰을떄
2, 3)번은 성능이 완전 똑같이 나옴
발표할때는 mAP50만 빨간색 상자로 표시해뒀는데,
이는 10%에만 해당되는거고 실질적으로 중요한건 mAP50-95가 실 성능이라는 코멘트를 들었다.
우리조가 생각한 것보다 성능이 낮긴했지만, epochs를 겨우 15만 돌린거에 비해서는 좋다고 생각한다.
칭구들이랑 같이 찍은 셀카를 예측했을때
발표타임
미디어 파이프라인(?) 이라는 고급기술을 사용한 조도 있었고
augmentaion을 한 조도 있었다.
단순히 이미지를 수집한거에 그치지 않고 data augmentation을 해서 과적합되지 않게 하는게 중요하다고 생각한다.
그리고 실습을 하면서 든 생각이
재미로 하는 유명인 닮은꼴 찾기 이런걸 할때 그 서비스는 어떻게 만들어졌는지 제대로 이해하게 됐다.
유명인들의 클래스대로 라벨링을 직접하고, 일반인의 사진으로 예측했을때 나오는 예측률(확신률)로 누구누구를 닮았다라고 서비스하는걸 이제야 알게됐다.
신기하다고 생각했는데, 직접 개발해보니 생각보다 쉬웠구나를 느꼈다
너무 너무 재밌었따
댓글
댓글 쓰기