[TEXT DETECTION] AIHUB 데이터셋으로 Fine-Tuning을 한 뒤에 숫자, 혹은 작은 영역 검출 정확도 올리기 #4

penguin1109 · 2022-11-18T06:05:37Z

penguin1109 · 2022-11-19T06:16:37Z

아마도 EAST는 굴곡진 간판 이미지같은 arbitrary feature에 더 적합하기 때문에 horizontal text에 최적화 되어 있는 CTPN이 영수증이나 거래 내역같은 문서 이미지는 더 잘 검출하는 듯 하다.

---> 다만 여기서 이미지가 품질이 안 좋은 경우에는 아래와 같이 정확도가 낮아서 전처리를 더 해준 다음에 input으로 넣어줄 필요가 있을듯

학습 시킬 때에 데이터에 임의로 아핀 변환같이 transformation을 해줘서 augmentation을 강하게 줘서 학습을 더 CTPN으로 시켜야 할 것 같음

penguin1109 · 2022-11-19T06:19:30Z

Image Denoising을 위해서, 혹은 image restoration을 위해서 추가적으로 앞 단의 pre-processing으로 이미지 품질 개선을 하는게 나을지 아니면 고전적인 변환 알고리즘을 사용하면 될지 판단 부탁 드립니다

penguin1109 moved this to In Progress in OCR Model Nov 18, 2022

penguin1109 added this to OCR Model Nov 18, 2022

penguin1109 self-assigned this Nov 18, 2022

penguin1109 added the enhancement New feature or request label Nov 18, 2022

Provide feedback