You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
현재로서 EAST, TextBPN, DBNet 중에 선택을 하려고 하는데, 단순히 AIHUB 이미지 데이터셋으로 scratch 부터 학습 시키기에는 이미지 데이터의 수가 부족하다는 한계가 있었다. (원래 100만, 1000만장의 이미지를 가지고 있을 때에만 scratch 학습이 가능한 것인데, data augmentation과정으로 다양한 위치에서 crop을 하면 학습이 가능할 줄 알았으나 시간적인 여유가 없었다)
그래서 이제 위의 3개의 모델을 비교하고 필요 하다면 숫자나 작은 문자 영역의 검출의 정확도를 올리기 위해서 직접 이미지 데이터셋을 생성해서 학습 시킬 예정이다.
작은 숫자, 작은 크기의 문자영역이 포함된 이미지 데이터셋 생성
AIHub 데이터셋 학습에 용이하게 특수 문자 영역, text 영역 구분해서 bounding box 데이터 만들어 재학습
pre-processing으로 affine transformation 시도 (영수증을 직접 찍으면 휘어짐이나 굴곡등의 왜곡된 부분이 분명 있음)
Image Denoising이나 Image Restoration 모델을 고려해볼 필요가 있음
EAST의 사전 학습된 모델 fine-tuning
TextBPN의 사전 학습된 모델 fine-tuning
DBNet의 사전 학습된 모델 fine-tuning
CRAFT의 사전 학습된 모델 fine-tuning
CTPN의 사전 학습된 모델 fine-tuning
위의 모델들 성능 비교 후에 선택된 모델의 정확도 향상
The text was updated successfully, but these errors were encountered:
현재로서
EAST
,TextBPN
,DBNet
중에 선택을 하려고 하는데, 단순히 AIHUB 이미지 데이터셋으로 scratch 부터 학습 시키기에는 이미지 데이터의 수가 부족하다는 한계가 있었다. (원래 100만, 1000만장의 이미지를 가지고 있을 때에만 scratch 학습이 가능한 것인데, data augmentation과정으로 다양한 위치에서 crop을 하면 학습이 가능할 줄 알았으나 시간적인 여유가 없었다)그래서 이제 위의 3개의 모델을 비교하고 필요 하다면 숫자나 작은 문자 영역의 검출의 정확도를 올리기 위해서 직접 이미지 데이터셋을 생성해서 학습 시킬 예정이다.
작은 숫자, 작은 크기의 문자영역이 포함된 이미지 데이터셋 생성
AIHub 데이터셋 학습에 용이하게 특수 문자 영역, text 영역 구분해서 bounding box 데이터 만들어 재학습
pre-processing으로 affine transformation 시도 (영수증을 직접 찍으면 휘어짐이나 굴곡등의 왜곡된 부분이 분명 있음)
Image Denoising이나 Image Restoration 모델을 고려해볼 필요가 있음
EAST
의 사전 학습된 모델 fine-tuningTextBPN
의 사전 학습된 모델 fine-tuningDBNet
의 사전 학습된 모델 fine-tuningCRAFT
의 사전 학습된 모델 fine-tuningCTPN
의 사전 학습된 모델 fine-tuning위의 모델들 성능 비교 후에 선택된 모델의 정확도 향상
The text was updated successfully, but these errors were encountered: