이미지 중복 분류하기
이미지를 다루는 작업을 많이 하다보면 빠르게 이미지의 중복을 비교해야 할 일들이 생긴다. 우리는 크롤러를 헤비하게 사용하다 보니, 이미지 간의 중복을 픽셀 수준의 완전일치의 중복을 넘어 유사도(같은 이미지가 아니지만 거의 비슷한 혹은 같은 이미지이지만 리사이징 된)에 따라 비교를 해야한다. 오늘은 최근 적용한 이미지 중복 처리과정에서 여러가지 방법들을 실험하고 최선의 알고리즘을 골랐던 과정을 적어보려고 한다. 이미지는 어떤 정보일까? 우리가 가...
Dec 23, 202510 min read
