사람

기업

게시물

CNN은 사람과 보는 방식이 어떻게 다른가? ImageNet - Train CNNs are biased towards texture; increasing shape bias improves accuracy and robustness(https://openreview.net/pdf?id=Bygh9j09KX)를 읽고 정리해봤습니다. 최대한 내용 명확하게 전달하기 위해서 논문에 있던 자잘한 내용들은 생략했습니다. 요약 1. 기존의 CNN이 이미지 분류를 할 때, 형상 정보를 기반으로 인식을 한다는 형상 정보 가설(Shape Bias Hypothesis)와 질감 정보를 기반으로 인식한다는 질감 정보 가설(Texture Bias Hypothesis)가 존재했다. 2. 사람과 CNN이 영상 데이터를 어떤 관점에서 분류하는지 확인하기 위해 정신 물리학 실험을 수행했다. 해당 실험을 통해서 사람은 형상 정보에 편향 되어있고, CNN은 질감 정보에 편향 되어 있음을 확인할 수 있었다. 3. 모델을 SIN/IN 데이터를 혼합하여 학습하면 모델을 형상 정보로 편향시킬 수 있다. 형상 정보로 편향된 모델이 기존 IN 데이터로만 학습된 모델보다 더 좋은 성능을 나타냄과 동시에 전이 학습(Transfer learning)에서도 성능 개선이 유효함을 확인할 수 있었다. 따라서 본 논문에서 제안한 SIN/IN 데이터 학습이 인공지능 모델을 일반화(Generalization) 시키는데 기여한다라고 이야기할 수 있다. https://ssaru.github.io/2019/08/06/20190806-How_the_Eye_of_AI_Sees/?fbclid=IwAR2CF7yMzcvY0bG1NdjSwQp1UIeiHhuC1Wdtv0VF9rRbAykTUd2ttf8gOuI
링크 첨부됨
2019-08-09
황동현  연구원 @전자부품연구원(KETI)
minikube, Kubernetes, micro-architecture

블로그 글

채용 정보

로민
응답률 우수
컴퓨터비전 연구 전문 스타트업 Lomin 입니다. 
인공지능 기반 온라인 댄스 컨텐츠 플랫폼을 제작하여 소비자들이 즐겁게 춤을 즐길 수 있도록 돕는 기업입니다. 
주식회사 노타
응답률 우수
인공지능으로 세상을 편리하게 하자는 철학을 실천하는 기업입니다 :) 

뉴스/미디어

프로젝트

Diminished Reality
 
2017년 5월 - 2017년 12월 
Yolo라는 Object Detection 딥러닝 모델과 examplar-based Image Inpainting 기술을 활용하여 감쇄현실 시스템을 제안하고 구현하여 성능을 평가하는 연구를 진행했습니다. 위탁받은 연구과제가 아닌, 개인 연구 프로젝트로 진행하였습니다. 국제학술대회 2편 발표
김찬란  전문연구요원 @줌인터넷
570RP · image-processing 상위 2%
미술품 원색 기록 보존 및 복원을 위한 Multi-spectral 이미징 기술 개발
2016년 4월 - 2017년 3월 
멀티 스펙트럴 이미징에 대해서 많이 배우고 경험했습니다. 선배의 가르침에 따라가는 수준으로 진행하였습니다. 특별히 ICCV-W 2017에 논문을 투고하기 위하여 멀티 스펙트럴 이미징 기술을 이용한 가상현실 환경에서의 object relighting에 대하여 연구하였습니다. 처음으로 리젝을 경험하였지만, 이후 논문 작성에 많은 밑거름이 되었습니다.
김찬란  전문연구요원 @줌인터넷
570RP · image-processing 상위 2%
다중 영상 기반 3차원 기하정보 추출 기법 연구
2016년 7월 - 2017년 1월 
카메라 정보(Intrinsic Parameter)가 없는 상황에서 다중 영상 기반 3차원 기하정보 추출하는 기법을 연구하였습니다. 특별히 제가 맡았던 부분은 ORB(Oriented FAST and rotated BRIEF)를 구현하는 것이었습니다. 외부 라이브러리 코드를 포함하면 안된다는 조건이 있었습니다. 그래서 (openCV 내부 코드를 참고하여) 특징점 추출, 서술, 매칭하는 것을 모두 직접 구현하였습니다.
김찬란  전문연구요원 @줌인터넷
570RP · image-processing 상위 2%