Research Interests
3D Image Processing
Vision Language Action Model
Vision Language Model
Object Tracking
Super Resolution
Career
AI 연구원
2025.03 - Present
㈜펀진 지능화연구실 AI Architecture팀
Education
7th Naver Connect. BoostCamp AI Tech
2024.08 - 2025.02
Computer Vision Domain
국민대학교 빅데이터경영통계전공
2018.03 - 2022.02
정보보안암호수학과 부전공
수석 졸업 (평점: 4.26/4.5, 전공평점: 4.41/4.5)
Publications
ICTC 2025
Enhancing Lightweight IRSR Models via Knowledge Distillation with Structural and Spectral Losses
1저자 · Oral Session
Projects
Computer Vision
Multi Spectral Image Anomaly Detection
2025.11 - 진행중
Funzin · 개발 과제
- 다분광으로 촬영된 이미지 속 위장막 식별 프로젝트
- FFT를 활용한 다분광(4 channel) 이미지 정합
- Multi Scale Filter와 Cosine Similarity를 활용한 Anomaly Detection
- Streamlit 기반 다분광 이미지 라벨링 툴 개발
Computer Vision
Multi Drone View Multi Object Tracking
2025.11 - 진행중
Funzin · 팀 프로젝트 (참여도 60%)
- 다중 드론에서 촬영된 영상 속 다중 객체 Re-ID
- YOLO + Kalman Filter를 활용한 단일 카메라 객체 추적
- 드론의 IMU 정보, 카메라 파라미터를 활용한 객체 GPS 위치 추정
- BFS 알고리즘과 SORT 모델을 활용한 다중 카메라 객체 Re-ID 구현
- IsaacSIM 시뮬레이터로 드론 카메라 움직임 구현, 학습 및 추론 데이터셋 생성
Robotics
이기종 협동 로봇 전시
2025.07 - 2025.10
Funzin · ADEX 2025
- 로봇팔, 이동 로봇 협력 작업 수행 전시 (ADEX 2025)
- 이동 로봇 목적지 도착 알고리즘 및 경로 생성 알고리즘 개선으로 작업 수행 정확도 2배 상승
- Queue 기반의 Job Scheduler 노드 구성, 작업 실패 시 복구 알고리즘 구축
- ROS Topic, Service, Action을 활용한 로봇 제어
Computer Vision
Enhancing Lightweight IRSR Models via Knowledge Distillation
2025.04 - 2025.07
Funzin · ICTC 2025 Oral Session
- IR Image Super Resolution 분야에 Knowledge Distillation 기법을 최초로 도입한 학습 프레임워크 제안
- IR 이미지에 특화된 Sobel Transform, Spectral Loss를 활용한 Loss Function 설계
- 일반적인 학습 프레임워크 대비 4%의 성능 향상 달성
Vision Language Model
트래블로그: 사진 기반 여행 블로그 생성기
2025.01 - 2025.02
Naver Boostcamp · KCI 논문
- VLM(Qwen-VL)과 LLM(하이퍼클로바) API를 활용해 LLM의 시각적 한계 극복
- 프롬프트 엔지니어링과 파인튜닝으로 기존 LLM 대비 10% 이상 향상된 블로그 생성
- 멀티 프로세싱을 통한 추론 시간 단축 및 효율적인 GPU 활용
Vision Language Model
Text Guided Zero Shot Composed Image Retrieval
2024.07 - 2024.11
X:AI Conference
- Segmentation Module(SAM)을 추가해 이미지 속 필요한 부분만 활용하도록 전처리
- Q-Former를 응용한 Projection Module로 Text-Image alignment 향상
- COCO Segmentation Benchmark 33.2%로 비공식 1위 달성 (Papers with code 기준)
Computer Vision
재활용 쓰레기 객체 검출
2024.09 - 2024.10
Naver BoostCamp
- MMDetection Library를 활용한 Object Detection 모델 개발 (DDQ, DINO)
- Data Augmentation, Pseudo Labelling, TTA를 활용한 30% 검출 능력 향상
- Copy-Paste 기법과 Mosaic 기법을 결합한 Data Augmentation 기법 개발
Computer Vision
Hand Bone Semantic Segmentation
2024.11
Naver Boostcamp
Computer Vision
Receipt Text OCR
2024.10
Naver Boostcamp
Computer Vision
Sketch Image Classification
2024.09
Naver Boostcamp
Computer Vision
Improving DeepFake Detection with Effectiveness
2021.10
Kookmin Univ.
NLP
Develop Counseling Chatbot for Depression Patients
2021.05
Kookmin Univ.
Skills
Programming
Python, R, SQL
Deep Learning
PyTorch, TensorFlow/Keras
Machine Learning
Scikit-Learn
Robotics
ROS2
Tools & Environment
GitHub, Docker, Wandb
Activities
-
X:AI (AI 학회)2024.07 - 2024.11Conference Session
-
5th LG Aimers2024.07 - 2024.08
-
D&A (데이터 분석 학회)2019 - 2020ML, DL, Conference Session
Awards
-
제4회 빅스타 경진대회 특별상2022.10천연가스 수요 장기 시계열 예측 모델 개발
-
D&A 제1회 산학연계공모전 1위 (Kaggle)2021.12고객 – 매니저 매칭 모델 개발
-
대전시 빅데이터 분석 공모전 2위2021.06주차난 해결을 위한 주차장 수요 예측 모델 개발
Certificates
- OPIc IH 2025.07
- TOEIC 910 2025.01
- SQL개발자(SQLD) 2022.09
- 빅데이터분석기사 2021.12
- 데이터분석 준전문가(ADsP) 2019.09