Han Seung Soo | AI Researcher

Research Interests

3D Image Processing Vision Language Action Model Vision Language Model Object Tracking Super Resolution

Career

AI 연구원 2025.03 - Present

㈜펀진 지능화연구실 AI Architecture팀

Education

7th Naver Connect. BoostCamp AI Tech 2024.08 - 2025.02

Computer Vision Domain

국민대학교 빅데이터경영통계전공 2018.03 - 2022.02

정보보안암호수학과 부전공

수석 졸업 (평점: 4.26/4.5, 전공평점: 4.41/4.5)

Publications

Under Review SegCIR - Segment-Aware Visual Encoding for Zero-Shot Composed Image Retrieval

공동 1저자

ICTC 2025 Enhancing Lightweight IRSR Models via Knowledge Distillation with Structural and Spectral Losses

1저자 · Oral Session

KCI 시각언어모델 기반 맥락 추출과 한국어 대규모 언어모델 파인튜닝을 통한 여행 블로그 콘텐츠 자동 생성

2저자 · 한국컴퓨터정보학회 논문지

Projects

Computer Vision

Multi Spectral Image Anomaly Detection 2025.11 - 진행중

Funzin · 개발 과제

다분광으로 촬영된 이미지 속 위장막 식별 프로젝트
FFT를 활용한 다분광(4 channel) 이미지 정합
Multi Scale Filter와 Cosine Similarity를 활용한 Anomaly Detection
Streamlit 기반 다분광 이미지 라벨링 툴 개발

자세히 보기 →

Computer Vision

Multi Drone View Multi Object Tracking 2025.11 - 진행중

Funzin · 팀 프로젝트 (참여도 60%)

다중 드론에서 촬영된 영상 속 다중 객체 Re-ID
YOLO + Kalman Filter를 활용한 단일 카메라 객체 추적
드론의 IMU 정보, 카메라 파라미터를 활용한 객체 GPS 위치 추정
BFS 알고리즘과 SORT 모델을 활용한 다중 카메라 객체 Re-ID 구현
IsaacSIM 시뮬레이터로 드론 카메라 움직임 구현, 학습 및 추론 데이터셋 생성

자세히 보기 →

Robotics

이기종 협동 로봇 전시 2025.07 - 2025.10

Funzin · ADEX 2025

로봇팔, 이동 로봇 협력 작업 수행 전시 (ADEX 2025)
이동 로봇 목적지 도착 알고리즘 및 경로 생성 알고리즘 개선으로 작업 수행 정확도 2배 상승
Queue 기반의 Job Scheduler 노드 구성, 작업 실패 시 복구 알고리즘 구축
ROS Topic, Service, Action을 활용한 로봇 제어

자세히 보기 →

Computer Vision

Enhancing Lightweight IRSR Models via Knowledge Distillation 2025.04 - 2025.07

Funzin · ICTC 2025 Oral Session

IR Image Super Resolution 분야에 Knowledge Distillation 기법을 최초로 도입한 학습 프레임워크 제안
IR 이미지에 특화된 Sobel Transform, Spectral Loss를 활용한 Loss Function 설계
일반적인 학습 프레임워크 대비 4%의 성능 향상 달성

자세히 보기 →

Vision Language Model

트래블로그: 사진 기반 여행 블로그 생성기 2025.01 - 2025.02

Naver Boostcamp · KCI 논문

VLM(Qwen-VL)과 LLM(하이퍼클로바) API를 활용해 LLM의 시각적 한계 극복
프롬프트 엔지니어링과 파인튜닝으로 기존 LLM 대비 10% 이상 향상된 블로그 생성
멀티 프로세싱을 통한 추론 시간 단축 및 효율적인 GPU 활용

자세히 보기 →

Vision Language Model

Text Guided Zero Shot Composed Image Retrieval 2024.07 - 2024.11

X:AI Conference

Segmentation Module(SAM)을 추가해 이미지 속 필요한 부분만 활용하도록 전처리
Q-Former를 응용한 Projection Module로 Text-Image alignment 향상
COCO Segmentation Benchmark 33.2%로 비공식 1위 달성 (Papers with code 기준)

자세히 보기 →

Computer Vision

재활용 쓰레기 객체 검출 2024.09 - 2024.10

Naver BoostCamp

MMDetection Library를 활용한 Object Detection 모델 개발 (DDQ, DINO)
Data Augmentation, Pseudo Labelling, TTA를 활용한 30% 검출 능력 향상
Copy-Paste 기법과 Mosaic 기법을 결합한 Data Augmentation 기법 개발

Computer Vision

Hand Bone Semantic Segmentation 2024.11

Naver Boostcamp

Computer Vision

Receipt Text OCR 2024.10

Naver Boostcamp

Computer Vision

Sketch Image Classification 2024.09

Naver Boostcamp

Computer Vision

Improving DeepFake Detection with Effectiveness 2021.10

Kookmin Univ.

NLP

Develop Counseling Chatbot for Depression Patients 2021.05

Kookmin Univ.

Skills

Programming Python, R, SQL Deep Learning PyTorch, TensorFlow/Keras Machine Learning Scikit-Learn Robotics ROS2 Tools & Environment GitHub, Docker, Wandb

Activities

X:AI (AI 학회)
Conference Session

2024.07 - 2024.11
5th LG Aimers
2024.07 - 2024.08
D&A (데이터 분석 학회)
ML, DL, Conference Session

2019 - 2020

Awards

제4회 빅스타 경진대회 특별상
천연가스 수요 장기 시계열 예측 모델 개발

2022.10
D&A 제1회 산학연계공모전 1위 (Kaggle)
고객 – 매니저 매칭 모델 개발

2021.12
대전시 빅데이터 분석 공모전 2위
주차난 해결을 위한 주차장 수요 예측 모델 개발

2021.06

Certificates

OPIc IH 2025.07
TOEIC 910 2025.01
SQL개발자(SQLD) 2022.09
빅데이터분석기사 2021.12
데이터분석 준전문가(ADsP) 2019.09