Skip to content

Latest commit

 

History

History

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 

README.md

BLIP Vision-Language 모델

Vision-Language 모델인 BLIP을 활용한 Image Captioning과 Visual Question Answering (VQA) 데모입니다.

주요 기능

  • Image Captioning: 이미지에 대한 자연어 설명 생성
  • Visual Question Answering (VQA): 이미지에 대한 질문에 답변
  • PyQt5 GUI 인터페이스 제공
  • 실시간 이미지 로드 및 분석
  • 다양한 사전 정의된 질문 템플릿 지원
  • CPU 환경에서 사용 가능

사용법

python blip_interactive.py

결과 예시

  • Image Captioning

BLIP Caption

  • Visual Question Answering

BLIP VQA