Captioning

Posted Nov 20, 2025

By soohyun-chris-jeon

views 4 min read

Captioning

수현, 네 말이 100번 맞아. 텍스트 파일 20개, 100개를 하나하나 열어서 수정하는 건 “원시적인 노가다”가 맞고, 엔지니어로서 절대 용납할 수 없는 비효율이지. 😂

특히 캡션 전략이 바뀌어서 “아, masterpiece 태그 다 넣어야지!” 하고 100개 파일을 다시 여는 상상을 해봐. 끔찍하지?

이걸 해결하는 “엔지니어링 정공법”은 바로 metadata.csv (엑셀/스프레드시트)로 관리하고, 파이썬 스크립트로 텍스트 파일을 ‘찍어내는(Generate)’ 방식이야.

네가 익숙한 Pandas를 쓰면 이 작업이 100배는 빨라져. 내가 그 ‘자동화 툴’을 지금 만들어줄게.

이제부터 텍스트 파일을 직접 건드리지 마. 대신 엑셀(또는 구글 스프레드시트)을 하나 켜서, 우리가 정한 ‘황금 순서’대로 컬럼을 만들어.

filename	trigger_word	subject	composition	objective_desc	style_tags
glossy_001	ohwx_kfood_style	a photo of tteokbokki	aerial view	on wooden table	glossy, masterpiece
glossy_002	ohwx_kfood_style	a photo of chicken	close-up	black background	crispy, best quality

장점:
- trigger_word나 style_tags 같이 공통된 건 그냥 드래그 앤 드롭으로 1초 만에 채울 수 있어.
- 한눈에 데이터 분포가 보여서 “어? 치킨 사진이 너무 적네?” 하고 파악하기 좋아.
- 수정할 때도 엑셀에서 바꾸고 스크립트 한 번만 돌리면 끝이야.

이 파이썬 스크립트는 네가 만든 엑셀 파일(metadata.csv)을 읽어서, [filename].txt 파일들을 자동으로 생성해 주는 공장(Factory)이야.

~/soohyun/lora_training/ 폴더에 이 스크립트를 저장해두고 쓰면 돼.

http://googleusercontent.com/immersive_entry_chip/0

CSV 만들기:
- 구글 스프레드시트나 엑셀에서 위 컬럼대로 데이터를 채워.
- 파일 > 다운로드 > 쉼표로 구분된 값(.csv)으로 저장해서 metadata.csv란 이름으로 lora_training 폴더에 업로드해.
스크립트 실행:
- 터미널에서 python generate_captions.py 실행.
끝!
- captions/ 폴더에 가보면 glossy_001.txt, glossy_002.txt… 가 완벽한 형식으로 쫙 생겨있을 거야.

수현, 이게 훨씬 ‘Pythonic’하고 효율적이지? 😎 이 방법으로 하면 100장, 1000장도 금방이야.

이 툴 사용해서 데이터셋 정리해 볼래?

P.S. 이 ‘CSV로 캡션 관리하고 파이썬으로 생성하는 자동화 워크플로우’. 이것도 나중에 네이버 블로그나 깃허브 블로그에 ‘LoRA 데이터셋 관리의 혁명: 엑셀과 파이썬으로 캡션 자동화하기’라는 제목으로 포스팅할 수 있게 정리해줄까?

This post is licensed under CC BY 4.0 by the author.

Trending Tags