슬기로운 잉여생활/잉여력 충만한 Diary

MKV, MP4 내장 자막 추출하기

DOCKERNOIN 2026. 4. 11. 15:40

단순한 프로그램을 또 바이브 코딩으로 만들었다.
MKV나 MP4 파일 중에 내장 자막이 있는 경우 SRT나 ASS 파일 등으로 추출해 주는 프로그램.

자막 추출을 하려는데, 좀 찾아보면 FFmpeg이나 MKVToolNix 을 깔아서 어떻게 해야 하고 저쩌고 하도 복잡해서, 그냥 프로그램 하나로 할 수 있도록 만들어봤어.
FFmpeg이나 MKVToolNix 필요없음. 그냥 실행파일 하나만 단독으로 실행하면 됨.

가끔 한글자막을 지원하지 않는데, 여러 외국어 자막을 지원하는 영상파일이 있다면, (특히 일본어)
자막을 추출하여 AI를 이용하여 한국어로 번역하여 시청하면 나름 나쁘지 않은 결과물을 얻을 수 있어서
한번 만들어 보게 되었어.

특히 일본어가 있으면 번역 퀄리티가 조금 더 올라가는데,
이유는 아무래도, AI에서 한국어-일본어 번역퀄리티가 좀 좋은 편이기도 하거니와,
존대/반말이 존재하기 때문에, 아무래도 한국어로 번역시 조금 덜 어색한 번역이 이뤄지기 때문이야.

자 프로그램 소개부터 할께.


Universal Subtitle Extractor v3.2

프로그램 개요

MKV, MP4 동영상 파일에 내장된 자막을 추출하는 프로그램입니다. FFmpeg이나 MKVToolNix 같은 외부 도구 없이 단독 실행됩니다.


지원 형식

입력: MKV (.mkv), MP4 (.mp4, .m4v)
추출 가능한 자막 형식: SRT, ASS, SSA, WebVTT, tx3g(mov_text)
추출 불가: PGS(블루레이 이미지 자막), VobSub(DVD 이미지 자막), DVB Subtitle 등 이미지 기반 자막


사용 방법

  1. 프로그램을 실행합니다.
  2. 동영상 파일을 드래그 앤 드롭하거나 "동영상 파일 열기" 버튼으로 선택합니다.
  3. 내장 자막 트랙 목록이 표시됩니다.
  4. "자막 추출" 버튼을 클릭하면 원본 동영상과 같은 폴더에 자막 파일이 저장됩니다.

추출 파일명 규칙

기본 형식: 원본파일명_언어코드.확장자 (예: 탑건매버릭.mkv 영상파일 추출시)

상황파일명 예시
기본 탑건매버릭_kor.srt
특수 태그 (SDH, Forced 등) 탑건매버릭_eng_SDH.srt
언어 변형 (중국어 간체/번체 등) 탑건매버릭_chi_Traditional.ass
알 수 없는 언어 (und) 탑건매버릭_undefined.srt

자동 처리 규칙

중복 자막 제거: 같은 언어에 같은 태그의 자막이 여러 개 있으면 첫 번째만 추출하고 나머지는 건너뜁니다.

태그 자동 인식: 트랙 이름에서 아래 태그를 자동으로 감지하여 파일명에 반영합니다.

구분인식되는 태그
특수 목적 SDH, Forced, Commentary, CC, Signs, Songs
중국어 변형 Traditional, Simplified, Cantonese, Mandarin
스페인어 변형 Latin, Castilian, Spain, Mexico
포르투갈어 변형 Brazil, Portugal
프랑스어 변형 Canada, France, Belgium, Swiss
영어 변형 UK, US, Australian

단순 언어명 무시: 트랙 이름이 "English", "Korean", "日本語" 등 단순 언어명인 경우 태그로 추가하지 않습니다.

다운로드 :

SubtitleExtractor.exe
11.29MB

 

실제 사용 방법 예시 :

무설치로, 그냥 위 파일을 다운받아서 바로 실행하면 아래와 같은 창이 나타난다.

열기 버튼을 누르거나 드래그앤드롭으로 동영상을 넣어주면 분석을 해서 내장된 자막의 수를 보여준다.

내장자막은 영상파일마다 다르긴 하지만, 어떤 경우 매우 넉넉히(?) 넣어줘서 같은 언어가 두개씩 들어가 있는 경우도 있고,
코멘터리나 SDH, 또는 Forced 자막이 포함되어 있기도 하다.

SDH는 청각장애인용 자막 - 예를 들면 지문이 포함되어 있어. [긴장감 있는 음악] 같은 자막이 뜨는 것이 이 자막이야.
Forced는 영화에서 외국어 대사가 나올때, 예를 들면 미국 영화에 러시아 스파이끼리 대화하는 장면 같은 데서 나오는데에 잠깐씩 나오는 그 자막이야.

암튼 이런 것들을 중복된건 걸러서 뽑아내 주는 프로그램이야.

동영상을 끌어다 넣으면 아래와 같이 나오는데, 아래 동영상은 예를 위해 자막이 많이 들어간 파일을 골라서 넣어봤어.

사실 초기 버전은 자막이 41개가 나와서 다 살펴봤더니,
중복된 자막이 정말 많더라구. 그래서 어느정도 중복은 솎아내도록 작업한 거고,
그래도 같은 언어이더라도 (예를 들면 스페인어), 사용지역에 따라 조금씩 다른 것은 솎아내지 않고 그대로 추출하게 했어.

그래서 스페인용 스페인어와, 라틴아메리카용 스페인어가 따로 분리되도록 해놨어. 파일명엔 표시가 될꺼고.

아무튼 그래서 '자막 추출 버튼'을 누르면 추출하느라 잠깐 멈춰있을꺼야.
자막이 많을수록, 용량이 클수록 오래걸리니까 조금만 인내심을 갖고 기다리면,

위와 같이 추출되었다는 알림을 볼 수 있어.
저장위치는 영상이 있는 위치와 같은 폴더에 저장되어 있을꺼야.

파일명은 원본 영상파일명 위에 '_kor.srt' 와 같은 식으로 언어명을 붙여서 저장되어 있을꺼고,
특수한 경우, 예를 들어 중국어 번체/간체 등은 그 뒤에 또 simplified나 traditional등과 같이 추가 주석도 붙어있게 됨.

필요했던 분들은 잘 사용하시고, 혹시나 유용했다면 댓글이라도 남겨주고 가시길!!

반응형