티스토리 뷰

엑셀을 사용하여 SRT 또는 SMI 자막 파일을 TXT 파일로 변환하는 방법은 매우 간단합니다. 이 방법은 자막 파일에서 싱크 정보와 HTML 태그를 제거하고, 텍스트만 추출하여 깔끔한 TXT 파일로 저장하는 데 유용합니다.

 

아래 단계별 가이드를 통해 엑셀을 활용해 자막 파일을 변환하는 방법을 알아보겠습니다.

엑셀을 이용한 SRT, SMI 파일을 TXT로 변환하는 방법

1. 엑셀에서 자막 파일 열기

먼저, 엑셀 프로그램을 실행한 후 자막 파일(SRT 또는 SMI)을 엑셀로 불러옵니다. 이때, 파일 탐색기에서 자막 파일을 엑셀 창으로 드래그 앤 드롭하면 됩니다. 이 과정에서 경고 메시지가 뜰 수 있는데, 무시하고 계속 진행합니다.

2. 데이터 정리

자막 파일을 엑셀에 불러오면, 화면에 자막의 텍스트뿐만 아니라 싱크 정보와 HTML 태그가 함께 표시됩니다. 이 태그들은 자막의 싱크를 맞추기 위한 정보이므로, 텍스트만 필요할 경우 이를 삭제해야 합니다.

엑셀은 데이터에서 HTML 태그나 싱크 정보를 자동으로 인식하지 않기 때문에, 이를 수동으로 삭제하거나 특정 패턴을 이용해 필터링할 수 있습니다. 예를 들어, <SYNC>와 같은 태그는 엑셀의 찾기 및 바꾸기 기능(Ctrl + H)을 사용해 한 번에 제거할 수 있습니다.

3. 텍스트만 남기고 저장

필요 없는 태그나 숫자 정보를 삭제한 후, 이제 텍스트만 남은 상태에서 파일을 저장합니다. 다른 이름으로 저장 기능(F12)을 사용하여 파일 형식을 유니코드 텍스트(.txt)로 선택합니다. 이때, 유니코드 형식을 선택해야 한글이나 다른 언어의 특수 문자가 깨지지 않고 제대로 저장됩니다.

4. 경고창 처리

파일을 저장할 때 경고창이 뜰 수 있는데, 이는 원본 자막 파일이 손상될 수 있다는 경고입니다. 하지만 우리는 새로운 TXT 파일로 저장하는 것이므로, 원본 자막 파일에는 영향을 주지 않습니다. 따라서 경고창에서 아니오를 눌러 원본 파일을 보존하고 계속 진행합니다.

5. 여러 자막 파일 합치기 (선택 사항)

여러 개의 자막 파일을 하나의 TXT 파일로 합치고 싶다면, 명령 프롬프트를 이용할 수 있습니다. 모든 자막 텍스트 파일들을 하나의 폴더에 모은 후, 해당 폴더에서 Shift + 마우스 우클릭하여 "여기서 명령 창 열기"를 선택합니다. 명령 프롬프트 창이 열리면 다음 명령어를 입력합니다:

type *.txt > 합칠파일이름.txt_

이 명령어는 폴더 내 모든 TXT 파일들을 하나로 합치는 명령어입니다. 이후 생성된 파일의 확장자를 .txt_에서 .txt로 변경하면 완료됩니다.

SRT 및 SMI 자막의 구조

SRT와 SMI 자막 파일에는 시간대와 싱크 정보가 포함되어 있습니다. 예를 들어, SRT 자막은 다음과 같은 형식을 가집니다:

1
00:00:01,000 --> 00:00:04,000
Hello, how are you?

2
00:00:05,000 --> 00:00:07,000
I'm fine, thank you.

SMI 파일은 HTML 태그와 비슷한 구조로 되어 있으며 <SYNC> 태그가 포함되어 있습니다:

<SYNC Start=1000><P Class=KRCC>
Hello, how are you?
<SYNC Start=5000><P Class=KRCC>
I'm fine, thank you.

엑셀을 사용하면 이러한 시간대 정보나 태그들을 쉽게 제거하고 순수 텍스트만 추출할 수 있습니다.

온라인 도구를 통한 변환 방법 (대안)

엑셀을 사용하는 방법 외에도 온라인 도구를 통해 자막 파일을 TXT로 변환할 수 있습니다. 예를 들어 Subtitle Tools와 같은 웹사이트에서는 SRT뿐만 아니라 ASS, SSA, SMI 등 다양한 자막 형식을 지원하며 빠르게 텍스트만 추출할 수 있습니다.

  1. 웹사이트에 접속하여 Choose Files 버튼을 클릭해 변환하려는 자막 파일(SRT 또는 SMI)을 업로드합니다.
  2. 업로드 후 Extract Text 버튼을 클릭하면 순수 텍스트가 추출된 새로운 파일을 다운로드할 수 있습니다.

이 방법은 별도의 프로그램 설치 없이 간편하게 사용할 수 있어 많은 사용자들이 선호하는 방식입니다.

 

결론

엑셀을 이용해 SRT 또는 SMI 자막 파일을 TXT로 변환하는 방법은 비교적 간단하며 효과적입니다. 특히 불필요한 싱크 정보나 HTML 태그를 제거하고 텍스트만 남기는 작업에 적합합니다. 또한 여러 개의 자막 파일을 하나로 합치거나 온라인 도구를 사용하는 대안도 고려해볼 만합니다.

 

텍스트 추출 후에는 어학 공부나 대본 작성 등 다양한 용도로 활용할 수 있어 매우 유용한 방식입니다.