본문 바로가기
HOWTO/IT | 컴퓨터

음성인식-자막제작하기

by Anakii 2023. 9. 7.

Whisper AI 라는 획기적인 AI가 있다. PC에 설치하는 방밥과 클라우드에 설치된 것을 이용하는 방법이 있는데 PC설치를 먼저 시도해 봤다가 실패 후 클라우드에 설치하고 이용하는 과정을 따라 해 봤다. 

Whisper AI PC설치

미리 설치할 것들 (3개)

Git https://git-scm.com/download/win 
파이썬 https://www.python.org/downloads/release/python-31011/
ffmpeg-release-essentials (release builds) 에센셜버전 https://www.gyan.dev/ffmpeg/builds/ 
마스터 빌드 대신 릴리즈 빌드에서 찾아보기

C:\ffmpeg\ffmpeg60폴더에 설치해 두었다.

본격설치 및 사용-실패

  1. Whisper-WebUI 설치 명령어 (설치를 원하는 폴더에서 터미널을 열고 실행) :
    git clone https://github.com/jhj0517/Whisper-WebUI.git
  2. 클로닝 한 폴더에서 Install.bat 실행  결과는 에러. 아마 그래픽카드가 없어서 그런 것 같기도 함.

웹 버전으로 시도해 보기

(참고영상 : https://youtu.be/ZQqGUEg1TLg?si=KsCrIGcyOMV0XEEk

내 WebUI 주소 : 하루 지나면 다시 인스톨레이션 - 실행 과정을 반복해야 함. : https://colab.research.google.com/drive/18v8_X5o0nd2TG2bWlRPs0xItrC7KXm70#scrollTo=PQroYRRZzQiN

 

 

네이버 클로바로 영상 자막 만들기

참고영상 https://www.youtube.com/watch?v=u5T8A7NT6tI&ab_channel=타이탄

1. 클로바 노트 작업 (영상의 대화를 듣고 시간대별로 받아쓰기 원문 만들기)

클로바에서 새 노트 만들기 - 언어선택 - 음성파일입력 (mp3) - 대화 내용을 받아쓰기함. 일반 사용자는 월간 300분까지 가능. 원어로 되어 있어 번역까지는 되지 않는다.  다 작성되면 대화 내용 저장에서 srt 확장자로 저장.

2. 팟플레이어에서 자동자막번역 중 파파고 번역 사용하기

  • 네이버 개발자센터 이동
  • 애플리케이션-애플리케이션 등록 선택
  • 처음이면 개인정보 인증받은 후 회사이름은 공란으로 둠
  • 애플리케이션 이름에 파파고 - 사용 API에 파파고 번역 - 환경추가에 Web설정 - 웹 서비스 URL에 http://naver.com 넣고 등록하기 하면 애플리케이션이 등록되고 아이디와 비번이 주어짐.
  • 팟플레이어 실행- 자막-실시간 자막번역 - 실시간 번역 설정 - 파파고 - 계정설정 에 받은 아이디와 비번을 넣는다.

3. 구글 번역이나 파파고 번역하여 자막 만들기

구글 번역은 3300자 한도가 있고, 파파고 번역은 한도는 없지만 영화 한 편 정도를 번역하니 68페이지로 분리되어서 일일이 번역-복사-붙이기 작업을 해야 한다.  묘안은 크롬 번역을 이용하는 것.

크롬을 실행하고 원어 자막 파일을 브라우저에 떨구면 번역 메세지가 나오며 번역한다. 번역된 것을 긁어 노트패드에서 srt확장자 파일로 저장하면 끝. 

문제점 : 번역 후 행 번호에 년이 붙는 경우가 많았다. 이러면 제대로 인식을 못하게 됨. 일일이 다 지워야 했다. 

작성한 자막을 업로드 했다.
올더스 헉슬리의 멋진 신세계 원작으로 1980년 NBCTV에서 제작한 영화 Brave New World.   https://youtu.be/DVN63RgihwY?si=ckNQA6WIdEyUZI-R