오디오를 텍스트로 변환하기 위한 두 가지 전사 도구

디지털 시대가 진행됨에 따라 콘텐츠 제작은 계속해서 매우 중요합니다. 특히, 비디오 제작은 소셜 미디어가 중심이 되는 세상에서 영향력 있는 사람으로 부상하기 위해 노력하는 개인과 현재 비디오를 활용하는 기업의 63%, 그리고 그 중 82%가 비디오 제작의 중요성을 계속해서 증가하고 있습니다. 전략의 중요한 부분입니다. 한편, 팟캐스팅은 호황을 누리고 있으며 계속될 것으로 예상됩니다.

그러나 단순히 이 오디오 및/또는 시각적 콘텐츠를 제작하는 것만으로는 충분하지 않습니다. 콘텐츠 마케팅의 일은 사람들이 당신이 만든 것을 찾도록 돕는 것까지 확장됩니다.

소셜 미디어를 활용하는 것 외에도 여기에서 SEO (검색 엔진 최적화)가 중요한 역할을 합니다. 즉, 키워드를 제공하고 Google 과 같은 검색 엔진이 귀하의 콘텐츠를 발견하는 데 도움이 되는 기타 모범 사례를 사용합니다.

전사가 중요한 이유

좋은 필사 도구는 SEO(SEO) 와 전체 콘텐츠 볼륨을 높이는 데 큰 차이를 만들 수 있습니다. 트랜스크립션 프로세스를 자동화하거나 오디오를 수동으로 트랜스크립션할 수 있는 고급 플랫폼을 제공하는 플랫폼을 활용하면 보다 풍부한 콘텐츠(이 경우에는 사용자가 사용하는 오디오 또는 비디오 콘텐츠와 직접적으로 관련된 콘텐츠)로 웹 존재를 즉시 높일 수 있습니다. 적은 노력으로 사람들이 발견하기를 원합니다.

물론 정확한 인용문과 줄거리가 있는 기사를 작성할 목적으로 대화를 녹음하는 것과 같이 필사 도구를 사용하는 다른 이유가 있을 수 있습니다.

또는 이미 지나간 사랑하는 사람과의 대화를 녹음했고 그 순간을 다른 사람이 다시 읽어볼 수 있는 형식으로 보존하고 싶을 수도 있습니다.

(Regardless)오디오 기반 콘텐츠를 제작하는 이유에 관계없이 이를 전사하는 것은 현명한 조치일 수 있습니다. 그것이 당신에게 가치 있는 것처럼 들리면 무료에서 구독 기반에 이르기까지 선택할 수 있는 사용 가능한 전사 도구가 많이 있습니다.

다음은 고유한 이점을 제공하므로 즉시 조사할 가치가 있는 세 가지입니다.

아마존 Transcribe

유형: (Type:)자동 전사
( Automatic Transcription)사용자: (User: )기업; 개발자; 마케터
(Businesses; Developers; Marketers)비용: (Cost:)종량제( Pay-as-you-go)

Amazon 이 산업 전반에 걸쳐 입지를 계속 확장 하는 동안 자회사인 Amazon Web Services ( AWS )는 온디맨드 클라우드 컴퓨팅 플랫폼의 폭과 깊이를 계속 확장하여 개발자 도구에서 분석, 자동 전사 및 더. Amazon Transcribe 가 그토록 가치 있는 이유는 다음과 같습니다 .

앱 개발자를 위한 ASR

처음 생각하면 개발자에게 도구를 제공하는 회사가 Amazon Transcribe 와 같은 자동 음성 인식( (Amazon Transcribe)ASR ) 서비스 를 제공하는 이유가 의아할 수 있습니다 . 디지털 시대에 스마트 애플리케이션 구축의 중요성을 고려할 때 많은 의미가 있습니다.

AWS Transcribe 를 사용하면 개발자가 애플리케이션에 음성을 텍스트로 변환하는 기능을 구축할 수 있습니다. 이것이 비즈니스에 유용할 수 있는 곳은 고객과의 통화를 녹음하거나 오디오 및 비디오 자막을 생성할 때 입니다(Amazon) .

다시 말하지만, 이는 풍부한 콘텐츠 볼륨을 늘리려고 하고 기존 오디오 콘텐츠를 텍스트로 변환한 다음 키워드가 풍부한 블로그 게시물, 기사 등을 만드는 데 사용할 수 있는 방법이 필요한 마케팅 담당자에게도 유용할 것입니다.

모든 것을 자동화

일반적인 프로세스를 자동화하는 것은 한 가지이지만 사실 이후에 사용자가 관리해야 할 부분을 남겨둡니다. Amazon Transcribe 에 대한 AWS의 목표 는 다음을 포함하되 이에 국한되지 않는 다양한 고급 기능으로 사용자에게 가능한 한 적은 작업을 남겨두는 것입니다.

  • 편집된 텍스트 변환: (Edited Transcriptions: )Amazon Transcribe 는 텍스트 덤프를 제공하는 대신 기계 학습을 활용하여 구두점이 필요한 위치를 이해하고 텍스트 출력 형식을 지정하여 준비하기 쉽고 편집이 거의 또는 전혀 필요하지 않도록 합니다.
  • 타임스탬프:(Timestamps: ) 필사 도구에는 각 단어에 대한 타임스탬프가 포함되어 있어 텍스트를 검색하는 것만으로 원본 녹음의 오디오를 식별할 수 있습니다.
  • 사용자 지정 어휘:(Custom Vocabulary: ) 특정 단어가 잘못 해석되지 않도록 AWS Transcribe 가 인식 하는 어휘를 확장하고 사용자 지정할 수 있습니다 . 이것은 필사 도구가 믿을 수 없을 정도로 정확하도록 도와줍니다.
  • 다중 화자 인식:(Multiple-Speaker Recognition: ) 오디오에 다중 화자가 포함된 경우 Amazon Transcribe 는 새로운 사람이 말할 때를 인식하고 이 이해를 녹음에 적용하여 편집할 때 화자를 올바르게 식별하는 시간을 절약할 수 있습니다.
  • 실시간 기록:(Real-Time Transcription: ) 이 기록 도구를 사용하여 기록을 기록하기 위해 기다릴 필요가 없습니다. 오디오를 라이브 스트리밍하는 경우 HTTP 2(HTTP 2) 프로토콜을 통해 보안 연결을 통해 Amazon Transcribe 로 오디오를 전송하고 녹음된 오디오의 실시간 스트림을 다시 받을 수 있습니다.

사용 가능한 모든 기능과 기능을 활용하려면 깊은 기술 지식이 필요한 고급 전사 도구이지만 Amazon Transcribe 는 동시에 누구나 생산성 향상을 위해 활용할 수 있을 만큼 간단합니다. 더 자세히 설명하는 동영상은 다음과 같습니다.

Amazon Transcribe ( Google Speech , Temi , IBM Watson 등) 에 필적하는 다른 전사 도구가 있지만 사실 AWS 는 이미 대부분의 기업에서 유료로 활용하고 있는 광범위한 서비스와 도구를 제공하고 있습니다. 사용량에 따라 달라지며 Amazon Transcribe 를 포함하여 하나의 (Amazon Transcribe)AWS 계정 으로 모든 항목에 액세스할 수 있습니다 .

따라서 비즈니스, 개발자 및 마케터에게 탁월한 도구가 될 가능성이 높습니다.

진실: 사용자가 말하는 것

“Amazon Transcribe는 환상적이고 빠르지 만 완벽하지는 않습니다. 귀하 또는 다른 사람이 돌아가서 오디오의 텍스트를 다시 확인해야 합니다. 성가신 일입니다. 하지만 모든 것을 수동으로 입력해야 하는 것보다 훨씬 덜 ... 당신이 또한 영리한 코더라면 살펴보기에 정말 깔끔하고 시간을 절약할 수 있는 프로세스가 될 수 있습니다. 하지만 당신이 나처럼 단순한 비디오 친구라면 이 과정은 여전히 ​​당신을 위해 일할 수 있습니다.”(“Amazon Transcribe is fantastic and fast but its not perfect, you or someone else should go back and double check the text to the audio. Annoying, yes, but way less so than having to type it all up manually … if you are also a clever coder this could be a really neat and time saving process to look in to. But if you are just a simple video dude like myself, this process can still work for you.”)

o기록하다

유형: (Type:)수동 전사
( Manual Transcription)사용자: (User: )언론인; 마케터; 비전문가 
(Journalists; Marketers; Nonprofessionals )비용: (Cost:)무료( Free)

자동화할 수 있다고 해서 항상 해야 하는 것은 아닙니다. 때때로 이것은 필사본의 경우입니다.

Amazon Transcribe 와 같은 고급 자동화 전사 도구가 시간과 에너지를 절약해 주기는 하지만 때로는 oTranscribe 와 같은 브라우저 기반의 오픈 소스 수동 전사 도구를 사용하는 것이 더 똑똑한 경우도 있습니다 .

개인화하기

수동 전사 도구의 이점은 향상된 단어 인식 정확도에서 화자 및 오디오 중첩의 더 나은 식별에 이르기까지 많습니다. 뿐만 아니라 오디오를 수동으로 전사하면 사람이 콘텐츠에 훨씬 더 익숙해질 수 있습니다.

이것은 예를 들어 당신이 녹음된 인터뷰를 옮겨 적는 기자이고 당신이 쓰고 있는 것이 무엇인지, 주제의 통찰력이나 부족이 이야기에 어떻게 기여할 것인지 깊이 이해해야 하는 경우에 유용할 수 있습니다.

재생 속도 제어

물론 수동 필사본의 가장 큰 문제는 텍스트를 입력할 때 오디오 트랙에 보조를 맞추는 동시에 단어와 문장 및 대화의 실제 구조와 관련하여 정확성을 유지하는 것입니다.

예를 들어, 대화가 한 단락에서 함께 속하는 경우 또는 대화의 주제가 변경되어 새로운 섹션이 필요한 경우를 이해합니다. 이 모든 것이 나중에 스크립트를 읽고 편집할 수 있는 효율성에 영향을 미칩니다.

oTranscribe의 중요한 기능은 오디오 속도 조절기입니다. 클릭하고 드래그하거나 전사 도구에 표시된 기능 키를 사용하여 조절기의 토글을 왼쪽으로 움직여 속도를 낮추거나 오른쪽으로 움직여 오디오 속도를 높일 수 있습니다.

이러한 유연성 덕분에 텍스트로 변환할 때 오디오에 보조를 맞추기가 더 쉬울 뿐만 아니라 단어나 문구가 느리거나 빠른 속도로 더 잘 전달되는 경우 더 명확성을 얻을 수 있습니다.

전사 + 편집 + 저장

oTranscription의 가장 큰 이점은 앱 내에서 모든 작업을 수행할 수 있다는 것입니다. 결과를 내보낼 준비가 될 때까지 나갈 필요가 없습니다. 오디오를 업로드하고 재생 속도를 설정하고 나면 다른 표준 텍스트 편집기 기능을 활용하여 전사 품질을 즉시 높일 수 있습니다.

텍스트를 굵게 및 기울임꼴로 표시하는 것부터 타임스탬프 포함, 현재 스크립트의 단어 수 확인에 이르기까지 oTranscribe는 전사 도구에 필요한 기본 사항을 제공합니다.

필사하는 동안 oTranscribe는 작업을 매초 브라우저의 저장소에 자동으로 저장합니다. 또한 5분마다 저장되는 이전 버전을 볼 수 있는 스크립트 기록을 제공하며, 트랜스크립션 도구는 항상 이러한 버전을 최대 100개까지 저장합니다.

내보낼 준비가 되면 파일을 마크다운, 텍스트 또는 oTranscribe 파일로 다운로드하거나 Google 드라이브(Google Drive) 에 파일로 업로드 하여 전사 도구에서 다른 플랫폼으로 원활하게 전환할 수 있습니다.

진실: 사용자가 말하는 것

“저는 oTranscribe를 사용합니다. 나는 'ums'를 생략하고 읽을 때 의미가 없는 구문 오류를 수정합니다.”(“I use oTranscribe. I leave out ‘ums’ and fix any syntax errors that won’t make sense when being read.”)

“+1 for oTranscribe, that service is gold.”

도구 선택

팟캐스트 에피소드를 필사할 때 프로세스를 자동화하는 필사 도구를 사용하는 것이 좋습니다. 그러나 기사를 작성할 때 이야기를 연결하고 눈에 띄는 인용문을 찾는 경우 오디오를 수동으로 전사하는 것이 더 도움이 될 수 있습니다.

이러한 작업을 수행하는 데 사용하는 도구는 개인의 선호도, 기술 적성 및 비용이 가장 큰 요인일 것입니다.



About the author

저는 이 분야에서 거의 10년의 경험을 가진 소프트웨어 엔지니어이자 블로거입니다. 저는 Mac 및 Windows 플랫폼을 위한 도구 리뷰 및 튜토리얼 제작을 전문으로 할 뿐만 아니라 소프트웨어 개발 주제에 대한 전문가 논평을 제공합니다. 저는 또한 전 세계의 기술 컨퍼런스에서 프레젠테이션을 한 전문 연사이자 강사입니다.



Related posts