음성 녹음을 자동으로 받아적기 (STT)

폰에는 음성 녹음앱있지요. 통화 녹음이나 혹은 간단한 메모를 하는 용도로만 알고 있었는데 얼마전 음성인식 기능이 있는 것을 알고 보다 상세히 알아본 내용을 공유합니다.

제 폰은 갤럭시노트 10모델인데요. 폰 마다 녹음앱 정도는 기본으로 설치되어 있을텐데 노트10에는 [삼성 음성 녹음]이라는 앱이 기본으로 설치되어 있네요.

삼성 음성 녹음 앱과 STT

이런 UI를 가지고 있습니다.

지인들과 음성 녹음한 결과를 받아쓰기하는 방법에 대해서 이야기를 나누다보니 음성 녹음을 그대로 텍스트로 인식해주는 앱이 있다는 겁니다. 혹시나 해서 찾아보니 우측 상단에 [텍스트 변환]이라는 버튼이 있어서 이것인가 싶어서 기능을 실행해봅니다. [더보기]를 눌러보니 역시 그런 기능이 있습니다. STT 기능 (Speech to Text) 이라고 하는 것인가봅니다.

실제 텍스트 변환 테스트

거두절미하고 한 번 문장을 읽어 보았습니다. 텍스트를 보시면 알겠지만 음성을 녹음하면서 오타 없이 정확하게 텍스트로 인식까지 하고 있는 것을 볼 수 있습니다.

텍스트를 눌러 녹음 부분 찾아 듣기

더욱 대단한 것은 인식이 된 상태에서 일정 텍스트를 누르게 되면 그 부분부터 플레이가 된다는 점이었습니다. 음성인식이 정확하지 않다던가 혹은 오리지널 녹음 내용을 확인할 필요가 있을때 해당 부분으로 바로 가게 해주는 기능이죠.

아이들을 관찰하고 그 내용을 논문으로 풀어쓰는 일을 많이 하는 제 아내가 엄청나게 감탄하고 좋아할 만한 기능이 기본앱의 기본 기능으로 구현되어 있네요.

아이들의 움직임을 관찰하는 경우 또박 또박 읽는 다던가 혹은 성인의 대화와는 다르게 음성인식율이 많이 떨어질 것을 걱정할 수 있을텐데요 확인해보니 떨어진다고 하더라도 초벌 텍스트라도 있는 것이 없는 것보다는 백배 효율적이라고 하고요, 또 위의 기능으로 텍스트를 눌러서 음성 녹음의 해당 위치로 곧바로 이동해서 확인할 수 있기 때문에 무척이나 유용해보인다고 합니다.

오늘은 갤럭시에 기본 탑재된 음성인식 앱과 텍스트로 받아쓰기 기능인 STT기능에 대해서 알아보고 그 응용에 대해서 살펴보았습니다.

녹음 파일의 자동 백업

이 녹음된 음성 파일은 삼성 클라우드에 백업을 하고 자동 백업을 걸어두시면 휴대폰 분실을 걱정하지 않고 안전하게 보존할 수 있습니다. 이 내용은 별도로 간단히 포스팅하려고 합니다.

 944 total views,  2 views today