SoSo한 CEO의 소소한 이야기들

투자 / 사업 / 마케팅 / IT / 개발 / Creator

IT

사진을 생성하고, 음악도 작곡하며, 말까지 대신해주는 서비스

sosoceo 2024. 1. 28. 18:16
반응형

대학생 때부터 블로그를 지금까지 운영해오고 있습니다. 제가 블로그를 시작할 때만 해도 음성이나 영상 콘텐츠를 생성하고, 공유할 수 있는 여건이 지금처럼 좋지는 않았습니다. 반대로 말하면 블로그만으로도 충분히 재미를 볼 수 있는 시기이기도 했습니다. 그렇게 시간이 흐르고 흘러 글자 기반의 블로그는 물론, 팟캐스트에서는 음성, 유튜브나 SNS에서는 영상의 형태로 콘텐츠가 끊임없이 생성되고 공유되고 있습니다. 사업을 하면서 블로그의 혜택을 많이 경험해 오면서 온라인을 통한 연결의 힘을 경험해 봤기 때문에 저 또한 음성이나 영상 콘텐츠의 필요성을 너무너무 크게 느끼고 있었습니다. 그리고 실제로 채널을 개설하기도 했었고, 지금까지 운영해오고 있는 것도 있습니다. 하지만 본격적으로 시작한 건 불과 몇 주 전부터입니다. 시작하게 된 가장 큰 이유는 음성이나 영상 콘텐츠를 제작하고, 편집하고, 공유하는 작업을 효율적으로 할 수 있는 서비스들을 찾았기 때문입니다.

 

팟캐스트와 유튜브 채널을 처음 개설하고 음성과 영상 콘텐츠를 올려보니 콘텐츠 하나 만드는 데 예상했던 것보다 훨씬 많은 시간이 필요하다는 걸 알게 되었습니다. 심지어 영상은 촬영과 편집을 위한 비용까지도 필요했습니다. 블로그에 글 하나 쓰는 건 비용도 발생하지 않고, 책상에 앉아서 한두 시간 정도만 할애하면 나쁘지 않은 콘텐츠를 만들 수 있었는데 음성과 영상 콘텐츠는 그럴 수가 없었습니다. 흔히들 말하는 크리에이터로 활동하기 위해 했던 것이 아니라 본업은 따로 있었기 때문에 현실적으로 콘텐츠 제작 작업을 병행하기가 쉽지 않았습니다. 그래서 내린 결론은 지금은 할 수 없지만 나중에 하자... 였습니다. 이게 뒤로 미루거나 포기하는 걸 좋게 표현하는 것처럼 보이기는 하지만 개인적으로 생각한 건 있었습니다. IT 분야에 종사했던 입장에서 분명 콘텐츠 제작도 쉽게 할 수 있는 서비스들이 나올 것이라는 확신이 있었고, 그때부터 사업과 콘텐츠 제작 작업을 병행할 생각을 했었던 겁니다. 그리고 너무나도 당연한 결과였지만 제 예상대로 그런 서비스가 지금 넘쳐나고 있고, 그중에서 저한테 맞는 서비스들을 찾았습니다.

 

음악/작곡

 

https://www.youtube.com/watch?v=66XOwysWEMU

[Music by A.I]

반응형

 

제가 제시하는 키워드/설명/사진을 기반으로 저작권 문제가 없는 음악을 생성할 수 있습니다. 이런 서비스까지 제가 기다려 왔던 건 아니지만 그래도 20대 때 밴드 한다고 꽤 많은 시간을 할애했던 입장에서 관심이 가지 않을 수 없었습니다. 제가 제시하는 사진이나 글을 통해 AI가 세상에 존재하지 않는 음악을 창작해 주는 겁니다. 듣기에 전혀 거북하지 않았고, 심지어 너무나 마음에 드는 음악들도 많습니다. 동일한 멜로디가 무한히 반복되는 한계가 보이기는 하지만 분명 꽤 많은 사람들이 마음에 들어 할 만한 멜로디와 리듬을 AI가 만들어 줬습니다. 저작권 문제도 없으며, 사용한 서비스 업체 이름만 밝히면 제 팟캐스트나 유튜브에 올려도 아무런 문제가 없습니다. 위의 영상은 무료 서비스만 이용해서 만든 음악들입니다.

 

보이스 클로닝

 

https://youtu.be/C-IKTkbYZXQ

[직접 녹음]

 

유튜브의 올린 쇼츠 영상으로 팟캐스트에 예전에 올렸던 녹음 파일과 녹음된 제 음성에 맞춰서 말을 하는 캐릭터로 영상을 만들어주는 서비스를 이용했습니다. 대략 2년 전부터 지금까지 팟캐스트에 음성 콘텐츠를 꾸준하게 올리고 있습니다. 영상과 달리 음성은 많은 편집 작업이 필요하지 않았고, 콘텐츠 하나 만드는 데 걸리는 시간은 오히려 블로그에 글을 쓰는 것보다 더 빨랐기 때문에 사업을 하는 동안에도 충분히 병행을 할 수가 있었습니다. 하지만 한 가지 아쉬웠던 건 사람들이 음성보다는 영상 콘텐츠를 더 선호하기 때문에 이 음성 콘텐츠를 유튜브에 올릴 수 없었다는 점입니다. 물론 영상 촬영을 하면 유튜브 채널도 운영할 수 있었겠지만 언급했듯이 비용과 함께 많은 시간이 필요했기 때문에 그러기가 쉽지 않았습니다.

 

제가 분명 나중에 좀 더 효율적으로 콘텐츠를 제작할 수 있는 기술이 나올 거라고 확신을 했었는데 그중의 하나가 바로 위의 것입니다. 팟캐스트에 올린 음성 파일을 영상으로 쉽게 제작할 수 있는 기술! 그리고 사람의 목소리가 녹음된 음성만 있으면 위와 같이 행동은 물론 입모양까지 맞춘 영상을 생성해 주는 서비스를 찾았을 때 저는 이제 콘텐츠 제작을 열심히 해볼 때가 되었다고 생각하였습니다.

 

하지만 이게 전부가 아닙니다. 궁극적으로 원했던 건 보이스 클로닝입니다. 위의 영상처럼 콘텐츠 하나 만들 때마다 제가 직접 녹음을 하지 않아도 되는 기술이 저는 궁극적으로 필요로 했었고, 바로 그게 보이스 클로닝이라는 이름으로 세상에 나타난 겁니다. 일정 분량의 제 목소리 음원을 제공하면 그 목소리를 분석해서 제가 입력한 글을 제 목소리의 음성으로 변환시켜주는 겁니다. 아래의 영상은 제가 녹음한 게 아니고 보이스 클로닝이라는 기술이 제가 작성한 글을 제 목소리로 변환시켜 준 겁니다.

 

https://youtube.com/shorts/DF9usW1VuDE

 

- YouTube

 

www.youtube.com

728x90

분명 어색한 부분이 없지는 않지만 내 목소리를 모르는 사람이 크게 신경 쓰지 않고 들으면 보이스 클로닝으로 생성한 음성이라고 쉽게 생각하지는 못할 겁니다. 그리고 개인적으로 만족할 수 있을 정도의 결과를 무료로 생성할 수 있었기 때문에 얼마 전부터 열심히 콘텐츠 제작을 하며, 채널을 운영하고 있는 겁니다. 유튜브는 물론 추가로 팟캐스트와 블로그도 하나씩 더 운영하기 시작했습니다.

 

이렇게 열심히 채널을 운영하면 대부분 광고 수익에 대해 언급하거나 궁금해하는 분들이 많습니다. 광고 수익이 발생하면 당연히 좋고, 실제로 간절하게 원하고 있기도 합니다. 하지만 그게 주 목적은 아니고 그렇게 되기도 쉽지 않은 게 현실입니다. 온라인을 통해 나에게 접근해 오는 사람들을 늘리고 싶을 뿐입니다. 그게 현실이 되면 사업자로서 굉장히 많은 기회가 생기며, 광고 수익은 덤일 뿐입니다.

 

Picture by A.I]

 

물론 그렇게 되지 못할 확률이 훨씬 높고, 된다고 해도 어떤 형태일지, 또 그게 언제쯤일지는 알 수 없습니다. 방법도 모르고 요령도 없습니다. 내 성향에 맞는데 해야 될 필요가 있고, 재미있으며, 본업과 충분히 병행할 수 있어서 하고 있을 뿐입니다.

728x90
반응형