두 달 전, 브루노 마스가 뉴진스의 hype boy를 커버한 영상이 180만 뷰를 넘을 정도로 많은 인기를 끌었어요. 세계적인 스타가 우리나라 가수의 노래를 부르다니! 설렘 반, 기대 반으로 영상을 클릭한 사람들은 신선한 반전을 맛보게 되었습니다. 해당 영상은 인공지능이 브루노 마스의 목소리를 따라한 것이었는데요. AI Cover라는 이름으로 자신이 좋아하는 가수가 노래를 부르는 음성을 업로드하고, AI 성우를 이용해 더빙한 영상을 올리는 것이 유행처럼 번지고 있습니다. AI가 내는 목소리는 언제 이렇게 발전했을까요?🥰
내 목소리 아니지롱!🎤🎤 TTS 유튜버의 등장
최근, 유튜브에 TTS(Text to Speech) 보이스 유튜버가 증가하고 있습니다! TTS 유튜버들은 본인이 직접 목소리를 사용하지 않고, AI 프로그램을 통해 제작된 ‘인공지능 목소리’를 사용해 스크립트를 읽는데요. 요리 유튜버, 리뷰 유튜버 등 다양한 분야에서 TTS가 활용되고 있어요. 인공지능을 사용하면 발음 문제 및 신상 정보 문제가 자연스럽게 해결된다는 장점이 있죠!
‘마늘보쌈 레시피’로 유명한 유튜버 ‘1분 요리 뚝딱이형’은 사투리를 쓰는 남자와 초등학생의 만담 형식 요리 채널로 유명세를 치렀습니다. 사실 이 뚝딱이형과 초등학생의 목소리는 전부 인공지능인데요. 프리미엄 TTS 서비스를 제공하는 ‘타입캐스트’에서 두 명의 AI 목소리를 활용하여 영상을 만들고 있답니다.
👨🍳: “콘텐츠 제작할 때 자신의 목소리만을 사용하면 자칫 오디오가 단조로워질 수 있는데, 플랫폼의 성우를 통해 풍요로운 느낌을 만들어냈어요.”
뚝딱이형은 매체와의 인터뷰를 통해 AI 보이스의 장점을 강조했는데요. 감정 표현과 세밀한 높낮이 조절이 가능한 AI 보이스의 특성을 활용해 실제로 두 사람이 대화하는 것 같은 스토리라인의 영상을 제작할 수 있는 것이죠.
내 최애가 내 최애 노래를?🎶 AI 커버
AI 커버의 유행도 심상치 않습니다. 근래 전설적인 팝 가수 마이클 잭슨이 부른 피프티피프티의 ‘Cupid’, 퀸의 프레디 머큐리가 부른 ‘서른즈음에’ 등 다양한 AI 커버가 유튜브 알고리즘을 타고 퍼졌는데요.
방식은 간단합니다. 좋아하는 가수의 목소리가 담긴 자료를 학습시킨 뒤, 원하는 노래를 선택하면, 입력된 가수의 목소리로 변환되는 것이죠. 무료 사이트와 프로그램으로 제작 방식이 쉬워지자 팬들은 좋아하는 가수의 목소리로 다양한 노래를 쉽게 들을 수 있게 되었어요!
2022년에는 티빙에서 ALIVE라는 프로그램을 통해 별이 된 가수의 목소리를 AI로 복원했는데요. 아름다운 목소리로 많은 사랑을 받았던 울랄라세션 임윤택의 미공개 신곡이 AI 보이스를 사용해 발매되며 큰 감동을 선사했죠.
AI 커버! 저작권 문제는 없는 걸까?
AI 커버가 성행하며 자연스럽게 대두되는 우려가 있습니다. 바로 저작권 문제인데요. 이런 AI 커버 서비스, 저작권은 괜찮을까요? 정답은 바로 ‘아니오’입니다! AI 커버곡은 목소리 주인은 물론이고 원곡의 제작자 권리에도 영향을 끼치는데요. 영상을 제작해 업로드하는 순간 목소리 주인공의 인격표지영리권*과 원곡자의 음악 저작권이 침해될 수 있는 것이죠.
유튜브에 영상을 업로드하면 자동으로 저작권이 침해되는 음악의 존재 여부를 감별해 주는데요. AI 커버는 원곡과 목소리가 다르므로 제대로 인식이 되지 않는다는 문제점도 존재해요. 만약 유튜브 측에서 저작권 여부를 제대로 가르지 못하면, 영상을 통해 발생한 수익이 원곡자가 아닌 유튜버에게 돌아갈 가능성도 있겠죠?
다만 아직까지 ‘AI 창작물’이 저작물로 분류 가능한지에 대한 기준이 명확하게 세워지지 않은 상황이에요. 따라서 AI 커버가 유행하지만 저작권 문제로 고소당한 사례, 영상이 내려간 사례도 공공연하게 확인되지 않고 있죠. 전문가들도 해당 문제에 대해 심도 있는 토론을 계속하고 있다고 해요. 하지만 목소리와 노래 자체에 저작권이 있는 만큼 제작·배포를 진행할 때 주의하는 것이 좋겠죠?
💡 인격표지영리권이란?
퍼블리시티권이라고도 하며 초상, 성명, 음성 등 본인을 특정하는 요소(인격표지)를 영리적으로 이용할 권리예요. 우리는 자신의 인격표지를 자유롭게 사용할 수 있고, 원한다면 타인에게 영리적 이용을 허락할 수 있죠.
AI 목소리의 활용! 우리에게 주어진 과제 📖
AI 보이스와 TTS가 발달하며 크고 작은 문제들도 발생하고 있어요. 비슷한 시기에 유튜브를 시작한 유튜버 A와 B는 같은 TTS 보이스를 사용하는 바람에 동일인이냐는 질문을 받으며 곤욕을 겪었는데요. A 유튜버가 결국 ‘해당 채널 외에 다른 채널을 사용하고 있지 않다’라고 공지를 올리며 동일 인물설은 일단락됐어요. 목소리의 종류에 한계가 있는 TTS의 특성상 또 어떤 유튜버들의 콘셉트 및 AI 보이스가 겹칠지 모르는 일이지요.
일반적인 여자아이와 비슷한 AI 목소리를 통해 보이스 피싱을 진행한 범죄 사례도 있는데요. 딥페이크로 가족의 모방 음성을 내 수신자가 속을 수밖에 없는 구조를 만들어낸 거죠. 이런 식이면 더는 ‘통화 상대’를 믿을 수 없는 시대가 올 것 같다는 우려의 목소리도 커지고 있어요.
하지만 지금! 다양한 기업에서 AI 보이스 피싱 탐지 시스템을 개발하며 사례 방지에 힘쓰고 있답니다. 대표적으로 KT에서 개발한 솔루션은 보이스 피싱 범죄자들의 목소리, 말투, 단어를 학습하고, 패턴을 분석해 보이스 피싱을 구분할 수도 있죠.
정부 측에서도 지난 9일부터 다양한 피싱 가담자의 목소리를 묶고 분석하는 AI 기반 단속 프로그램을 도입했는데요. 이로 인해 각 범죄의 음성데이터를 1대 1로 비교해 유사성을 즉시 판별해 범죄 여부를 판가름할 수 있게 됐죠. 앞으로 이 AI 프로그램이 보이스 피싱 범죄를 막고, 수사 속도를 높이는 것에 큰 영향을 끼칠 것으로 기대되고 있어요!
AI 보이스가 상용화되면 좋아하는 목소리를 마음껏 들을 수도 있겠지만, 유명인들의 목소리가 나쁜 방향으로 악용될 수도 있는데요. 다양한 기업에서 AI에 대응하는 AI를 개발하며, 사람들에게 이로운 방향으로 발전을 꾀하고 있어요. 하지만 그만큼 우리도 AI 보이스의 무분별한 사용에 대해 경각심을 가지고 방향성에 대해 고민할 기회를 마련하면 더욱 좋겠죠? 😉