반응형

2024년 4월 10일, 구글 딥마인드 출신 공학자들이 만든 오디오 및 음악 생성 인공지능 서비스인 Udio가 베타 버전을 공개했습니다. 이전에도 Suno, Stable Audio 등의 음악 생성 서비스가 있었지만, Udio 역시 간단한 프롬프트로 음악을 생성할 수 있는 획기적인 서비스를 선보였습니다.

Udio는 사용자가 원하는 음악 유형에 대한 설명을 입력하면, AI 시스템이 프롬프트에 맞게 독특하고 고품질의 음악을 생성합니다. 비록 인간이 작곡한 음악을 완전히 대체할 수는 없겠지만, 음악가와 음악 애호가 모두에게 강력한 도구가 될 것으로 기대되고 있습니다. 현재 사용자 급증으로 인한 서버 과부하 이슈를 겪고 있기는 하지만, 사람이 없는 시간대에는 40초 만에 30초짜리 곡 2개를 금방 만들어낼 수 있습니다. 음악 생성 인공지능 중에서는 굉장히 높은 퀄리티를 자랑하는 편입니다.

Udio 음악 생성기의 주요 기능으로는 자동 음악 생성, 포괄적인 메타데이터 생성, 다양한 음악 스타일 생성 등이 있습니다. 그럼 간략히 Udio AI의 사용법을 소개하겠습니다.


#1. Udio 시작하기

Udio를 사용하려면 먼저 계정을 만들어야 합니다. Udio 페이지로 이동하면 첫 페이지에서 우측 상단에 [Sign In] 버튼을 클릭합니다.

 

Udio | Make your music

Discover, create, and share music with the world.

www.udio.com

1) 회원가입 및 로그인
Udio와 유사한 이름의 사이트들이 있으니 주의하시기 바랍니다. 로그인 페이지에서는 세 가지 로그인 옵션이 제공됩니다. Google 계정을 사용하거나 X(Twitter) 계정, Discord 계정을 사용하여 Udio에 로그인할 수 있습니다.

로그인이 완료되면 display name을 입력하는 화면이 나타납니다. Display name은 Udio 내에서 사용자를 식별하는 이름으로, 다른 사용자들에게 보이게 됩니다. 원하는 display name을 입력한 후 [Submit] 버튼을 클릭하면 Udio의 메인 페이지로 이동하게 됩니다.

이제 Udio를 사용할 준비가 되었습니다.

2) 프롬프트 입력하기
로그인이 완료되면 Udio의 메인 페이지로 이동하게 됩니다. 페이지 상단에는 [Create] 버튼과 함께 "a song about a writer with writer's block"이라고 적혀 있는 프롬프트 입력창이 있습니다. 이 입력창을 클릭하면 창이 확장되어 더 많은 옵션을 설정할 수 있습니다. 확장된 프롬프트 입력창에는 다양한 기능이 있습니다. 먼저, Suggested tags(추천 태그)가 있는데, 이는 현재 입력한 태그와 잘 어울리는 태그들을 추천해 줍니다. 추천 태그를 클릭하면 프롬프트에 자동으로 추가되므로, 이를 활용하여 원하는 음악 스타일을 더욱 구체적으로 설명할 수 있습니다.

가사와 관련해서는 세 가지 옵션이 있습니다.

  • Custom: 직접 가사를 입력할 수 있습니다. 특별한 지시어(descriptor)를 사용하여 곡의 구조를 지정할 수도 있습니다. 예를 들어, [Verse], [Chorus], [Hook], [Guitar Solo], [Drop] 등을 사용하여 곡의 각 부분을 명시할 수 있습니다. 또한, 괄호를 사용하여 백 보컬을 지정할 수도 있습니다.
  • Instrumental: 가사 없이 순수한 연주곡을 만들고 싶다면 이 옵션을 선택하세요. 다만 완벽하게 보컬을 제거하지는 못할 수 있습니다
  • Auto-generated: 프롬프트를 기반으로 Udio가 자동으로 가사를 생성합니다. 이 옵션을 선택하면 가사에 대해 신경 쓰지 않아도 되므로 편리합니다.

프롬프트 입력 시에는 free-form text와 tags를 조합하여 사용할 수 있습니다. Free-form text는 자유롭게 설명하고 싶은 내용을 적는 부분이고, tags는 곡의 장르, 분위기, 악기 등을 지정하는 키워드입니다. 예를 들어, "a song about summer rain, jazz, mellow, warm"이라는 프롬프트에서 "a song about summer rain"은 free-form text이고, "jazz", "mellow", "warm"은 tags입니다. 프롬프트의 각 부분은 쉼표(,), 세미콜론(;), 마침표(.)로 구분합니다.

또한, 프롬프트에 아티스트 스타일을 언급하여 원하는 음악을 더 쉽게 설명할 수도 있습니다. 예를 들어, "a song about summer rain, jazz, mellow, warm, in the style of Billie Holiday"와 같이 프롬프트를 작성할 수 있습니다. 다만, Udio는 아티스트의 목소리를 그대로 사용하지는 않으며, 스타일 참조는 내부적으로 관련 태그 세트로 대체됩니다. 프롬프트를 입력했다면 [Create] 버튼을 클릭하여 음악을 생성합니다. 가사 언어에 대해서 한 가지 팁을 더 드리자면, Udio는 한글 가사도 잘 이해하고 처리합니다. 하지만 현재로서는 영어 가사를 사용했을 때 더 자연스럽고 완성도 높은 결과물이 나오는 편입니다. 이는 Udio의 학습 데이터에 영어 가사가 더 많이 포함되어 있기 때문일 것으로 추측됩니다. 한글 가사로도 충분히 멋진 음악을 만들 수 있으니 한글 가사로 도전해 보셔도 좋습니다.

3) 음악 생성하기
[ Create ]  버튼을 클릭하면 음악이 생성됩니다. Udio는 기본적으로 각 프롬프트 당 두 개의 음원을 생성합니다. 새로운 프롬프트로 음악을 만들고 싶다면 [Reset] 버튼을 클릭하여 프롬프트 입력창을 초기화할 수 있습니다.

베타 프로그램이 진행되는 동안에는 Udio를 무료로 이용하실 수 있으며 이 기간 동안 한 달에 최대 1,200곡까지 만들 수 있습니다.

#2. Manual mode 사용하기

기본적으로 [Create] 버튼을 클릭하면 입력한 프롬프트는 상당한 후처리 과정을 거칩니다. 프롬프트를 더 관련성 높은 세부 정보로 보완하고, 기본 모델이 더 쉽게 이해할 수 있는 형태로 변환하기 위한 것입니다. 이를 통해 낮은 수준의 프롬프트 조정에 대해 걱정할 필요 없이 손쉽게 좋은 결과를 얻을 수 있습니다.

하지만 때로는 모델에 입력되는 내용을 더 세밀하게 제어하고 싶거나, Udio의 프롬프트 재작성 방식이 마음에 들지 않을 수 있습니다. 이럴 때 Manual mode를 사용하면 유용합니다. 프롬프트 입력창에서 manual 스위치를 클릭하면 Manual mode를 활성화할 수 있습니다.

Manual mode에서는 모든 필수 재작성이 비활성화되며, 프롬프트는 거의 변경되지 않은 상태로 모델에 전달됩니다. 즉, 곡 설명을 더 신중하게 작성해야 하며, 태그만 허용되고 자유형식 텍스트는 사용할 수 없습니다. 물론 Manual mode에서도 거의 모든 것을 입력해 볼 수 있지만, Udio가 프롬프트를 올바르게 해석하지 못할 가능성이 높습니다. 이를 염두에 두고, 자동 완성 및 주 프롬프트 입력 아래의 태그 제안을 활용하여 태그의 정교한 조합을 실험해 볼 수 있습니다

#3. Extending tracks

Udio는 기본적으로 32초 길이의 음악 클립을 생성합니다. 이는 사용자가 다양한 음악 스타일과 아이디어를 빠르게 탐색할 수 있도록 하기 위함입니다. 하지만 대부분의 경우, 사용자는 이보다 더 긴 음악을 만들고 싶어 할 것입니다. 바로 이럴 때 Extending tracks 기능을 사용합니다.

Extension mode는 트랙 페이지에서 [Extend] 버튼을 클릭하거나, 컨텍스트 메뉴([...] 아이콘 클릭)에서 [Extend Track]을 선택하여 접근할 수 있습니다.

Extending tracks을 통해 사용자는 기존의 32초 클립에 추가 섹션을 덧붙여 최대 10개의 섹션으로 이루어진, 약 5분 길이의 음악을 만들 수 있습니다. 추가되는 섹션은 기존 클립의 앞이나 뒤에 위치할 수 있으며, 인트로나 아웃트로로 지정할 수도 있습니다.

다음으로, 기존 클립 뒤에 새로운 섹션을 추가해 보겠습니다. Extension Placement 영역에서 [Add Section] After를 선택한 후, 추가 가사를 입력합니다. 프롬프트와 가사 입력이 완료되었다면 [Extend]를 합니다.

Udio가 입력된 정보를 바탕으로 기존 클립과 자연스럽게 이어지는 새로운 섹션을 생성합니다. 이런 식으로 음악을 점진적으로 발전시켜 나가다 보면 어느새 완성도 높은 작품이 탄생할 것입니다. 확장된 음원도 두 개의 추가 음원으로 생성합니다. 

#4. Remixing tracks

Udio의 또 다른 멋진 기능은 리믹싱(remixing)입니다. 리믹스는 기존 클립을 미묘하게 또는 크게 변형한 버전입니다. 리믹스를 만들려면 먼저 적절한 트랙을 선택한 후(현재는 30초 트랙만 리믹스 가능), 트랙 페이지 또는 컨텍스트 메뉴에서 [Remix]를 클릭하세요.

오른쪽의 슬라이더를 사용하면 리믹싱 효과의 강도(Variance)를 조절할 수 있습니다. Variance 슬라이더가 가장 왼쪽에 위치해 있다면 리믹싱 효과가 거의 없는 것과 마찬가지입니다. 하지만 슬라이더를 오른쪽으로 이동할수록 리믹싱 효과가 점점 강해집니다. 슬라이더를 조금만 움직여도 미묘한 변화가 생기고, 많이 움직이면 원곡과는 상당히 다른 느낌의 음악이 만들어집니다. Variance 값이 낮을 때는 음악의 전체적인 구조와 화성은 유지한 채, 악기의 음색이나 드럼 패턴 같은 디테일한 부분에서 변화가 일어납니다. 반면 Variance 값이 높아지면 곡의 구조나 분위기까지도 크게 바뀌어, 원곡과는 전혀 다른 느낌의 음악이 탄생하기도 합니다.

리믹싱 과정에서는 프롬프트와 가사도 자유롭게 변경할 수 있습니다. 예를 들어 기존 프롬프트에 새로운 악기를 추가하거나, 아예 새로운 프롬프트를 입력하여 완전히 다른 장르의 음악을 만들어볼 수도 있죠. 이렇게 음악을 변주하고 조합하는 과정에서 사용자만의 독특한 아이디어를 실현해 볼 수 있습니다.

Remix 기능은 사용자가 자신의 음악을 다양하게 변주하고 발전시킬 수 있도록 돕습니다. 원곡의 느낌을 살짝 바꾸는 것부터, 완전히 새로운 음악을 만드는 것까지 다양한 시도를 해볼 수 있습니다.


Udio는 간단한 프롬프트 입력만으로도 고품질의 음악을 생성할 수 있는 강력한 도구로 보입니다. 음악 창작의 새로운 가능성이 열리고 있습니다.

반응형