Від тексту, зображень, відео до голосу та музики, AIGC проникла в людський аудіовізуальний досвід. Навіть гіганти, які колись чинили опір музиці ШІ через проблеми з авторським правом, змушені були змінити своє ставлення, щоб адаптуватися до продуктів часу.
У вересні цього року Warner Music підписала контракт з першою віртуальною співачкою Нунурі; у серпні Universal Music і YouTube спільно запустили «Музичний інкубатор штучного інтелекту», щоб вирішити проблему авторського права на музику після появи AIGC.
Порівняно з зарубіжними країнами, Китай більше сприймає музику штучного інтелекту. NetEase Cloud Music співпрацювала з Xiaobing, щоб запустити інструменти створення музики за допомогою штучного інтелекту та заснувала перший віртуальний лейбл співаків «WOWAIDO!».
Змодельовані штучним інтелектом ритми та вокал представлені публіці за допомогою віртуальних співаків як носія. Він змінився від механічного електронного синтезу звуку, який випромінював віртуальне зображення в минулому, і має голос, близький до реальної людини. У той же час віртуальні співаки зі мінливими зображеннями та безперервними ітераціями перетворилися на співаків зі штучним інтелектом, поступово розриваючи різницю між віртуальністю та реальністю та розширюючи більше сценаріїв застосування та комерційну цінність.
Warner Music підписує контракт з віртуальною співачкою Нунурі
У вересні цього року Нунурі, віртуальна інтернет-зірка з понад 400 000 підписників у соціальній мережі Instagram, підписала контракт із студією Warner Music і випустила свій перший сингл «Dominoes». Таким чином, Нунурі став першим віртуальним співаком, який підписав великий звукозаписний контракт.
Аватар Noonoouri народився в 2018. Це аніме-образ, створений художнім креативом Йоргом Цубером, персонаж позиціонується як модель. У минулому персонажі аніме створювали історії та сюжети, щоб залучити шанувальників, але Нунурі була народжена, щоб підтримувати модні бренди високого класу. Вона активно працює у великих модних журналах і співпрацювала з міжнародними брендами, такими як Dior, Miu Miu та Calvin Klein.
Через два роки після свого дебюту Нунурі отримав 360 000 шанувальників в Instagram, але в наступні два роки стало прохолодно, кількість шанувальників зросла до 400 000, а потім припинилася. Нунурі стала «віртуальною співачкою» лише після того, як вона увійшла до складу артистів Warner Music. В Instagram MV синглу «Dominoes» було відтворено більше 250 000 разів, що робить його найвпливовішим твором за останні роки.
《Доміно》MV
Щоб змусити віртуальних персонажів рухатися, існують анімація, CG і навіть технологія захоплення руху, але звідки взявся голос Нунурі? Це ось-ось отримає східний вітер, який дме від ШІ до цієї віртуальної моделі. Повідомляється, що співоча партія Нунурі в "Dominoes" була синтезована на основі голосу справжнього співака за допомогою технології штучного інтелекту. І автори пісень, і музиканти твору отримають відповідні гонорари та частки розповсюдження.
Warner Music, яка підписала Noonoouri, бойкотувала AI music у квітні цього року через проблеми з авторським правом, але через кілька місяців звукозаписний гігант змінив свою позицію.
Universal Music, ще одна звукозаписна компанія, яка колись відмовилася від штучного інтелекту, об’єднала зусилля з YouTube у серпні цього року, щоб запустити «Музичний інкубатор штучного інтелекту». Повідомляється, що вона «співпрацюватиме з артистами та музикантами, щоб досліджувати застосування штучного інтелекту в музиці та захищати авторські права на музичні твори». Крім того, UMG і Google, материнська компанія YouTube, також обговорюють ліцензування голосів і мелодій артистів для навчання моделей ШІ для тестування подій.
Зрозуміти перехід звукозаписних компаній на технології штучного інтелекту неважко. З 2023 року AIGC, або генеративний штучний інтелект, стає частиною повсякденного життя. Продукція від графіки та тексту до відео та аудіо перетворюється ШІ та проникає в аудіовізуальний досвід громадськості. Генеральний директор YouTube Ніл Мохан якось сказав, що лише у 2023 році кількість переглядів відео, пов’язаних із генеративними інструментами ШІ на YouTube, перевищить 1,7 мільярда разів.
Зіткнувшись із визнанням громадськості AIGC, звукозаписні компанії повинні змінити своє мислення та подумати про те, як їхні накопичені ресурси авторського права можна об’єднати з штучним інтелектом. «Навчальні моделі – інструменти виробництва – стимулювання творчості» є хорошим і відносно зрілим шляхом. Насправді поєднання музики та нових інструментів не є чимось новим. Наприклад, ранній синтезатор електронної музики.
Від синтезатора до платформи штучного інтелекту для створення звуку
У популярному нині «Summer of Band» гурт «Supermarket» знову зачарував молодих шанувальників музики цієї епохи своєю унікальною електронною музикою, і вони були першим гуртом, який привіз електронну музику в Китай.
Електронна музика, яка поступово приймається публікою, майже вся створюється на синтезаторах. На початку електронної музики сам синтезатор був частиною апаратного забезпечення, а звук, який він виробляв, передавався через динаміки або навушники після проходження через інструментальний підсилювач електричного сигналу. У комп’ютерну еру з’являється все більше програмного забезпечення для синтезаторів. З точки зору виробництва сучасної поп-музики, якщо у вас є комп’ютер, ви повністю готові використовувати програмне забезпечення для синтезаторів для створення повного музичного твору.
У 2004 році виробник музичних інструментів YAMAHA запустив програмне забезпечення для синтезу голосу електронного співу VOCALOID, що зробило створення електронної музики більш доступним. Можна реалізувати не лише музику, а й людський спів.Творцю потрібно лише ввести тони та текст, щоб синтезувати співочий голос людини. VOCALOID — це те, що відоме як «V Family» у вітчизняному двовимірному колі.
Можливо, ви не знайомі з програмним забезпеченням VOCALOID, але ви, напевно, чули про таких віртуальних ідолів, як Хацуне Міку, Луо Тяньї та Стардаст, і їхні голоси походять від VOCALOID. Ви все ще пам’ятаєте ефект від традиційної фінської народної пісні «Єва Полька», коли її кавер зробила Хацуне Міку? Цей кавер став хітом під назвою «Onion Throwing Song».
Кавер Хацуне Міку на "The Onion Swallowing Song" став популярним в Інтернеті
YAMAHA при розробці VOCALOID використовувала штучний інтелект, або основу ШІ – великі дані. Вони зібрали велику кількість зразків людського голосу та використали технологію синтезу нейронної мережі, щоб створити бібліотеку джерел звуку. Користувачі можуть створювати ефект людського співу, встановлюючи параметри та викликаючи голос у бібліотеці.
Здатність VOCALOID використовується багатьма компаніями віртуальних ідолів, але недоліки цих віртуальних співаків також дуже очевидні. Оскільки їхні голоси синтезовані в електронному вигляді, щойно вони відкривають свій голос, вони відчувають чітке електронне та механічне відчуття. Таким чином, сфера застосування сімейства V здебільшого обмежена другим виміром.
Але з 2023 року віртуальні люди стають все більш реальними завдяки ітерації візуальної технології штучного інтелекту. Додавання до них електронних звуків знищить реалізм, який нарешті було оновлено. Штучний інтелект може покращити візуальні ефекти, і слух не проблема. Людські голоси, навчені великими звуковими моделями, починають видавати віртуальні люди.
У червні цього року Xiaoice, який запустив «Hanzo Forest Clone», співпрацював з NetEase Cloud Music для запуску програмного забезпечення для створення музики штучним інтелектом «NetEase Cloud Music·X Studio» та заснував лейбл із 12 віртуальними співаками. WOWAIDO!» Ці віртуальні співаки можуть співати як рок, так і поп, а їхні тембри охоплюють солодкі, милі, мелодійні та інші звуки. В області коментарів цих віртуальних співаків хтось сказав: «Я не можу повірити, що це співає ШІ».
Варто зазначити, що голоси цих співаків зі штучним інтелектом – це не просто «копії» голосу людини. За кожним голосом часто синтезуються різні джерела звуку. Повідомляється, що джерело звуку велике та авторизоване.
Вирішуючи проблему авторського права, AIGC впроваджує «голосові» можливості у віртуальних людей. Поява інструментів штучного інтелекту, таких як NetEase Cloud Music·X Studio, дозволяє музикантам отримати сухий співочий голос за кілька секунд, а завдяки налаштуванню параметрів ефект пісні може бути представлений співаком.
Озираючись назад, коли Хацуне Міку народилася, мета також була вирішити проблему продюсерів або аранжувальників, які не могли знайти співаків. Такий «контейнер звуку» з нестандартним зовнішнім виглядом, без обмежень стилю та руйнуванням традиційного людського голосу також надихнув продюсерів продовжувати спроби, і так виникла індустрія віртуальних ідолів.
Як сказав «батько Хацуне Міку» Хіроюкі Іто: «Чим більше цифрових творів використовується, тим вищою стає їхня цінність.» Те, що творці роблять, це «вливають душу в неживі речі».
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Поворот сюжету: Warner, яка протидіє музиці штучного інтелекту, підписує віртуального співака
Від тексту, зображень, відео до голосу та музики, AIGC проникла в людський аудіовізуальний досвід. Навіть гіганти, які колись чинили опір музиці ШІ через проблеми з авторським правом, змушені були змінити своє ставлення, щоб адаптуватися до продуктів часу.
У вересні цього року Warner Music підписала контракт з першою віртуальною співачкою Нунурі; у серпні Universal Music і YouTube спільно запустили «Музичний інкубатор штучного інтелекту», щоб вирішити проблему авторського права на музику після появи AIGC.
Порівняно з зарубіжними країнами, Китай більше сприймає музику штучного інтелекту. NetEase Cloud Music співпрацювала з Xiaobing, щоб запустити інструменти створення музики за допомогою штучного інтелекту та заснувала перший віртуальний лейбл співаків «WOWAIDO!».
Змодельовані штучним інтелектом ритми та вокал представлені публіці за допомогою віртуальних співаків як носія. Він змінився від механічного електронного синтезу звуку, який випромінював віртуальне зображення в минулому, і має голос, близький до реальної людини. У той же час віртуальні співаки зі мінливими зображеннями та безперервними ітераціями перетворилися на співаків зі штучним інтелектом, поступово розриваючи різницю між віртуальністю та реальністю та розширюючи більше сценаріїв застосування та комерційну цінність.
Warner Music підписує контракт з віртуальною співачкою Нунурі
У вересні цього року Нунурі, віртуальна інтернет-зірка з понад 400 000 підписників у соціальній мережі Instagram, підписала контракт із студією Warner Music і випустила свій перший сингл «Dominoes». Таким чином, Нунурі став першим віртуальним співаком, який підписав великий звукозаписний контракт.
Аватар Noonoouri народився в 2018. Це аніме-образ, створений художнім креативом Йоргом Цубером, персонаж позиціонується як модель. У минулому персонажі аніме створювали історії та сюжети, щоб залучити шанувальників, але Нунурі була народжена, щоб підтримувати модні бренди високого класу. Вона активно працює у великих модних журналах і співпрацювала з міжнародними брендами, такими як Dior, Miu Miu та Calvin Klein.
Через два роки після свого дебюту Нунурі отримав 360 000 шанувальників в Instagram, але в наступні два роки стало прохолодно, кількість шанувальників зросла до 400 000, а потім припинилася. Нунурі стала «віртуальною співачкою» лише після того, як вона увійшла до складу артистів Warner Music. В Instagram MV синглу «Dominoes» було відтворено більше 250 000 разів, що робить його найвпливовішим твором за останні роки.
《Доміно》MV
Щоб змусити віртуальних персонажів рухатися, існують анімація, CG і навіть технологія захоплення руху, але звідки взявся голос Нунурі? Це ось-ось отримає східний вітер, який дме від ШІ до цієї віртуальної моделі. Повідомляється, що співоча партія Нунурі в "Dominoes" була синтезована на основі голосу справжнього співака за допомогою технології штучного інтелекту. І автори пісень, і музиканти твору отримають відповідні гонорари та частки розповсюдження.
Warner Music, яка підписала Noonoouri, бойкотувала AI music у квітні цього року через проблеми з авторським правом, але через кілька місяців звукозаписний гігант змінив свою позицію.
Universal Music, ще одна звукозаписна компанія, яка колись відмовилася від штучного інтелекту, об’єднала зусилля з YouTube у серпні цього року, щоб запустити «Музичний інкубатор штучного інтелекту». Повідомляється, що вона «співпрацюватиме з артистами та музикантами, щоб досліджувати застосування штучного інтелекту в музиці та захищати авторські права на музичні твори». Крім того, UMG і Google, материнська компанія YouTube, також обговорюють ліцензування голосів і мелодій артистів для навчання моделей ШІ для тестування подій.
Зрозуміти перехід звукозаписних компаній на технології штучного інтелекту неважко. З 2023 року AIGC, або генеративний штучний інтелект, стає частиною повсякденного життя. Продукція від графіки та тексту до відео та аудіо перетворюється ШІ та проникає в аудіовізуальний досвід громадськості. Генеральний директор YouTube Ніл Мохан якось сказав, що лише у 2023 році кількість переглядів відео, пов’язаних із генеративними інструментами ШІ на YouTube, перевищить 1,7 мільярда разів.
Зіткнувшись із визнанням громадськості AIGC, звукозаписні компанії повинні змінити своє мислення та подумати про те, як їхні накопичені ресурси авторського права можна об’єднати з штучним інтелектом. «Навчальні моделі – інструменти виробництва – стимулювання творчості» є хорошим і відносно зрілим шляхом. Насправді поєднання музики та нових інструментів не є чимось новим. Наприклад, ранній синтезатор електронної музики.
Від синтезатора до платформи штучного інтелекту для створення звуку
У популярному нині «Summer of Band» гурт «Supermarket» знову зачарував молодих шанувальників музики цієї епохи своєю унікальною електронною музикою, і вони були першим гуртом, який привіз електронну музику в Китай.
Електронна музика, яка поступово приймається публікою, майже вся створюється на синтезаторах. На початку електронної музики сам синтезатор був частиною апаратного забезпечення, а звук, який він виробляв, передавався через динаміки або навушники після проходження через інструментальний підсилювач електричного сигналу. У комп’ютерну еру з’являється все більше програмного забезпечення для синтезаторів. З точки зору виробництва сучасної поп-музики, якщо у вас є комп’ютер, ви повністю готові використовувати програмне забезпечення для синтезаторів для створення повного музичного твору.
У 2004 році виробник музичних інструментів YAMAHA запустив програмне забезпечення для синтезу голосу електронного співу VOCALOID, що зробило створення електронної музики більш доступним. Можна реалізувати не лише музику, а й людський спів.Творцю потрібно лише ввести тони та текст, щоб синтезувати співочий голос людини. VOCALOID — це те, що відоме як «V Family» у вітчизняному двовимірному колі.
Можливо, ви не знайомі з програмним забезпеченням VOCALOID, але ви, напевно, чули про таких віртуальних ідолів, як Хацуне Міку, Луо Тяньї та Стардаст, і їхні голоси походять від VOCALOID. Ви все ще пам’ятаєте ефект від традиційної фінської народної пісні «Єва Полька», коли її кавер зробила Хацуне Міку? Цей кавер став хітом під назвою «Onion Throwing Song».
Кавер Хацуне Міку на "The Onion Swallowing Song" став популярним в Інтернеті
YAMAHA при розробці VOCALOID використовувала штучний інтелект, або основу ШІ – великі дані. Вони зібрали велику кількість зразків людського голосу та використали технологію синтезу нейронної мережі, щоб створити бібліотеку джерел звуку. Користувачі можуть створювати ефект людського співу, встановлюючи параметри та викликаючи голос у бібліотеці.
Здатність VOCALOID використовується багатьма компаніями віртуальних ідолів, але недоліки цих віртуальних співаків також дуже очевидні. Оскільки їхні голоси синтезовані в електронному вигляді, щойно вони відкривають свій голос, вони відчувають чітке електронне та механічне відчуття. Таким чином, сфера застосування сімейства V здебільшого обмежена другим виміром.
Але з 2023 року віртуальні люди стають все більш реальними завдяки ітерації візуальної технології штучного інтелекту. Додавання до них електронних звуків знищить реалізм, який нарешті було оновлено. Штучний інтелект може покращити візуальні ефекти, і слух не проблема. Людські голоси, навчені великими звуковими моделями, починають видавати віртуальні люди.
У червні цього року Xiaoice, який запустив «Hanzo Forest Clone», співпрацював з NetEase Cloud Music для запуску програмного забезпечення для створення музики штучним інтелектом «NetEase Cloud Music·X Studio» та заснував лейбл із 12 віртуальними співаками. WOWAIDO!» Ці віртуальні співаки можуть співати як рок, так і поп, а їхні тембри охоплюють солодкі, милі, мелодійні та інші звуки. В області коментарів цих віртуальних співаків хтось сказав: «Я не можу повірити, що це співає ШІ».
Варто зазначити, що голоси цих співаків зі штучним інтелектом – це не просто «копії» голосу людини. За кожним голосом часто синтезуються різні джерела звуку. Повідомляється, що джерело звуку велике та авторизоване.
Вирішуючи проблему авторського права, AIGC впроваджує «голосові» можливості у віртуальних людей. Поява інструментів штучного інтелекту, таких як NetEase Cloud Music·X Studio, дозволяє музикантам отримати сухий співочий голос за кілька секунд, а завдяки налаштуванню параметрів ефект пісні може бути представлений співаком.
Озираючись назад, коли Хацуне Міку народилася, мета також була вирішити проблему продюсерів або аранжувальників, які не могли знайти співаків. Такий «контейнер звуку» з нестандартним зовнішнім виглядом, без обмежень стилю та руйнуванням традиційного людського голосу також надихнув продюсерів продовжувати спроби, і так виникла індустрія віртуальних ідолів.
Як сказав «батько Хацуне Міку» Хіроюкі Іто: «Чим більше цифрових творів використовується, тим вищою стає їхня цінність.» Те, що творці роблять, це «вливають душу в неживі речі».