Meta, Audiocraft araştırma ekibi tarafından yeni bir müzik oluşturma modeli olan MusicGen’i duyurdu. Open source bir dil modeli olan MusicGen, metin ve mevcut bir melodiye dayanarak yeni müzik oluşturma imkanı sunuyor. MusicGen, ChatGPT modeline benzer bir şekilde çalışıyor ve müzik türünü belirtmenize, mevcut bir melodi eklemenize ve oluştur düğmesine basmanıza izin veriyor. Uygulama, metin önerilerinize ve melodinize göre yeni bir müzik parçası çıkarıyor.
MusicGen için 20 bin saat lisanslı müzik kullanıldı. Bunlar arasında iç veri setinden 10 bin yüksek kaliteli müzik parçası ve Shutterstock ile Pond5 parçaları bulunuyor. Ekip, 32Khz EnCodec ses tokenleştiricisini kullanarak daha hızlı olmayı amaçladı. MusicGen’in saniye başına 50 otoregresif adımı olduğu belirtildi.
Open source olan MusicGen, ticari müzik oluşturmak için bile kullanılabilir. Ancak sonuçlar için her zaman garantisi yoktur. Google da geçtiğimiz ay benzer bir müzik oluşturucu olan MusicLM’i yayımlamıştı ancak MusicGen daha iyi sonuçlar veriyor gibi görünüyor.
Son altı ay içindeki AI gelişimi hızının bir örneği olan MusicGen, derin öğrenme modellerinin bir başka türünün ortaya çıkmasına neden oldu. MusicGen, yerel olarak çalışabilir ve dört farklı model boyutuna (300 milyon – 3,3 milyar parametre) sahip olabilir. Büyük boyuttaki model, karmaşık müzik üretme potansiyeli en yüksek olanıdır.