Soul AI Lab, изследователският екип зад социалната платформа за по-младите поколения Soul App, отвори своя модел за генериране на гласови подкасти, SoulX-Podcast. Моделът поддържа диалози с много говорители, няколко оборота на мандарин, английски и няколко китайски диалекта, генерирайки над 60 минути гладък, естествен разговор с постоянен тон и ритъм.
Soul каза, че моделът се откроява със способността си да възпроизвежда смях и въздишки, да поддържа диалекти като кантонски и сечуански и да извършва клониране на глас на кръстосани диалекти с нула удари. След пускането си, SoulX-Podcast за кратко оглави списъка с актуални TTS модели на Hugging Face. [TechNode reporting]
Свързани
Нашия източник е Българо-Китайска Търговско-промишлена палaта


