- 08:29Марокко и Нигер укрепляют двустороннее сотрудничество в области транспорта и логистики
- 07:45Марокко и АСЕАН: стратегический альянс, устремлённый в будущее
- 17:00Американский конгрессмен назвал Марокко образцом стабильности и реформ под руководством короля Мухаммеда VI
- 16:15Марокко, новый двигатель культурных и креативных индустрий, отмечено Францией
- 15:30Бен Коулман: Марокко добивается прогресса и укрепляет связи с Соединенным Королевством
- 14:45В Найроби прошла 20-я сессия Африканского совета министров по окружающей среде при активном участии Марокко
- 14:00Вашингтон официально запустил процесс выбора будущего председателя Федеральной резервной системы США
- 13:15Король Малайзии посетит Россию в августе следующего года
- 11:15Бразильская пресса освещает перспективный стратегический альянс с Марокко
Следите за нами в Facebook
Meta запускает модель искусственного интеллекта Spirit LM для имитации человеческих голосов
Meta запустила свою новую модель с открытым исходным кодом «Spirit LM», которая решает проблемы, связанные с мультимодальными моделями искусственного интеллекта при генерации звука.
Новая модель призвана обеспечить более естественное и выразительное звучание, что является продвинутым шагом в разработке интеллектуальных роботов, способных к голосовому общению более сложными и реалистичными способами.
Модель «Spirit LM» основана на предварительно обученной языковой модели, содержащей 7 миллиардов параметров, и отличается способностью обрабатывать звук иначе, чем традиционные модели, опирающиеся на технологии автоматического распознавания речи (ASR).
Мета отмечает, что традиционный подход приводит к утрате многих естественных выражений голоса. Поэтому Spirit LM полагается на использование фонем, тонов и высоты тона для преодоления этих ограничений, что позволяет ему воспроизводить естественные звуки и изучать новые задачи, включая распознавание речи, преобразование текста в текст и классификацию голоса.
Meta раскрыла эту модель в исследовательской работе, а также упомянула детали исследования, которые привели к разработке «Spirit LM», а также образцы аудиопроизводительности модели, дающие четкое представление о ее будущих возможностях.
Модель теперь доступна как проект с открытым исходным кодом, который разработчики и исследователи могут использовать и расширять. Ожидается, что в будущем она будет использоваться в мета-приложениях, таких как WhatsApp, Instagram и Facebook, что позволит пользователям взаимодействовать с искусственным интеллектом посредством естественного голоса. . разговоры, полные выражений, похожие на расширенный голосовой режим, недавно представленный OpenAI.