- 15:35טראמפ מכריז על מכסים של 30% על מקסיקו והאיחוד האירופי
- 14:53משרד החוץ של טראמפ מתחיל בפיטורים המוניים כדי לעצב מחדש את הדיפלומטיה האמריקאית
- 14:08וושינגטון: מרוקו זכתה לכבוד בתחרות השפים השנתית היוקרתית של השגרירות
- 11:45מיליארדרים ממוצא אפריקאי מטביעים את חותמם בכלכלה האמריקאית
- 11:00הסוכנות הבינלאומית לאנרגיה מעדכנת את התחזית: היצע הנפט עולה, הביקוש יורד
- 10:15הרפובליקה הדמוקרטית של קונגו: יותר מ-33,000 מקרי כולרה מאז ינואר, המדינה בכוננות בריאותית גבוהה
- 09:34מרוץ מנהיגות באפריקה האטלנטית: בין שאיפות מתכנסות ליריבויות גיאופוליטיות
- 08:56פרויקט צינור הגז האטלנטי האפריקאי מתקדם: פגישות אסטרטגיות ברבאט עם 13 מדינות אפריקאיות
- 08:08וושינגטון מטילה סנקציות נגד נשיא קובה מיגל דיאז-קאנל בגין הפרות זכויות אדם
עקבו אחרינו בפייסבוק
Meta משיקה מודל בינה מלאכותית של Spirit LM לחיקוי קולות אנושיים
Meta השיקה את מודל הקוד הפתוח החדש שלה, "Spirit LM", אשר נותן מענה לאתגרים הקשורים למודלים מולטי-מודאליים בבינה מלאכותית בהפקת קול.
הדגם החדש שואף לספק חווית אודיו טבעית ואקספרסיבית יותר, המהווה שלב מתקדם בפיתוח רובוטים חכמים המסוגלים לתקשר קולית בדרכים מורכבות ומציאותיות יותר.
מודל "Spirit LM" מבוסס על מודל שפה מיומן מראש המכיל 7 מיליארד פרמטרים, והוא נבדל ביכולתו לעבד סאונד בצורה שונה ממודלים מסורתיים המסתמכים על טכנולוגיות זיהוי דיבור אוטומטי (ASR).
Meta מציין שהגישה המסורתית גורמת לאובדן של ביטויים טבעיים רבים של הקול. לכן, Spirit LM מסתמך על שימוש בפונמות, צלילים וצלילים כדי להתגבר על מגבלות אלו, מה שמאפשר לה להפיק צלילים טבעיים וללמוד משימות חדשות, כולל זיהוי דיבור, המרת טקסט לטקסט וסיווג קול.
Meta חשפה את הדגם הזה במאמר מחקר והזכירה גם את פרטי המחקר שהוביל לפיתוח "Spirit LM", בנוסף לדגימות של ביצועי האודיו של הדגם, מה שנותן מושג ברור לגבי יכולותיו העתידיות.
המודל זמין כעת כפרויקט קוד פתוח למפתחים וחוקרים לשימוש ולהרחיב, וצפוי לשמש בעתיד ביישומי מטה כמו WhatsApp, Instagram ופייסבוק, המאפשרים למשתמשים לקיים אינטראקציה עם בינה מלאכותית באמצעות קול טבעי . שיחות מלאות בביטויים הדומים למצב הקול המתקדם שהציגה לאחרונה OpenAI.