- 15:00ארה"ב מטילה מכסים של 35% על יבוא מקנדה בעקבות התגברות המתיחות המסחרית
- 14:15פסגה חדשה של מרוקו - האיחוד האירופי מתוכננת ברבאט באוקטובר
- 13:30ישראל קוראת לארצות הברית לחדש את תקיפותיה נגד החות'ים ולהקים קואליציה רחבה
- 12:15OPEC+ מתכננת להשעות את עליית הייצור לאחר העלייה המתוכננת בספטמבר
- 12:02כיצד המלחמה האריכה את חייו הפוליטיים של נתניהו: חקירה חושפת את הסודות מאחורי הקלעים.
- 11:30צריכת האנרגיה הנפיצה של בינה מלאכותית מאיימת על יציבות האספקה העולמית
- 10:44מרוקו מברכת על משלחת אפריקאית כדי לדון בעתיד הטרנספורמציה הדיגיטלית באפריקה
- 10:23מרוקו במשא ומתן מתקדם עם אמבראר: לקראת ברית אסטרטגית עם ברזיל
- 10:00מרוקו מוכנה להפוך לשחקנית גרעינית הודות לאורניום הכלול בסלע הפוספט שלה
עקבו אחרינו בפייסבוק
מיקרוסופט מפתחת בינה מלאכותית המסוגלת לשלוט בתוכניות Windows
מיקרוסופט הכריזה על פיתוח מודל חדש של בינה מלאכותית בשם "Large Action Model, או LAM", הבולט ביכולתו להריץ תוכניות Windows ולבצע משימות באופן עצמאי. מודל זה מהווה קפיצת מדרגה איכותית מבחינת בינה מלאכותית. לבצע פקודות.
בניגוד למודלים של שפה מסורתית, כגון GPT-4o, שתפקידם מוגבל לעיבוד ויצירת טקסט, למודל ה-LAM החדש של מיקרוסופט יש את היכולת להפוך שאילתות משתמש לפעולות אמיתיות, אשר כולל הפעלת תוכניות או שליטה בחומרה.
הרעיון הזה כבר היה קיים, אבל LAM הוא הדגם הראשון שהוכשר במיוחד לעבודה עם מוצרי שולחן העבודה של Microsoft Office ויישומי Windows אחרים.
לדוגמה: בעת קניות מקוונות, דגמים מסורתיים יכולים לספק הוראות טקסט כיצד לרכוש, בעוד שדגם LAM יכול להשלים את תהליך הרכישה בעצמו על ידי ניווט ברשת ממשק האתר.
לפי מיקרוסופט, פיתוח מודל זה דורש ארבעה שלבים עיקריים: הדרכה בתכנון משימות וחלוקת המשימה לשלבים לוגיים, לימוד מודלים מתקדמים (כגון GPT-4o) להפיכת תוכניות לפעולות, וחקירה עצמית המאפשרת למודל לחפש פתרונות חדשים ולהתגבר על מכשולים. מודלים אחרים לא מצליחים להשיג זאת, כמו גם אימון מבוסס תגמול לשיפור דיוק הביצוע.
החוקרים בדקו את מודל ה-LAM בסביבת בדיקה של תוכנית עריכת הטקסט "Word" והשלימו את המשימות בהצלחה בשיעור של 71%, תוך ביצועים טובים יותר מ-GPT-4o, שהשיג שיעור הצלחה של 63% ללא מידע חזותי. מודל ה-LAM היה גם מהיר יותר, ולקח 30 דקות להשלמת המשימות, שנייה אחת בלבד לביצוע המשימה, בהשוואה ל-86 שניות עבור GPT-4o. עם זאת, כאשר הוזנה ל-GPT-4o מידע חזותי, הדיוק שלו השתפר עד ל-75.5%.
צוות מיקרוסופט הסתמך על אלפי נתוני אימון שנכרו ממסמכי מיקרוסופט, מאמרי wikiHow וחיפושי Bing, ואז הצוות השתמש במודל GPT-4o כדי להרחיב את המשימות הללו למשימות מורכבות אחרות.
עם פיתוח זה, מודל LAM מתמודד עם כמה אתגרים, לרבות יישום לא נכון של פעולות, כמה בעיות ארגוניות הדורשות פתרונות ומגבלות טכניות המשפיעות על מדרגיות ויישום בתחומים שונים.
החוקרים מאמינים כי LAM מהווה פריצת דרך גדולה בתחום הבינה המלאכותית, ומציינים כי היא יכולה לסלול את הדרך לפיתוח של בינה כללית מלאכותית (AGI). במקום מערכות שפשוט מבינות ומייצרות טקסט, חברות יוכלו להציע בקרוב עוזרים דיגיטליים שבאמת עוזרים לבצע משימות יומיומיות ביעילות.