Meta, החברה האחראית על פייסבוק, אינסטגרם ו-WhatsApp, בין היתר, שיתפו את האחרון תצוגה מקדימה של SAM 2. זוהי הגרסה החדשה של הטכנולוגיה שלה פלח כל דבר מודל, מודל של בינה מלאכותית המסוגל לפלח כל תמונה או וידאו כדי לזהות פיקסלים של אובייקט ולעקוב אחריהם. כך ניתן להפריד בין שחקן או אובייקט ספציפי מתמונה, ולאחר מכן לבצע משימות עריכה שונות.
באפריל 2023 זה היה מופיע מטא SAM, ובגרסה החדשה הזו בינה מלאכותית משלבת פונקציות ויכולות חדשות. בין נקודות השיא של המצגת החדשה הזו עלינו להדגיש את יכולת עריכת הווידאו, כמו גם את האבולוציה של גרפיקה ממוחשבת והאפשרות ליצור טכניקות אינטראקטיביות הרבה יותר מציאותיות ומגוונות.
מה ש-SAM 2 משלב מ-Meta, ה-AI הפילוח החדש
להבין הפעולה של Meta SAM והתכונות החדשות שמביאה הגרסה השנייה משקפות את התקדמות הבינה המלאכותית בעולם הטכנולוגיה. קודם כל, המטרה הסופית של שתי הטכנולוגיות נשארת זהה. הוא תוכנן לפלח אובייקטים בתמונות בדיוק גבוה, מה שמקל על עריכה אוטומטית וזיהוי אלמנטים על המסך. בינה מלאכותית מזהה את הפיקסלים המתאימים לאובייקט ספציפי, ויש לה שימושים מרובים בעולם הטכנולוגיה.
בדיסציפלינות כמו מדעי הים, רפואה וניתוח תמונות לוויין, למשל, ה-SAM 2 של Meta יכול להיות כלי נהדר. חלק מהכלים שעלו מהשימוש ב-SAM כוללים את הרקע והגזרות של אינסטגרם, שמקלים משמעותית על עריכת קבצי תמונות.
אבל ההתמקדות העיקרית של SAM הייתה בתמונות סטטיות. גרסה חדשה זו מכוונת גם לתוכן נע, סרטונים ושברים שבהם SAM 2 מסוגל לקבוע ולבודד אובייקטים ספציפיים. המורכבות של ניתוח קובץ אורקולי גדולה יותר, אבל הכל מעיד שמטה מתקדמת במירוץ הבינה המלאכותית והיישומים המעשיים שלה.
התכונות החדשות שמשלב SAM 2 של Meta
מודל הפילוח Meta בגרסת SAM 2 שלו משלב פונקציות חדשות עם יעדים מאוד ספציפיים. מצד אחד, אפשרות לבצע פילוח בזמן אמת, לזהות אובייקטים בסרטונים, אך גם עיצוב והכללה בקוד פתוח ללא התאמה.
קוד פתוח
Meta הוציאה את SAM 2 בתור א קוד פתוח תחת רישיון Apache 2.0. בדרך זו, מפתחים שירצו בכך יוכלו לבנות אפליקציות וכלים מותאמים אישית התואמים באופן מלא ל-SAM 2 וללא יותר מדי סיבוכים.
ערכת נתונים SA-V
הגרסה החדשה של מודל הפילוח Meta כוללת מערך נתונים חדש בשם SA-V. ישנם כ-51.000 סרטונים שחולצו מהעולם האמיתי ומשמשים לאימון בינה מלאכותית להוספת פונקציות ויכולות שונות. בנוסף, הוא כולל גם יותר מ-600.000 מסכות מרחביות-זמניות ליישום במשימות עריכת וידאו.
פילוח בזמן אמת
בניגוד ל-SAM המקורי של Meta, גרסה 2 זו מסוגלת לזהות ולפלח אובייקטים בסרטונים ופעולות בזמן אמת. פעולה זו משמשת גם לצמצום משמעותי של זמן האינטראקציה שעל המשתמש להקדיש לאפליקציה.
הכללה ללא הסתגלות
עם SAM 2 ניתן לפלח כל אובייקט בכל סרטון או תמונה, אפילו באותם תחומים חזותיים שלא נראו בעבר. כך מתבטל הצורך בהתאמה אישית לכל מקרה ספציפי.
מסגרת מאוחדת
הדגמים הקודמים עליהם עבדה Meta עבדו על תמונות וסרטונים בצורה שונה. כעת גישת SAM 2 מגובשת, ובכך משיגה למידה הרבה יותר תכליתית של טכניקות חדשות, וגם מספקת ביצועים עקביים על פני סוגי הנתונים החזותיים השונים המנותחים.
פילוח אינטראקטיבי
SAM 2 מייצר גם יכולות מעניינות אחרות, המשתמש אתה יכול להנחות את תשומת הלב של הדגם באמצעות תיבות תוחמות או באמצעות תיאורים ספציפיים, או על ידי לחיצה. זהו דגם שמסתגל מהר מאוד לצרכים ספציפיים ומגוונים. בסופו של דבר, עם מינימום קלט SAM 2 מ-Meta תוכלו לזהות אובייקטים בדיוק רב.
מהירות ויעילות בפילוח עם SAM 2 של Meta
La מטא בינה מלאכותית בגרסת SAM 2 שלו הוא מוסיף מהירות ויעילות לתהליך פילוח האובייקטים. המפתחים אפשרו ליצור פלטפורמה שמנתחת כל מיני אלמנטים עם תוצאות מהירות ויעילות, מתמונות וסרטונים ועד לתיאורי טקסט ספציפיים.
עיבוד תמונה ברזולוציה גבוהה
SAM 2 עובד גם עם תמונות באיכות גבוהה. זה יכול להתמודד עם תמונות ברזולוציה של עד פי 4 מהנתמכת על ידי גרסאות קודמות של הדגם. זה מבטיח תוצאות הרבה יותר אטרקטיביות ומציאותיות. מדובר בשיפור גדול בכל הנוגע לניתוח וסריקה בתחומי תמונה כמו רפואה או פרשנות של מפות לווין.
ככל שההגדרה גבוהה יותר, כך ניתן לפלח אובייקטים ואינדיבידואלים קלים ומהירים יותר. הלב של SAM 2 הוא לספק כלי רב תכליתי, המסוגל להסתגל במהירות ולספק תוצאות מצוינות עבור פעולות שונות.
על מה ניתן להחיל SAM 2?
מתוך הבנת ההתקדמות הגדולה של בינה מלאכותית והעבודה להרחבתה, מעניין לראות את שדות שבהם מטה החליטה לפנות. באמצעות מודל SAM 2, ניתן לצפות להתקדמות בתחומים שונים. מעריכת וידאו בזמן אמת ואוטומטית, ועד אוטומציה ופעולות רובוטיות.
כמו כן תחומי הרפואה והמדע קשורים קשר הדוק לבינה מלאכותית, היכולת להשתמש בהתקדמות אלה כדי לפתח אסטרטגיות חדשות. מהנדסי מחשבים ב-Meta גם עובדים קשה כדי להבטיח של-SAM 2 יש שימושים ספציפיים ומאפשר התקדמות מהירה יותר בתחומים הקשורים לביאור נתונים והשלכת נתונים. פלטפורמות שאוספות נתונים שונים יכולות להשתמש ב-SAM 2, למצוא דפוסים ולהאיץ באופן אקספוננציאלי את המהירות שבה התוצאות מופיעות. האופק עדיין רחוק מלהיות באופק. AI במיטבו ומטה לא רוצה לפספס את הסירה. עם המפתחים שלו עובדים במלוא המהירות, ו-SAM 2 עם כל כך הרבה חזיתות, זה יכול להיות הצעה מצוינת.