- השיג 40 מיליון הורדות בשלושה שבועות בלבד, ובכך סימן את השקת המודל הפתוח הגדולה ביותר של גוגל.
- מציע יכולות רב-מודאליות, תומך בהבנת אודיו, וידאו ותמונות בלמעלה מ-140 שפות.
- עבר לרישיון Apache 2.0, מה שהגביר משמעותית את אימוץ המפתחים ואת החדשנות הקהילתית.
השקת Gemma 4 האחרונה של Google DeepMind יצרה גלי הדף בקהילת ה-AI, והדגימה הצלחה חסרת תקדים עם מודלי הקוד הפתוח שלה, שתוכננו לפריסה על פני מגוון רחב של מכשירים.
עומר, נציג Google DeepMind, שיתף תובנות לגבי הקבלה המרשימה של Gemma 4, שצברה למעלה מ-40 מיליון הורדות בתוך שלושה שבועות בלבד ממועד השקתה. אימוץ מהיר זה מדגיש את הצימאון של הקהילה לבינה מלאכותית נגישה ועוצמתית. משפחת המודלים של Gemma 4 נעה בין 2 מיליארד פרמטרים קומפקטיים, המסוגלים לרוץ על סמארטפונים, ועד ל-31 מיליארד פרמטרים חזקים יותר, המתאימים לתחנות עבודה ולכרטיסי מסך לגיימינג, תוך שימת דגש על עיצוב ידידותי למפתחים ויעילות.
המודלים מתהדרים ביכולות רב-מודאליות מרשימות. גרסאות קטנות יותר מותאמות למובייל, מבינות אודיו, וידאו ותמונות, ואף מבצעות תרגום דיבור לטקסט. מודלים גדולים יותר מצטיינים במשימות ראייה מתקדמות. דגש מרכזי עבור ג'מה הוא הנגישות הגלובלית שלה, לאחר שאומנה בלמעלה מ-140 שפות. מחויבות זו מגולמת ב'ג'מה-וורס' (Gemmaverse), מערכת אקולוגית מונעת קהילה שבה מפתחים מכווננים את ג'מה לצרכים לשוניים ספציפיים, כגון שיפור תרגום מקצ'ואה לספרדית.
המעבר האסטרטגי לרישיון Apache 2.0 היה זרז משמעותי לאימוץ הנרחב של ג'מה. עומר הסביר כי משוב נרחב ממפתחים, סטארט-אפים וארגונים הדגיש את הרישוי כנקודת חיכוך מרכזית. המעבר ל-Apache 2.0 הסיר את המכשול הזה, טיפח אמון רב יותר ואפשר יישומים מסחריים ולא מסחריים רחבים יותר. גישת קוד פתוח זו חיונית לטיפוח חדשנות, במיוחד בתחומים הדורשים פרטיות, פונקציונליות לא מקוונת, או כוונון עדין מיוחד לתחומים ספציפיים כמו בריאות או פיננסים.
במבט קדימה, Gemma 4 ערוכה להגדיר מחדש את ה-AI הסוכני, במיוחד עבור מודלים קטנים יותר. אף על פי שהם אינם מיועדים לשינוי מבנה של בסיסי קוד שלמים, מודלים אלה מסוגלים מאוד לבצע משימות במכשיר, כגון שליטה בפונקציות המכשיר, ניסוח מיילים, או ניתוב קריאות API בהתבסס על מורכבות הפרומפט. הרעיון של 'הסקה היברידית', המודגם על ידי סטארט-אפים כמו Cactus Compute, מאפשר לנתב מקומי להחליט בחוכמה אם משימה מטופלת באופן מקומי על ידי ג'מה או נשלחת למודל גדול יותר מבוסס ענן כמו ג'מיני, מה שמבטיח ביצועים אופטימליים וניצול משאבים. שילוב זה של אינטליגנציה מקומית ובענן מייצג עתיד פרגמטי לפריסת AI.
“אז, אנחנו באמת רוצים לוודא שהמודלים האלה נגישים למערכת האקולוגית ושיש את הדבר הזה שאנחנו קוראים לו ה-'Gemmaverse'.”
- Omar Sanseviero, Lead AI Developer Experience at Google DeepMind




