על שלושה גלים, וקו"ח

הרבה חברים שואלים אותי לאחרונה: “אבל מה ההבדל בכלל? מה זה משנה אם אני משתמש בג’מיני, צ’אטג’יפיטי, קלוד קוד (Claude Code), או בכלל ב-OpenClaw ששאול אמסטרדמסקי מספר? למה כולם עפים על זה לאחרונה? זה כולה צ’אט שמחזיר טקסט…”

התשובה המוכנה שלי נוטה לתאר את המצב קצת אחרת מאשר הניתוחים הטכניים שמדברים על אבולוציית ה-AI. אני מעדיף להסתכל על זה דרך אבולוציית היכולות והמפגש היומיומי שלנו עם המכונה. והסיפור הזה מתחלק, נכון להיום, לשלושה גלים ברורים.

הגל הראשון: הכל התחיל בציוץ (צ’אטבוטים בדפדפן)

הגל הראשון הוא הגל של הצא’טבוטים באינטרנט. ג’מיני, צ’אטג’יפיטי ושאר החברים שלמדנו לאהוב (ולטפח בהם תלות מדאיגה) ברמה היומיומית. הכל התחיל מבחינתנו אי שם בסוף שנת 2022 הרחוקה. סאם אלטמן פרסם ציוץ פשוט בטוויטר (X) שהזמין את הציבור לנסות את ChatGPT.

המערכת הזו נצרכה על ידי יותר מ-100 מיליון משתמשים תוך חודשיים בלבד. קצב החדירה של הטכנולוגיה הזו לחיי היום-יום הוא המהיר ביותר משחר ההיסטוריה. לשם השוואה, לרשת האינטרנט לקח כ-7 שנים להגיע ל-50 מיליון משתמשים, ולטלפונים הניידים לקח קרוב ל-12 שנים. אנחנו מדברים על האצה מטורפת, שרק הולכת וגוברת ככל שיש נגישות רחבה יותר של מדינות מתפתחות לטכנולוגיה, מה שמגביר את השימוש – ומכך את קצב הייצור והפיתוח.

הצ’אטבוטים האלה הפכו ל”הכל” שלנו:

הבדיקה המהירה במקום חיפוש אתרים מייגע ודפדוף בפורומים בגוגל.
השוואת מחירים או חיפוש מקומות לצאת אליהם.
היועץ הלילי הרגשי שלכם: “מה ההודעה הבאה שכדאי לי לשלוח לה?” בצירוף צילומי מסך של שלוש שעות אחורה.

אנחנו צורכים אותם בשתי דרכים עיקריות: דרך האתר הרשמי שלהם בדפדפן, או באפליקציה בטלפון ובמחשב. הגל הזה נתן לנו, כבני אדם, את הטעימה הראשונה של מה שעומד להגיע. אבל יש לו מגבלה משמעותית אחת: הוא לא יוצא מגבולות השיחה הספציפית.

נכון, החברות דוחפות עוד ועוד חיבורים לשירותים חיצוניים (כמו שליפת מידע מהמייל או ייצור תמונות), אבל המודל לא יפעל כל עוד לא נפנה אליו באופן אקטיבי, והוא לא מסוגל לבצע פעולות “בלתי צפויות” במחשב שלנו. השכבה הזו מדמה לנו “זיכרון” (לפעמים ג’מיני יזכיר לי איזה ערך שחיפשתי פעם), אבל הוא עדיין פסיבי לחלוטין.

הגל השני (וגל 2.5): מתוספי השלמת קוד ל-”Vibe Coding”

הגל השני – שלפעמים אני קורא לו גל 2.5, כי הוא ממשיך להכות בנו ברגעים אלו ממש – התחיל כתוכנות להשלמת קוד באזור השנים 2021-2023. הרעיון היה פשוט: אם בינה מלאכותית גם ככה מנבאת מה תהיה המילה הבאה במשפט לפי הסתברות סטטיסטית, אפשר להשליך את אותה הלוגיקה על כתיבת קוד, וללמד את המודל איך לעשות את זה נכון.

זה התחיל עם כלים כמו GitHub Copilot (ומאוחר יותר פתרונות ממוקדים של אמזון וגוגל). אלו היו כ利 עזר שבהם הקוד הוא עדיין מרכז הכובד של הממשק. הכלים האלו עזרו לנו לא לכתוב את כל בסיס הקוד מאפס, עשו דיבאגינג לסגירת פונקציה בשורה 2,000 או חיפשו משתנה ספציפי. זה האיץ את העבודה של מתכנתים בצורה בלתי תיאמנת, אבל זה עדיין לא טפטף לציבור הרחב.

הקפיצה האמיתית הגיעה עם גל 2.5, המזוהה היום בצורה הכי משמעותית עם כלים כמו Claude Code של Anthropic ו-Codex, ומה ששינה לרבים (וביניהם אני) את הפרדיגמה.

כאן הגענו לעיקרון פשוט אך מורכב בצורה בלתי רגילה: “פשוט דבר אליו” (Just talk to it). תתאר את הרעיון, תצלם כמה דוגמאות, תסביר את עצמך תוך כדי תנועה – והופ, יש תוצר.

אלו תוכנות שאנו מורידים ישירות למחשב. אנחנו בוחרים אילו הרשאות לתת להן – החל מרשות לרוץ בחופשיות על כל המסמכים במחשב במקרה הטוב, ועד לפחד הקיומי ממחיקת מערכת ההפעלה במקרה הרע.

זה הגל שבו המושג “Vibe Coding” נסק. הקוד הוא כבר לא מרכז הכובד של הממשק (במרכז העיצוב נמצא הצא’ט עצמו, לא קובץ הטקסט של הקוד). הדגש העיקרי בשלב זה הוא היכולת שלך להעביר בצורה בהירה וקוהרנטית את הרעיונות והכוונות שלך, כדי שהתוכנה תעשה את כל השאר. הבנת הארכיטקטורה והמערכת בצורה רחבה מקבלת נפח משמעותי, אבל הבנת כל שורת קוד בנפרד? פחות. זו הדמוקרטיזציה האמיתית של עולם הפיתוח.

בניגוד לגל הראשון, היכולת של הבינה כאן יוצאת רחוק מעבר לגבולות ה”שיחה”: קבצים ותיקיות נכתבים, נערכים וזזים מעצמם. המודלים קיבלו יכולות שליטה במחשב (Computer Use) ובדפדפן באמצעות תוספים (להראות לחברים איך קודקס נכנס לדפדפן שם לנו סדרה בנטפליקס זו חוויה בפני עצמה). תוסיפו לזה פרוטוקולים כמו MCP (Model Context Protocol), פלאגינים וסקילים, ומקבלים קצב פיצ’רים שבועי שקשה לעקוב אחריו. לאחרונה אף נוספה היכולת לקשר סשנים לטלפון הנייד: כל עוד המחשב בבית דלוק, אני יכול להמשיך לשלוט בו, לייצר קוד ולעבוד על פיצ’רים ישירות מהאוטובוס, בין פגישות, או כשעולה לי “מחשבת מקלחת”.

הגל השלישי: הסוכנים האוטונומיים (Closing the Loop)

ואז הגענו לגל השלישי – הסוכנים (Agents).

נכון, לכל שלב קודם ברשימה הזו חברות השיווק אוהבות לקרוא “סוכן בינה מלאכותית”, אבל רק השלב הנוכחי באמת מצדיק את השם הזה. שני השחקנים הבולטים ביותר בקוד הפתוח כרגע הם OpenClaw (שהראה לעולם איך תוכנה סמי-תודעתית נראית ומתנהגת) ו-Hermes Agent (המתחרה הגדול שלו, שלטעמי מתעלה עליו ביכולות רבות ובצורת הארכיטקטורה שלו). לשני הפרויקטים האלה יחד יש כבר קרוב ל-600 אלף כוכבים (Stars) ב-GitHub, הם נמצאים בשימוש של מיליוני אנשים, והיותם קוד פתוח מאפשרת לכל אחד לקחת אותם, לשחק איתם ולהתאים את הבסיס לצרכים שלו.

מה שמייחד ומבדיל את הקטגוריה הזו הוא טשטוש הגבולות בין העולם הדיגיטלי לעולם האמיתי. בכל השלבים הקודמים, הפעולה נעצרה ברמת ה”צריכה” האקטיבית שלנו – שאלנו, קיבלנו תשובה, וזהו.

הכיף האמיתי מתחיל כשמקימים בפעם הראשונה את ה”שותף” שלך. הקובץ הכי חשוב בהקמה הזו נקרא בשפה המקצועית soul (נשמה) – קובץ קונפיגורציה שבו אנחנו מגדירים לסוכן אופי, התנהגות ואישיות מסוימת. משם אנחנו מגדירים מפתח API, מחברים אותו לאפליקציות המסרים היומיומיות שלנו (כמו וואטסאפ או טלגרם), וכל עוד המחשב דלוק – הסוכן שם. זמין, מקשיב ומוכן לפעולה.

הסוכנים האלה “סוגרים את הלולאה” (Closing the loop):

אם אני מדבר עם הרמס על זה שחשוב לי להתאמן בערבים, הוא יפנה אלי מיוזמתו לבדוק אם באמת עשיתי את זה, ויציע לי תוכנית אימונים מעודכנת.
קיבלתי את סידור המשמרות או הלו”ז השבועי שלי בצילום מסך? אני פשוט משגר לו אותו לוואטסאפ, והוא כבר מעדכן את יומן הגוגל שלי לפי ימים ושעות באופן אוטונומי.
סתם בא לי להוסיף אותו לקבוצה עם חברים כדי שיסתלבט איתנו? הוא זורם ומבין את ההומור הפנימי (רק תהיו זהירים איתו!).

סוכן אמיתי מתנהל באופן אקטיבי, יוזם, זוכר ופועל. זה עוזר אישי עקבי – צ’אט אחד מתגלגל עם שותף שיודע ויכול לעשות כמעט הכל. הגל הזה מהפכני ואנחנו רק בקצה המימוש שלו, אבל ארגונים וחברות כבר משלבים את היכולות האלו ו-מזניקים את התפוקה שלהם לממדים מטורפים. כשמסתכלים על זה לצד ההתפתחות של חברות הרובוטיקה הפיזית, ברור שאנחנו רק בתחילתה של תקופה מרתקת במיוחד.

דוגמה קטנה לסיום - איך זה נראה בפרקטיקה

לאחרונה החלטתי שהגיע הזמן לרענן את קורות החיים שלי. מי שעבר את זה יודע שמדובר בכאב ראש: צריך לעדכן את הלינקדאין, לעבור על פרופילים דומים בתעשייה, לבדוק ניסוחים – עבודת נמלים.

במקום לעשות את זה לבד, ניהלתי שיחה על הנושא עם קודקס (Codex). עשינו מחקר משותף על אילו נקודות כדאי לקדם, מה נכון לכתוב ומה עדיף להשמיט. אחרי שסיימנו את שלב הניתוח, נתתי לו גישה לדפדפן. משם הוא פשוט לקח את ההגה: נכנס, ערך ועדכן את כל פרופיל הלינקדאין שלי מקצה לקצה, ואז עבר לאתר קורות החיים ובנה לי אותן מאפס – גם בעברית וגם באנגלית. כל התהליך, מקצה לקצה, לקח פחות משעה.

מכיוון שראיתי כי טוב, יצרתי סקיל (Skill) ייעודי חדש בקוד פתוח, כדי שגם אחרים עוכלו לקחת את תהליך העבודה הזה ולהשתמש בו בעצמם.

מקווה שהסקירה הזו עשתה לכם קצת סדר בבלאגן ובהבנה איפה אנחנו עומדים בעולם המהיר הזה (נכון לרגע זה). נתראה בפוסט הבא!