In Uncategorized

סוכנים גנרטיביים: עידן חדש בנהלי הפעלה סטנדרטיים

 

הנוף הדיגיטלי עבר שלבים אבולוציוניים שונים, שכל אחד מהם מביא גל חדש של אפשרויות.

כיום, אנו עומדים על סף מהפכה משמעותית נוספת, הודות למחקר פורץ דרך שהציגו סטנפורד וגוגל דיפמיינד אשר יצא עכשיו בקוד פתוח (כלומר כולם יכולים להשתמש בזה)

מאמר שכותרתו "Generative Agents: Interactive Simulacra of Human Behavior" מציג את הרעיון של סוכנים גנרטיביים.

כלומר אוסף של ״אישוייות״ מבוססות בינה מלאכותית (אבל לא רק) שנועדו לדמות התנהגות אנושית.
סוכנים אלו מסוגלים לבצע פעולות יומיומיות, לגבש דעות, ליזום שיחות ולהרהר בחוויות העבר. 

 

המאמר מציג ארכיטקטורה מדהימה של LLM (מודל שפה גדול) שמסוגל לייצר תיעוד שלם של חוויות הסוכן תוך שימוש בשפה טבעית, לסנתז את הזיכרונות הללו לכדי השתקפויות ברמה גבוהה יותר, ולאחזר אותם כדי לתכנן התנהגות. 

במהלך הניסוי (הלינק לדמו נמצא בסוף) הסוכנים (יש 25 כאלה) הראו יכולות מדהימות לקדם פעילויות שונות וזאת באמצעות שיתוף פעולה אחד עם השני.

הרעיון המרכז בניסוי: לתת לכל דמות ״חזון / משימת על״ ולשחרר אותו/ה לחופשי תחת הרעיון שהסוכן ייצר לעצמו משימות ויבצע אותן עד להשגת אותו חזון תוך ביצוע התנהגות אנושית עד כמה שניתן.

אבל רגע לפני שנבין את המשמעות של זה, בואו נבין איך זה עובד.

 

אז ממש בגדול ומה שחשוב שתדעו,

זיכרון: לכל אחד מהסוכנים, באופן נפרד, יש  זיכרון לטווח ארוך שמתעד את החוויות שלו.
מודל של אחזור זיכרון משלב רלוונטיות, עדכניות וחשיבות כדי להציג את הרשומות הדרושות ובכך להתאים את התנהגות הסוכן.

 

השתקפות: רכיב זה מסנתז זיכרונות למסקנות ברמה גבוהה יותר לאורך זמן.
וזה בעצם מה שמאפשר לסוכן להסיק מסקנות על עצמו ועל אחרים כדי להנחות את התנהגותו.

 

תכנון: מתרגם את המסקנות ואת הסביבה הנוכחית לתוכניות פעולה ברמה גבוהה יותר.
תוכניות אלה מחולקות לאחר מכן להתנהגויות מפורטות לפעולה ולתגובה,
ואז ההשתקפויות והתוכניות הללו מוחזרות לזרם הזיכרון כדי להשפיע על התנהגותו העתידית של הסוכן.

 

ביצוע: עשרים וחמישה הסוכנים הללו נמצאים בסביבה מוגדרת (במאמר – Smallville)
בסביבה זו, הם מקיימים אינטראקציה עם סוכנים אחרים באמצעות שפה טבעית בהתאם לתוכניות שלהם, זכורים את התוצאות ולמגיבים בהתאם על סמך חוויות העבר, הלמידה והסביבה הנוכחית.

במבט על, זה נראה ככה:

 


כלומר, הם יוצרים תוכניות יומיות המשקפות את המאפיינים והחוויות שלהם.

הם יכולים לממש את התוכניות הללו, להגיב לשינויים ולתכנן מחדש בעת הצורך. 

 

מתחת למכסה המנוע, הסוכן עושה הלוך וחזור בין הזיכרון שלו לבין ChatGPT בשביל לבדוק כל הזמן איך הכי נכון להתמודד עם הסיטואציה.

 

עוד דבר מעניין הוא שבמהלך הניסוי, המחברים ערכו הערכות שונות כדי לבדוק את האמינות של התנהגות הסוכנים. 

הם ממש עשו "ראיון" לסוכנים בשפה טבעית כדי לבחון את יכולתם לזכור, לתכנן, להגיב ולשקף בצורה מדויקת את מה הם יודעים / למדו / רוצים לעשות בעתיד.

 

אז כמו שאמרנו, מדובר בסוכנים יצרניים – סוכני תוכנה חישוביים המסוגלים לדמות התנהגות דמוית אדם.
ועכשיו, הם בקוד פתוח, והיישומים הפוטנציאליים עצומים! 


בעבר חשבו שהמקום עליו הנושא ישפיע בצורה החזקה ביותר הוא מן הסתם בגיימינג, באזורים בהם ניתן לתת ל NPC (דמויות בתוך המשחק שלא ניתנות לשיחוק) להתנהל במרחב ולתת לשחקנים הרגשה פרסונלית יותר.
אבל הניסוי הזה מראה שאנחנו הולכים למקום אחר, הרבה מעבר לגיימינג, אל לב ליבן של תעשיות הנשענות על נהלי הפעלה סטנדרטיים (SOPs).

 

בבסיס, סוכנים אלו הם בעלי אישיות מובהקת שהוגדרה מראש ויכולים לבצע פעילויות שגרתיות (בתוך הסביבה המדומה) כמו התעוררות, בישול ארוחת בוקר ויציאה לעבודה.

אבל כמו שאמרנו, מה שמייחד אותם הוא היכולת שלהם לזכור, לשקף את פעולותיהם בעבר ולתכנן התנהגויות עתידיות על סמך השתקפויות אלו.

הזיכרונות הבנויים שלהם, בשילוב עם פרופיל אישיותי ייחודי, מאפשרים להם ליצור אינטראקציה, לגבש דעות ואפילו ליזום שיחות אחד עם השני.

וכך, במאמר מראים דוגמה מדהימה עם איזבלה, אחת מהסוכנים שבשביל לדאוג ״לקהילה״, מחליטה לבד לארגן מסיבת ולנטיין, מזמינה את החברים שלה, הם מעבירים את המסר הלאה לחברים שלהם וגם מגיבים לה חזרה.

וכאשר מגיע התאריך למסיבה, הם גם מגיעים (ומי שלא, יש לו תירוץ מוצלח למה לא הצליח להגיע)

 

הדוגמה הזו מראה את היכולת המדהימה של הסוכנים לקבל אינפורמציה מבחוץ, לעבד אותה ולהתאים את עצמם למצב המשתנה מבלי לפגוע במשימת העל שלהם.

כמו שאתם וודאי יודעים, כל מגזר, משירותי בריאות ועד לוגיסטיקה, עובד בצורה של  SOPs (תהליכים קבועים שחוזרים על עצמם בארגון) ממש בצורה של מדריך מפורט, צעד אחר צעד, כדי להבטיח עקביות ולשפר את יעילות העובדים.

לצורך הדוגמא בואו נשתמש בתהליך שיש בכל עסק. פרסום.

כלומר, יצירת תוכן.

מטרה: להשתמש בסוכן מחולל כדי לסייע ביצירת תוכן, חידוד ויצירה עבור חברה X.

בפעם הראשונה יכנס קלט מהעורך שמניע את התהליך, נגיד תקציר או קבוצה של נושאים.

ואז מתחיל התהליך,
1. הסוכן הראשון, בעל גישה למקורות מהאינטרנט נגיד, מייצר טיוטות תוכן מרובות בהתבסס על הבריף הנתון.

2. הסוכן השני עם גישה למסד נתונים, פרסומים קודמים וכלים לניתוח מגמות יודע מה הקוראים אוהבים ומה לא, עובר על הטיוטות ומאשר את מה שרלוונטי.

3. הסוכן הראשון  מציע עריכות, מחדד את השפה, משפר את הזרימה הנרטיבית ומבטיח התאמה לקהל היעד ולהנחיות החברה.

4. הסוכן השני מצליב את התוכן עם מקורות אמינים, מאמת הצהרות עובדתיות ובודק הפרות אפשריות של זכויות יוצרים.

5. הסוכן הראשון יוצר תמונות מוסיף תמונות למאמר, כותב תקצירים עבור התמונות או הגרפיקה ושולח לאישור לפני פרסום.

6. מפרסמים.

7. הסוכן השני מנתח את הערות הקוראים, ביקורות ומדדי מעורבות כדי לזהות מגמות, העדפות ואזורי שיפור ומציע הצעות לנושאים חדשים או התאמות עתידיות על סמך משוב זה.

8. התהליך חוזר חלילה.

כמובן שזהו תהליך מצומצם מאוד, אבל יכולת החיפוש, למידה, ביצוע ודיוקים להמשך רלוונטים לכל תהליך באשר הוא בעסק,
בין אם מדובר בדיוק הלקוחות לשיחות מכירה, ביצוע רעיונות לעובדים חדשים או תקשורת עם ספקים להזמנת סחורה.

כלומר כל תהליך רפטטיבי באירגון, לסוכן שלנו יש איך לעזור ןמכאן אנחנו מבינים שכל סוכן יכול לעזור לסוכן אחר.
כי ממש ככה עובדים הסוכנים שלנו, יש משימת על, דברים שצריך לקחת בחשבון ומשימות המושפעות מהסביבה המשתנה.
והסוכנים שלנו עונים על כל הדרישות!

 

אוטומציה של משימות שגרתיות: עם תכונות הלמידה וההסתגלות הטבועות בהם, הם יכולים להתמודד עם משימות שגרתיות בדיוק ובמהירות ללא תחרות.

SOPs:  מרכיב ההשתקפות בסוכנים מאפשר להם להתפתח על סמך משוב.כתוצאה מכך, SOPs יכולים להישאר דינמיים, תוך אופטימיזציה ככל שצצים נתונים חדשים.

מזעור שגיאות: הדיוק המובנה של הסוכנים מבטיח הפחתה דרסטית בטעויות אנוש, מה שמוביל לתפוקות עקביות ואיכותיות.

ניתוח נתונים ומשוב בזמן אמת: סוכנים אלה יכולים לספק תובנות מיידיות לגבי תהליכים, ובכך לאפשר פתרון בעיות וקבלת החלטות מהירים.

 

ומעכשיו, הסוכנים הללו נמצאים בקוד פתוח!

 

עם זמינות הקוד הפתוח שלהם, סוכנים גנרטיביים הולכים להגדיר מחדש את יחסי הגומלין בין בני אדם לטכנולוגיה. 

הפוטנציאל שלהם טמון לא רק ביכולתם לחקות התנהגות אנושית, אלא ביכולתם לייעל, להתאים ולשפר את הפעולות בין התעשיות. 

ככל שאנו משלבים יותר ויותר את סוכני הבינה המלאכותית הללו בתשתיות שלנו, אנו עדים לשינוי קיצוני, המאופיין ביעילות, עקביות וכושר הסתגלות שאין שני להם. 

האופק נראה מבטיח ולגמרי מבשר על עידן חדש בשיתוף פעולה הדוק בין אנשים ל – AI.

העסקים והארגונים שישכילו להתאים את עצמם ברמת האוריינות והמיינדסט לסוכנים החדשים, ישתמשו בהם ויתאימו אותם לעצמם.

לדעתי, ינצחו במירוץ.

מי שרוצה לראות את ההקלטה של הניסוי : https://reverie.herokuapp.com/arXiv_Demo/

מי שרוצה לקרוא את המאמר: https://arxiv.org/pdf/2304.03442.pdf

 

 

 

Recent Posts