אחד הפערים בבינה המלאכותית של היום

(פורסם בתאריך 17.4.2023)

בימים אלו, כאשר שומעים את צמד המילים "בינה מלאכותית", חושבים באופן מיידי על בינה מלאכותית יוצרת (Generative AI). הנטייה לעשות כך מתבקשת בהתחשב בפוטנציאל הגדול של התחום, ובעיסוק האינטנסיבי בנושא.
אבל בינה מלאכותית היא הרבה יותר מכך, ובמאמר זה אני מתאר זווית ראיה קצת אחרת ופחות מקובלת מהעיסוק העכשווי בנושא. אני עומד לסקור פער שקצת מוזנח כיום, כאשר כדאי לדעתי, להסב משאבים למחקר ופיתוח לשם סגירת פער זה.

אך לפני שנתחיל, אני רוצה להגדיר את המושג בינה מלאכותית בדרך הבאה: "בינה מלאכותית היא פעילות אלקטרונית, המדמה את אופן החשיבה של מוח האדם רק בדרך מהירה ויעילה יותר."

אני מניח שההגדרה נראית טריוויאלית לרוב הקוראים, עם זאת, ההגדרה כפי שכתבתי אותה חשובה בעיניי. למה? כי לכולנו ברור שמחשבים פועלים מהר ויעיל יותר מבני האדם. אבל מכיוון שעיצבנו את העולם על פי דרך החשיבה שלנו, הדגש בהתייחסות לבינה המלאכותית היא עד כמה היא מסוגלת לחשוב, או לפעול כמונו – בני האדם.

כשחושבים על בינה מלאכותית כיום, חושבים על רשת נוירונים (CNN) כזאת או אחרת. נכון, יש גם אלגוריתמיקה נוספת "קלאסית" שאינה רשת, אבל היא בשוליים. כיום כל שיטות הבינה המלאכותית: "למידה עמוקה" (DL), "למידת מכונה" (ML), "בינה מלאכותית גנרית" (AGI), והלהיט התורן: "בינה מלאכותית יוצרת" (Generative AI). בין אם בלמידה מבוקרת (supervised) או לא. כולן משתמשות ברשתות נוירונים בצורה כזאת או אחרת.

ולכולן בקירוב אותם המאפיינים, שמתוכם אני מעוניין להדגיש את המאפיינים הבאים:

מהירות רבה. בהנחה שקיים GPU מתאים כמובן.
מקביליות. ניתן להריץ יותר מאלגוריתם אחד במקביל (כאמור, ב-GPU מתאים)
אוטומטיות. מרגע שנכנס קלט, יוצא פלט.
ללא מוסר, שיפוט או ספק.
ללא שליטה. אין באמת שליטה על הפלט שיוצא.
התוצאה תלויה פחות או יותר (לא לינארית) בתצורה שבה הרשת אומנה בעבר.

מדובר למעשה בהתאמת תבניות (Pattern Matching) מורכבת ומתוחכמת. לא יותר ולא פחות.

בנקודה זו אני מעוניין לעשות הפסקה מסקירת הבינה המלאכותית, ולעבור אל מוח האדם. חתן פרס נובל, פרופסור דניאל כהנמן מתאר בספרו "לחשוב מהר לחשוב לאט" את אופן החשיבה של האדם כשתי מערכות. החלוקה הזאת היא לוגית בעיקרה, אם כי ניתן לראות לדבריו, פעילות של אזורים שונים במוח לכל מערכת חשיבה.

שתי המערכות על פי כהנמן פועלות בצורה שונה לגמרי בתוך הראש שלנו. בדרך כלל, מקובל לתאר את מערכת 1 תחילה, ואז לתאר את מערכת 2. אני מעוניין לתאר את המערכות בכיוון ההפוך. ומיד גם יהיה ברור למה.

אז נתחיל במערכת 2. אלו בקצרה התכונות שלה:

איטית, מחייבת קשב וריכוז, טורית (מאפשרת לעשות רק פעולה אחת בו זמנית), נשלטת, דורשת מאמץ, עצלנית, מטילה ספק, מוסרית, שיפוטית ומפעילה שיקול דעת.

ועכשיו, אחרי שסקרנו את התכונות של מערכת 2, בואו נבחן את התכונות של מערכת 1 (שהיא כאמור ההיפך ממערכת 2):

מהירה מאד
פועלת באופן אוטומטי
ללא שליטה רצונית
חשיבה מקבילית
ללא מאמץ
ללא שיפוט או מוסר
ללא הטלת ספק
ללא שיקול דעת

למעשה, מערכת 1, שהיא האינטואיציה שלנו, היא מעיין מערכת של התאמת תבניות (Pattern Matching) מורכבת. היא "נבנית" עם השנים מהניסיון שלנו. על פי כהנמן, הרי שחזרות רבות על דבר מה, הופכים אותו לחלק מהאינטואיציה שלנו, למערכת 1.

עתה, בואו נחזור אל הבינה המלאכותית. אין צורך במומחה כדי להבחין בדבר הבא: הבינה המלאכותית העכשווית חופפת באופן כמעט מושלם, את אופן החשיבה של האדם כפי שהוא בא לידי ביטוי במערכת 1. ובאותה הנשימה, ניתן לומר גם שהבינה המלאכותית כמעט ואינה נוגעת במערכת 2.

שתי שאלות עולות מיידית מהאמור: האם זה באמת כך? ואם כן, אז מה קורה עם מערכת 2? איפה כל המחקר בעולם?

אתחיל ממענה לשאלה השנייה קודם: ככל הידוע לי אין מחקר בכל הקשור למערכת 2. יכול להיות שיש מתחת לרדאר, אבל כמעט ואין פרסומים בנושא. ובכלל, נראה שעולם הבינה מלאכותית אינו מתקדם לכיוון הזה – של חיקוי מערכת 2.

אני באופן אישי, עוסק בנושא. הגעתי לתחום הבינה המלאכותית מעולם קבלת ההחלטות, ואני בודק כמה כיוונים המקשרים את הבינה המלאכותית כמערכת 2 לעולם קבלת ההחלטות, אבל המחקר שלי רק בחיתוליו, וללא תמיכה של ארגון גדול, אני לא צופה שהוא יתקדם בקצב גבוה. שאר העולם לצערי, לא באמת בכיוון.

קיים אמנם תחום שנקרא: (XAI) Explainable AI, אולם הוא רחוק (מאד) ממערכת 2. XAI נוצר כי החוקרים הבינו ש"משהו חסר", אבל לא באמת הבינו מה. XAI מנסה לספק תשובה לשאלה: "איך הבינה המלאכותית הגיעה להחלטה?" זאת כדי שאפשר יהיה להבין לא רק את אי-הלינאריות שלה, אלא גם לבטוח בתוצאה המתקבלת, ועקב כך לבטוח בבינה המלאכותית עצמה. אם נחזור להגדרה של הבינה המלאכותית בהתחלה, ברור כי לא מדובר בהרחבת היכולות אלא בניסיון להבין. בהשלכה לאופן החשיבה של האדם מדובר בחוקר מוח או בפסיכולוג שמסביר איך האינטואיציה עובדת, ולא במערכת 2 עצמה.

ובחזרה לשאלה הראשונה, ובמיוחד אם הגענו למסקנה שהעולם לא נמצא שם: אולי באמת ההנחה שהצגתי שגויה. אולי זה לא באמת כך, שכל הבינה המלאכותית בעולם מחקה רק את מערכת 1 של האדם. כלומר 50% מיכולת החשיבה שלנו.

ובכן, יכול מאד להיות שאני טועה. עם זאת, הרבה סימנים מעידים על ההיפך.

ראשית, המבנה הפיזי, ואופן הפעולה נראים דומים מאד. גם דרך "הכנסת" המידע – אימון, דומה מאד. והכי חשוב: גם בבינה מלאכותית וגם באינטואיציה (מערכת 1), וכפי שהזכרתי מקודם, אנחנו לא באמת מצליחים להסביר לעצמנו איך התקבלה התוצאה. קשה עד בלתי אפשרי לצפות בדיוק את התוצאה המתקבלת. יש המכנים את התוצאה "לא לינארית" כדי להמחיש את חוסר הקשר (הישיר) בין הקלט לפלט. התוצאות המתקבלות, או לייתר דיוק מרחב התוצאה, דומה בין הבינה המלאכותית למערכת 1 בצורה כה מבהיקה, עד כי צריך ממש להתאמץ כדי לשלול הטענה.

אבל אני רוצה "להוכיח" זאת בדרך אחרת. על דרך השלילה, תוך כדי שאני מתאר את היתרונות והחסרונות של הבינה המלאכותית בנושא שלכאורה לא נראה קשור: נהיגה אוטונומית.

בנקודה זו נחזור שוב למוח האדם ונסקור את הנהיגה ביחס לשתי מערכות החשיבה. תיאור מפורט יותר ניתן למצוא בספר שלי פשוט להחליט, בפרק 9. אחזור כאן על הדברים בקצרה.

רוב הנהיגה מתבצעת על ידי מערכת 1. כלומר אוטומטית, במהירות, מבלי להקדיש לכך תשומת לב. מדי פעם מערכת 1 מגיעה למצב שבו אין לה מושג מה לעשות, ואז היא "קוראת" למערכת 2 שתיתן מענה.

שתי דוגמאות להמחשה: אתם חוזרים בנסיעה מפגישה חשובה, מאוחר בלילה. התנועה דלילה, ואתם מרוכזים בפגישה שהייתה. פתאום אתם שמים לב שאתם נמצאים בחנייה של ביתכם. איך זה קרה? בכלל לא שמתם לב. מה שקרה זה שמערכת 1 נהגה במכונית, ולא היו אירועים חריגים. אז מערכת 2 שהייתה "עסוקה" עדיין בפגישה, לא הקדישה תשומת לב לנהיגה כלל. עד שהגעתם הביתה.

דוגמא שנייה: אתם נוסעים ומדברים עם מישהו בטלפון (בדיבורית). פתאום ילד קופץ לכביש. מערכת 1 לא יודעת להתמודד עם ילד שקופץ לכביש ולכן קוראת מיד למערכת 2 ש"לוקחת פיקוד" על הנהיגה ומונעת את הפגיעה בילד על ידי בלימה, הסטת הרכב או שניהם. האדם מהצד השני של הטלפון ממשיך לדבר אתכם אבל אתם לא מקשיבים לו כלל. מערכת 2 היא טורית, וכרגע מטפלת במצב החרום בכביש.

עתה בואו נחזור לעולם הבינה המלאכותית שאחראית על הנהיגה האוטונומית.
וכן, אני מתאר לעצמי מה אתם חושבים. איך? אתם בוודאי שואלים, אצל האדם נוהגות שתי המערכות ברכב: רוב הזמן מערכת 1, אבל מדי פעם מערכת 2. ואילו בבינה מלאכותית לדבריך, יש רק מערכת 1. אז איך מכוניות אוטונומיות נוסעות? ואנחנו הרי יודעים שהן מצליחות לנהוג לא רע.

ואתם צודקים. מכוניות אוטונומיות נוהגות בהצלחה רבה רק עם בינה מלאכותית הפועלת כמו מערכת 1. איך? כי מערכת 1 פירושה ניסיון. אצל האדם זה רק הניסיון שלו. אבל בינה מלאכותית יכולה לצבור ניסיון של אלפי ואפילו מיליוני בני אדם. ChatGPT כדוגמא. עם כל כך הרבה ניסיון, גם ילד שקופץ לכביש אפשר לנהל עם מערכת 1.

ואחרי כל זה, יש פעולה של ברירת מחדל. אם מגיעים למצב שהתוכנה אינה יודעת לפתור, אפשר פשוט לעצור, ולתת לתמיכה "הטכנית" להשתלט מרחוק על הרכב ולפתור את הבעיה. במילים אחרות, הבעיה פתירה.

אלא... אם אחת הבעיות שמחייבות את התערבות מערכת 2, דורשת פעולה אקטיבית במקום עצירה. במצב כזה, לבינה המלאכותית כיום אין מענה. לדוגמא: אתם רוצים לפנות שמאלה בצומת מרומזר בגרמניה או בארה"ב (בשתי מדינות אלו אין רמזור נפרד לפנייה שמאלה). אם התנועה דלילה, אין בעיה לפנות. אבל כשהתנועה סואנת, אתם חייבים את מערכת 2 שתיכנס לפעולה. ואיך המכונית האוטונומית מצליחה להתמודד עם האתגר? ובכן, היא לא. למכונית האוטונומית יש כמה נקודות כשל ידועות. פנייה שמאלה בצומת מרומזרת ללא רמזור מפורש ידועה כאחת מהן. כלומר, מאחר והנהיגה האוטונומית משתמשת בבינה מלאכותית של מערכת 1 בלבד, במקומות בהן צריך את מערכת 2, אין לנהיגה האוטונומית מענה.

מהנדסים של המכונית האוטונומית ששמעו ממני את הטענה הזאת, סיפרו לי על ניסיונות שלהם להתמודד עם הפנייה שמאלה בצומת מרומזר על ידי הרחבה של ה-AI. בחלק מהמקרים שילוב של חומרה שאינה רשת ניירונים כמו עץ החלטות, יחד עם הרשתות הקיימות, ועוד. מה שמייחד את הניסיונות האלו, זה שהם עוד מאותו הדבר, ולאו דווקא גישה חדשה. ולכן גם בניסיונות אלו אין התקדמות לכיוון מערכת 2.

לדוגמא, כאשר נתקלים בכשל כשלהו, כדוגמת הפנייה שמאלה, מנסים מבנה חדש, ואז מאמנים את המבנה החדש על דוגמאות של הכשל. התפיסה הזאת שייכת למערכת 1. מערכת 2 פועלת אחרת לחלוטין.

מערכת 1 יודעת לפתור בעיות. מערכת 2 יודעת להגדיר את הבעיות. כרגע, בכל דוגמאות הכשל של המכונית האוטונומית, מי שמגדיר את הבעיה – את הכשל – אלו הם המהנדסים, המשתמשים במערכת 2 שלהם. למכונית עצמה אין את היכולת לעשות זאת. ועובדה זו, תומכת בטענה שהעליתי.

לסיכום אחזור על הטענה שלי: כל צורות הבינה המלאכותית הקיימות כיום מחקות את אופי החשיבה של מערכת 1 בלבד, ומתעלמות כמעט לחלוטין מדרך החשיבה של מערכת 2. במילים אחרות, הבינה המלאכותית מחקה בערך 50% מיכולת החשיבה של האדם.

ושאלה נוספת שעשויה – או עלולה – לצוץ בעקבות המאמר:
האם, ברגע שנפתח בינה מלאכותית המסוגלת לחקות את אופן הפעולה של שתי מערכות החשיבה של האדם, האם במצב כזה נביא את הבינה המלאכותית לכך שתהיה לה תודעה עצמית?
על כך במאמר הבא.

אורי יהלום Uri Yahalom

אחד הפערים בבינה המלאכותית של היום