• Roy Sasson

דאטה הוא כמו קופסת שוקולד. אתה אף פעם לא יודע מה אתה הולך לקבל (בפרט כשאתה צעיר)

מאת: פיליפ אדג׳ימן ו-רועי ששון


"הפרדוקס של החינוך הוא בדיוק זה - כשהתלמיד מתחיל להיות מודע, הוא מתחיל לבחון את החברה בה הוא התחנך"


זו עשויה להיות השורה המצוטטת ביותר מ"שיחה עם מורים" שכתב ג'יימס בולדווין. מורה, כך האמין בולדווין, צריך לדחוף את התלמידים להבין שהעולם עוצב על ידי האנשים שהגיעו לפנינו, אך שאפשר ומוטב לשנות אותו ולעצבו מחדש.


איך אנחנו כמחנכים יכולים לשאוף ללמד את הידע החשוב ביותר? להתבונן בעולם ולדעת להטיל בו ספק, לבקר אותו ולנסות למצוא כיצד להפוך אותו לטוב יותר. את היכולת החשובה שכינה בולדווין "לבחון את החברה" ניתן לכנות בשמה המקצועי - ניתוח נתונים. בסופו של יום, אדם סופג אין סוף נתונים שמגיעים אליו מכל עבר ויוצר באמצעותם את תמונת המציאות של חייו. בעבר הנתונים היו נישאים באוויר תוך כדי שיח, ולא היו כל כך הרבה מקורות מידע וקירובים למדידה, אבל נראה שהיום, הרבה מהדברים המשפיעים על חיי היום יום שלנו - ניתן למדוד, ואפילו ביותר מדרך אחת.


בני גילנו (סביבות 40), שמעו לראשונה ש"סטטיסטיקה" היא תחום מדעי לראשונה איפהשהו בתיכון, ואם למדו כלכלה או מדעים - נפגשו בנתונים בפעם הראשונה כנראה רק בגיל 22 (!), בשנה השנייה ללימודים באוניברסיטה. למה בעצם אנחנו לא נחשפים לעבודה עם נתונים בסביבה מבוקרת לפני כן? מכיוון שאנו מוזנים בכמויות כה אדירות של נתונים, איננו טורחים לבחון את הנתונים עצמם. כלומר, אנו עוסקים כל העת בניתוח ובהרכבה של המידע לכדי תמונה קוהרנטית ומוותרים על השלב הכי חשוב - בחינת הנתונים בעצמנו. כך גם לדוגמא, עד לפני חמש שנים אפילו קורסי מבוא לסטטיסטיקה באוניברסיטאות נלמדו ללא נתונים כלל. הם עסקו בעיקר בחישובי הסיכוי לשליפה של כדורים אדומים מתוך כדים, או לקבל שש-בש בזוג קוביות או רצף בפוקר (כייף לא קטן, אבל לא קשור כ״כ לנתונים).


בתרבות שבה כל רשת חברתית צריכה להעסיק אנשים שתפקידם לוודא שכל טקסט שנכתב נמצא בהלימה עם העובדות, צעירים (וגם המחנכים שלהם שחוטאים בכך לא פחות) מוותרים על הבדיקה הזו בעצמם ומניחים שכאשר המידע הגיע אליהם - הוא הגיע בצורתו המוגמרת ומוכן לשימוש. הורים רבים נמצאים במירוץ ללמד את ילדיהם לקודד וזוהי באמת אחת מהיכולות החשובות של המאה העשרים ואחת (לא רק אנחנו אמרנו. גם מנכ״ל אפל, טים קוק) - אבל לפני כן, בעידן שבו הדאטה זורם כמו מים ולא תמיד מתורגם לידע - שווה להשקיע ולשפר את האופן שבו אנו מפרשים את הידע הזה.


תרגיל 1: ניתוח מגמות עם Google Trends - לבנות 12:


פיליפ משתף כי המורה של בתו השכילה ללמד את תלמידותיה לגשת ולנתח נתונים וזאת בעזרת כלי פשוט במיוחד – Google Trends. בתרגיל שלמטה, התלמידה (כיתה ו') מתבקשת לבחור מילה בסלנג ולענות על שתי שאלות פשוטות: 1. כמה נרחב השימוש במילה זו? 2. כיצד השימוש בה התפתח לאורך זמן? בשאלה הראשונה המסקנה לתלמידה היא כי מספר התוצאות בחיפוש גוגל אחר אותה מילה (בהשוואה למילה אחרת) יעניק לה אינטואיציה טובה של התפשטות או שימוש במילה.





לשאלה השנייה, וכאן זה נהיה מעניין עוד יותר, התלמידה מקבלת הסבר ש- Google Trends יכול להראות את התפתחות השימוש במילה לאורך זמן ואפשר גם להשתמש בכלי זה על מנת להשוות את המגמה של המילה למילה אחרת. החשיבה מאחורי התרגיל הזה יוצאת מן הכלל במספר היבטים: 1. התרגיל הופך למעניין יותר ומותאם אישית, שכן כל תלמידה תבחר את המילה הספציפית שלה. 2. התלמידה מתבקשת לפתח אינטואיציה בשאלה אנליטית, ובסופו של דבר נחשפת לכלי רב עוצמה המאפשר לאמת את האינטואיציה הזו. מדובר בכלי פשוט לשימוש, אינטרקטיבי ועוצמתי מאוד, והוא רק דוגמה אחת כיצד ניתן לחנך תלמידים לספק תשובות המגובות בנתונים.





תרגיל 2: ניתוח הטקסט על בסיס מליוני ספרים - נמצא בידיכם בלחיצת כפתור:


יש כלים היכולים לסייע לא רק באיסוף נתונים בכדי לאסוף את תשובות התלמידים, אלא גם לשימושים נוספים, כמו לימודי היסטוריה, פופולריות ו-ויראליות של תיאוריות שונות, וזאת כפי שהן נתפסות במליוני ספרים שסרקו בגוגל ומונגש ב-Google N-Grams, וניתן לחפש את הופעת המילים שבהם לאורך השנים (הרבה לפני שהמונח ״ויראלית״ היה משוייך לרשתות חברתיות. למעשה - הספר הראשון במסד הנתונים נכתב במאה ה-16). למשל - איזכור המילה סוציאליזם (קו אדום) לעומת המילה קפיטליזם (קו כחול. הנה הלינק לחיפוש) מאפשר לתהות האם תיאוריות סוציאליסטיות מתחילות לחזור להיות פופולריות, ובאילו מדינות. כאן נוספת דרגת קושי - המילה עצמה צריכה להיות מנותחת בקונטקסט שבו הופיעה - האם חיובי או שלילי.




תרגיל 3: דאטה הוא כמו קופסת שוקולד. אתה אף פעם לא יודע מה אתה הולך לקבל


ואם חפצה נפשכם לצפות כיצד דאטה יכול לשנות את הצורה שבה חשבתם על דברים, אנו מציעים שתצפו בסטטיסטיקאי הנס רוסילנג מציג כיצד התפיסה על התא המשפחתי והחיים המערביים כבר אינו כפי שחשבנו. נשמע משעמם נכון? בעזרת תרשימים גרפיים פשוטים ביותר, הוא מראה כיצד מגמות עולמיות בתחום הבריאות והכלכלה (שכמובן מגובות בהרבה דאטה) אינן כה דיכוטומיות וסטיגמטיות כפי שחשבנו בעבר. למשל, באיזו מדינה אזרחים חיים יותר זמן לדעתכם? ויטנאם או ארה"ב? אם תפתחו את הסרטון (כמה סרטונים בנושא סטטיסטיקה אתם מכירים שהגיעו ל-14 מיליון צפיות?) תגלו שבשנת 2002 גודל המשפחה הממוצעת ואורך החיים הממוצע היה זהה בין ארה"ב וויטנאם. רוסילנג מסביר כי מבלי להסתכל על הדאטה עצמו לא היינו יכולים לשער לעצמנו את השינוי האדיר שחל באסיה, ואת ההשפעה של השינוי הסוציולוגי שהיה בעל השפעה גדולה בהרבה מהשינוי הכלכלי שהביא לאותם נתונים בארה"ב.

עבור אלו מכם שיאמצו את ההמלצה ויחלו לחקור ולחנך צעירים אל תוך עולם הנתונים, חשוב מאוד שתיגשו אליו עם סט הכלים הנכון ביותר. ככל שהעולם נעשה מורכב יותר, הנתונים עוזרים לנו להבין מה באמת קורה בו ולקבל החלטות נבונות בהתאם לכך. כדי שבאמת תוכלו לצלול אל תוך עולם הנתונים בקלות, נכיר לכם כעת שישה כללים בסיסיים בבואכם לגשת לנתח נתונים. נדגים אותם באמצעות תרגיל נוסף: התחילו מחיפוש אחרי ״אוכלוסיית גרמניה״ בגוגל (אין צורך אפילו ב-Google Trends, הנה לינק לחיפוש):




על הגרף הזה נמחיש כיצד לשאול את השאלות הנכונות שיעזרו לכם בכל פעם שתרצו לנתח ו/או לתקשר מסביב לנתונים.


שישת הכללים שיסייעו לכם לתקשר בצורה יותר טובה עם נתונים:


1. מספר עם מטרה: מהו גודל אוכלוסיית גרמניה נכון לזמן האחרון שנמדד? למה חשוב לנו לדעת את המספר הזה ולעקוב אחריו? מי משתמש במידע הזה? מתי התחילו למדוד גודל אוכלוסיה?


2. הגדרות וביטחון בחישוב: כיצד המספר מחושב? מי חישב את המספר המדווח ולאיזו מטרה? אלו הטיות עשויות להיות בחישוב?


3. יחסיות: האם המספר הזה גדול או קטן? מהן מדינות שהיינו בוחרים להשוות אליהן?


4. רעננות הדאטה: בכל כמה זמן המספר מתעדכן? האם הוא עשוי להתעדכן בראייה לאחרו לאחר שנתונים חדשים מתגלים? או שמה המספר קופא בזמן?


5. דינמיקה והיסטוריה: כיצד המספר הזה עלה לאורך השנים? והאם אפשר לזהות אנומליות בנתונים? האם מקורן בטעות בחישוב? מתיקון שיטת החישוב? או מסיבה מעניינת אחרת?


6. תפיסת העולם שלנו: מה השפיע על השינויים בגודל האוכלוסייה לאורך השנים? כיצד נוכל להוכיח זאת?

  1. ילודה

  2. הגירה

  3. תמותה ותוחלת חיים

אל הכללים הללו, ניתן להוסיף את כלל הזהב החשוב ביותר. את הכלל הזה, פרסם הכלכלן טים הרפורד לכבוד יום הסטטיסטיקה העולמי והוא גם הבסיס לכל מי שהגיע עד לכאן בקריאה ולכל מי שיקח על עצמו להיות חלק מהאנשים שמבססים את חייהם על נתונים – היו סקרנים.

אל תיקחו אף מידע שניתן לכם כמובן מאליו, חקרו אותו שוב בצורה עצמאית ונסו לראות אם הגעתם לתוצאה אחרת, לכו תדעו, אולי תגלו שביב של מידע שהוצג לכולנו בצורה שגויה עד היום. תלמדו לקודד, אבל לא לפני שאתם יודעים איך הקוד שכתבתם ישפיע על העולם ובאיזו צורה הוא ישנה אותו, ואל תפסיקו לנסות לשפר את הצורה שבה ידע עובר בינינו.

בעולם הפוסט קורונה, ראינו עד כמה נתונים הפכו להיות חלק קריטי בחיי היום יום שלנו. אופן המדידה של רמות התחלואה משפיעות בצורה חד משמעית על האם נפגוש את סבא וסבתא והאם נלך לבית הספר או נפגוש את המרצה לסטטיסטיקה במסדרון או בזום. היכולת של כל אדם מן השורה לעכל, לפרש ולהשתמש בצורה ראויה בנתונים - הפכה ליכולת חשובה באופן שבו אנו מנווטים את חיינו וחיי יקירינו.

אחד המשפטים הזכורים ביותר מעולם הקולנוע, לקוח מהסרט האהוב פורסט גאמפ:


"Life is like a box of chocolates, you never know what you're gonna get"


זה נכון לחיים, וזה נכון גם לנתונים שאנחנו אוספים בכל רגע בשביל לספר ולהבין את החיים שסביבנו. וזה מה שהופך את הדאטה למעניין. מספרים המספרים לנו סיפורים.


לתכנים נוספים בנושא השכלה וחינוך לדאטה לחצו על הלינק או הירשמו לניוזלטר שלנו.


(הדיעות המוצגות בכתבה זו הינן דיעותינו האישיות בלבד)


 
  • LinkedIn
  • Twitter

© 2021 Dr. Roy Sasson