• Nitay Calderon

כיצד משתמשים בדאטה ליצירת שפה משותפת בחברה?

Updated: Apr 24

מאת: ניתאי קלדרון ו-רועי ששון


האם מגדל בבל נפל בגלל בעיות תקשורת?


את סיפור מגדל בבל, כולנו מכירים (תקציר - בשחר האנושות ניסו בני האדם לבנות מגדל גבוה יחדיו ונכשלו). הסיפור, המתואר בתשעה פסוקים בספר בראשית, מראה לנו כי בעיית השפה והתקשורת בין אנשים איננה חדשה, וקיימת בחברה כבר אלפי שנים.


"וַיֹּאמֶר ה' הֵן עַם אֶחָד וְשָׂפָה אַחַת לְכֻלָּם וְזֶה הַחִלָּם לַעֲשׂוֹת וְעַתָּה לֹא יִבָּצֵר מֵהֶם כֹּל אֲשֶׁר יָזְמוּ לַעֲשׂוֹת: הָבָה נֵרְדָה וְנָבְלָה שָׁם שְׂפָתָם אֲשֶׁר לֹא יִשְׁמְעוּ אִישׁ שְׂפַת רֵעֵהוּ"

(בראשית י"א, פסוקים ו-ז).


בזכות השפה המשותפת, בני האדם הצליחו לבנות את המגדל. על מנת למנוע מהם לעשות זאת, אלוהים מבלבל את שפתם ומביא לכשלונם. סיפור בבל ממחיש לנו כי מחסור בשפה משותפת מהווה מכשול להצלחת החברה. הכוונה אינה לכך שהחברה מכילה עובדים דוברי שפות שונות כמו עברית, אנגלית רוסית או ערבית, אלא לשפה ארגונית שאינה אחידה בין העובדים. מאז נפילת מגדל בבל אמנם עברו כמה אלפי שנים, אך הבעיה רלוונטית מתמיד, כפי שניתן לראות בדוגמאות הבאות.



יוסטון - יש לנו בעיה...


ב-11 בדצמבר 1998 שוגר לחלל הלוויין לחקר האקלים של מאדים (Mars Climate Orbiter), שנועד לספק מידע על האקלים והאטמוספירה של כוכב הלכת האדום. לאחר מסע של תשעה חודשים, ב-23 בספטמבר 1999, החלה החללית בתמרון הכניסה למסלול סביב מאדים, אבל נכנסה למסלול נמוך מדי ונעלמה. המשימה נכשלה. בחקירת נסיבות הכישלון התגלה כי התקלה נגרמה בשל טעות אנוש. מחשבי החללית קיבלו נתוני דחף ביחידות מדידה אמריקאיות בעוד שהיא תוכנתה לקבל נתוני דחף ביחידות מטריות (ניוטון). הבלבול שנבע מהעדר מטריקה אחידה, המכונה בנאס"א metric mixup (הבלבול המטרי), גרם לחללית להיכנס למסלול נמוך מהמתוכנן וכתוצאה מכך היא נשרפה מהחיכוך באטמוספירה. איך פרויקט המושקעים בו מאות מיליוני דולרים מצליח להיכשל בגלל טעות כל כך קטנה? התשובה היא מחסור בשפה משותפת, והיכולת לתקשר ולאכוף שפה אחידה.



הבדיקה חיובית - מאומת או מחלים?


סיפור מעניין נוסף התרחש בשיאה של מגפת הקורונה בקיץ 2020 במחוז Orange County שבקליפורניה. משרד הבריאות המחוזי הציג בפני התושבים דאשבורד המכיל נתונים מגוונים לגבי המגיפה כמו מספר הבדיקות, מספר המאומתים ואחוז הבדיקות החיוביות. לאחר מספר ימים, נשמעו קריאות כנגד המשרד על כך שהוא מבצע מניפולציות בנתונים ומציג אחוז בדיקות חיוביות גבוה יותר מהאחוז האמיתי (ובכך מקדם מגבלות נוספות ומייצר בהלה מיותרת). ובאמת, חישוב ידני של מספר המאומתים מחולק במספר הבדיקות הציג אחוז נמוך משמעותית מאחוז הבדיקות החיוביות שהוצג בדאשבורד. מה גרם לפער? מספר המאומתים החיוביים שהוצג אכן תאם את מספרם האמיתי, אך מספר הבדיקות כלל גם בדיקות PCR וגם בדיקות סרולוגיות, שאינן מתאימות לגילוי נדבקים חדשים אלא לזיהוי מחלימים. את הבלבול המיותר שיצר המשרד ניתן היה לפתור בקלות. משרד הבריאות היה צריך להגדיר בבירור מה מציגה כל מטריקה ולא לקשור בין בדיקות בעלות מטרות שונות. בעקבות המקרה, הסיר המשרד את הדאשבורד והחליף אותו באחד חדש בו מוגדרת כל מטריקה ומצוין סוג הבדיקה.


תפקיד ארגון הדאטה: גם למ"ס וגם ויקיפדיה. ממש לא ארנולד שוורצנגר.


חברה כוללת הרבה גופים וארגונים: חטיבה עסקית, פיתוח, שירות לקוחות, אופרציה, שיווק, מוצר וכו'. גוף נוסף המתחיל לתפוס מקום חשוב סביב שולחן מקבלי ההחלטות הוא קבוצת הדאטה. בעידן הביג דאטה ושירותי הענן, מקצועם של אנשי הנתונים הוגדר מחדש וקיים בלבול רב בין תפקידים שונים כמו BI/BA/PA/DS. על כל פנים, תפקידם של כל אנשי הנתונים במשפט אחד הוא יצירת ידע וצבירתו באמצעות למידה מהיפוטזות, חיבור והעברה שלו בין כלל הגופים בחברה. קבוצת הדאטה צריכה לתפקד כמעין 'למ"ס' של החברה - גוף לא פוליטי הקובע את האמת הארגונית באופן בלתי מוטה ככל הניתן (לכל נתון ומטריקה יש את ההטיות שלהם). הרבה אנשי נתונים תופסים עצמם כמי שבונים באמצעות בינה מלאכותית את ה-Terminator, וזוהי טעות. ברוב החברות המטרה האמיתית שלהם צריכה להיות בניית הויקיפדיה הארגונית, ממנה ניתן לגזור מסקנות ותובנות לטובת מקבלי ההחלטות והלקוחות (גם באמצעות בינה מלאכותית). ניהול והצגת נתונים הוא רק קצה הקרחון של תפקיד קבוצת הדאטה. הקבוצה לא צריכה להיות ארגון של נתונים אלא ארגון של ידע (ממש כמו ויקיפדיה). מצד אחד הקבוצה צריכה לאפשר תזוזה מהירה על ידי ניסוי וטעיה באמצעות מטריקות הנגזרות מהנתונים, אך מצד שני הקבוצה צריכה לשתף ולשמר ידע שצברה ולסדר אותו כמו כל ארגון הנדסי על מנת לאפשר התרחבות וגדילה. אנחנו מזמינים אתכם לצפות בסרטון הבא על מנת להבין את התפקיד של קבוצת הדאטה, בהתאם לשלבים השונים בהתפתחות הארגון והמוצר.


"אלו לא המספרים שאני מכירה"


נסו לדמיין סיטואציה בה מנהלים של מספר גופים בחברת מסחר יושבים סביב שולחן עגול במטרה לגבש תוכנית להגדלת מספר המשתמשים באתר הרכישות המקוון. תוך כדי הפגישה, מספר מנהל השיווק כי בחודש ינואר היה גידול של 20% במשתמשים בעקבות קמפיין פרסומי. "אלו לא המספרים שאני מכירה" עונה לו מנהלת הפיתוח. "רגע, איך אתה מגדיר משתמש" שואל מנהל המכירות. "משתמש הוא כל מי שנחשף לקמפיין שלנו ונכנס לאתר" טוען מנהל השיווק. מנגד, מנהלת הפיתוח עונה לו כי "כניסה בודדת עשויה להטעות, אותו משתמש יכול להיחשף לקמפיינים שונים לאורך תקופה. איך ניתן לדעת איזה קמפיין גרם לו להיכנס?". "אבל למי אכפת מכניסות?" מגיב מנהל המכירות. "רק מי שביצע רכישה מייצר הכנסה לחברה, וזה הדבר היחידי שמעניין". מנהל שירות הלקוחות מצטרף גם הוא לחגיגה "אבל מה אם הוא לא הצטרף למועדון הלקוחות?". פגישה שלמה מתבזבזת על הניסיון להבין את ההגדרות השונות ובסופה עדיין לא מצליחים להכריע מהי ההגדרה הנכונה. כשמנכ"ל החברה יבקש דו"ח שיעקוב אחר הגידול במספר המשתמשים, במקום גרף בודד, הוא עשוי לקבל דו"ח עם עשרות גרפים עם מספרים שונים על פיהם לא ניתן לקבל שום החלטה. זה קורה כיוון שלכל גוף בחברה יש את סוגי המידע החשובים לו, שפה משלו, מטריקות עליהן מסתמך ויעדים ייחודיים אותם שואף להשיג.



מרבה נתונים, מרבה דאגה


חברות משקיעות משאבים רבים על מנת לאסוף ולאחסן נתונים, ואכן, בשנים האחרונות ישנה התקדמות משמעותית בתחום. ככל שכמות הנתונים גדלה, כך יותר צרכני נתונים בחברה מתחרים על הגישה לזמן של אנשי הדאטה. כאשר הם מקבלים את ההזדמנות לעבוד יחדיו, שני הצדדים מתקשים להבין אחד את השני כהלכה, כך שנעשות הנחות שגויות מצד אנשי הנתונים, התוצר לא עומד בציפיות, העבודה נעשית לשווא או חוזרת על עצמה, התסכול של שני הצדדים גובר והסיכוי לעבודה משותפת עתידית קטן. החברות לא מצליחות להפיק את מלוא הפוטנציאל מהמידע שלהן, והנתונים לא עומדים במרכז העסק. חשוב לציין שהדבר נכון לחברות גדולות וקטנות, חברות טכנולוגיות או מתעשיות מסורתיות. זהו פועל יוצא של האופן שבו חברות בנויות, בשילוב העובדה שהצורך התחרותי להשתמש בנתונים הפך לחובה.


גיוס לא פוסק של אנשי נתונים - עוד אנליסטים, עוד מהנדסים ועוד מדעני נתונים גם לא יביא לשינוי המיוחל ברוב המקרים. השינוי יגיע רק כאשר ידע באמת יעבור מצד אחד של החברה לצדה השני, וזה יקרה רק כאשר לכלל העובדים בחברה - כמו גם לנתונים - תהיה שפה משותפת.


תסמינים למחסור בשפה משותפת


אם לפחות שניים מהתרחישים הבאים מוכרים לך, ייתכן והחברה שלך סובלת ממחסור בשפה משותפת:

  • חלק ניכר מהדיונים סביב שולחן מקבלי ההחלטות אינם עניינים ועוסקים במריבות על הגדרות.

  • קשה להכליל תובנות אשר נוצרות בצד אחד של הארגון להחלטות בצד אחר של הארגון (לדוגמא - תוצאות של קמפיין שיווקי, פיצ׳ר חדש במוצר וכולי).

  • גופים בחברה נמנעים משיתוף פעולה כיוון שלכל גוף יש "ויז'ן" משלו, דרך פעולה משלו, כלים ומידע ומשלו.

  • עובדים מגופים שונים בחברה לא מצליחים להסביר אחד לשני את התפקיד שלהם ועל בסיס מה הם נמדדים.

  • מנוע חיפוש ארגוני גרוע במיוחד - במקום להשתמש בו, פונים לעובדים: "מי מכיר את X?".

  • עובדים לא מכירים ולא מצליחים להבין את המטרות והיעדים העסקיים של החברה.

  • מסד הנתונים מכיל טבלאות כפולות ועמודות בעלות שם זהה שאינן מכילות את אותו מידע.

  • על מנת להבין מה מכילים נתונים בטבלה במסד, דו"ח או דאשבורד צריך לשלוח מייל לקבוצת הדאטה.

  • יש ריבוי דו"חות ודאשבורדים - צרכני נתונים משתמשים בדאשבורדים שונים למרות שמסתכלים על אותו מידע.

  • דו"חות ודאשבורדים מציגים מספרים שונים ונתונים סותרים, פונים לקבוצת הדאטה: "הסתכלתי על הדו"ח של עובד X וראיתי שהמספרים שונים משלי. אצל מי המספרים האמיתיים?"

  • כל חודש יוצאת גרסה חדשה לדו"ח או דאשבורד בעקבות עדכון הגדרות, וצרכני נתונים משתמשים בגרסאות לא עדכניות.

  • המספרים עודכנו לאחור - לא ניתן לעקוב אחר ההחלטה או שהחלטה שהתקבלה בעבר לא מובנת כיוון שמוצגים מספרים השונים מעת קבלתה.

  • קבוצת הדאטה לא מצליחה להתאים פרויקטים בין גופים שונים בחברה, וצריכה לכתוב קוד מהתחלה.

  • פתרונות בינה מלאכותית נכשלים כיוון שהמטרה שלהם לא הובנה כראוי או לא הוגדרה בצורה מדויקת.

  • מדעני נתונים משתמשים בנתונים שאינם נגישים בזמן אמת בפתרונות אותם הם מציעים.

קיימים עוד תרחישים רבים... אבל נראה לנו שהבנתם את הבעיה.


בקורס ניתוח נתונים למנהלים שאנחנו מעבירים במרכז הבינתחומי (הקורס הבא - אוקטובר 2021) אנו מסבירים לעומק כיצד נכון לנהל ידע בחברה וכיצד ניתן לייצר שפה משותפת שהינה חלק מתשתית הדאטה והטכנולוגיה.


סיכום: בפוסט הנוכחי דנו באחד מן המחסומים המונעים מחברה להפוך להיות מכוונת נתונים - מחסור בשפה משותפת, והסממנים לכך שהארגון שלכם זקוק לשפה משותפת. בפוסט הבא נציג דרך להתמודד עם מחסור זה - שימוש בטקסונומיה - מילון ארגוני היררכי המאגד בתוכו הגדרות של מושגים כמו ישויות, פעולות, יעדים ומטריקות.


לשאלות על הפוסט והתייעצות - התחברו אלינו בלינקדאין וכיתבו לנו, או לחצו כאן והירשמו לניוזלטר שלנו על מנת להשאר מעודכנים לגבי מה שחשוב בתעשיית הדאטה.

אם מצאתם את הבעיות שאנו עוסקים בהן מעניינות - הירשמו לאתר שלנו - ותוכלו להתעדכן בתכנים חדשים שאנו מעלים לגבי הבעיות הבוערות ביותר לארגונים בנושא הדאטה, החל מ-AI (בינה מלאכותית) ועד ל-BI (בינה עיסקית).


ניתאי קלדרון ו-רועי ששון


(הדעות המוצגות בכתבה זו הינן דעותינו האישיות בלבד)