באחת מהסדנאות שהעברתי, שאלה אותי אחת המשתתפות את השאלה הבאה:
אילו אתגרים של דאטה אנליסט קיימים במקומות עבודה שונים?
(חברות ממשלתיות, חברות הייטק, עסקים קטנים, סטרטאפים וכו').
אז ככה: דאטה אנליסט (וגם Data Scientist) הוא אחד מהתחומים היותר מגוונים הקיימים היום.
הוא משלב כל כך הרבה דיסציפלינות שלעיתים אפשר לחשוב שהוא צריך להיות סופרמן…
וזה נכון – דאטה אנליסט טוב צריך לשאוף להיות 'סופרמן'. השאלה המהותית היא במה.
אז הנה רשימה חלקית (אך ממוקדת) של חמישה אתגרים של דאטה אנליסט בעבודה היומיומית.
אתגרים – שיכולים לבנות או להרוג לך את הקריירה בתחום…
אתגר ארגוני
כמעט בכל ארגון ישנם שני כוחות דומיננטיים: מצד אחד הביזנס – הם מביאים את הכסף לארגון שמאפשר לשלם משכורות לעובדים (ודיבידנד ותשואה יפים לבעלי המניות…)
ומצד שני מערכות המידע (IT) – הרי היום בלי טכנולוגיה אי אפשר באמת לזוז…
השפות של שני הגורמים האלה שונות לחלוטין – הם כלל לא יודעים לדבר אחד עם השני, וזה יוצר הרבה מאוד מתח ארגוני והתגוששויות.
דאטה אנליסט "תקוע" בדיוק באמצע ביניהם – והוא סובל ממעין "פיצול אישיות":
מצד אחד הוא איש טכני ש"מדבר עם הנתונים" ואפילו כותב קוד.
ומצד שני – הוא טוחן נתונים בדיוק בשביל לזהות תובנות שתשפרנה את התהליכים העסקיים…
אנליסט טוב חייב ללמוד לדבר את שתי השפות – גם שפה טכנית של מפתחים, וגם שפה עסקית של משתמשים/מנהלים.
איך עושים את זה?
קודם כל להתחיל במיקוד הנכון: מצד אחד ללמוד כל הזמן יכולות טכנולוגיות, ומצד שני – לשמור על הקשר לביזנס – להבין שכל שיטה טכנית אמורה לשרת בסופו של דבר שיפור ביצועים בחברה.
ומעבר לזה? פשוט לצבור הרבה מאוד ניסיון…
אתגרים טכניים
במהלך הקריירה ראיתי לא מעט אנליסטים "שוברים את הראש" מול המחשב.
חלק מהם אפילו צעקו עליו להריץ את הקוד, או לחילופין "עודדו" אותו לעבוד יותר מהר…
זה כמובן נובע מחוסר מסוים ביכולות טכניות – וזהו אחד המרכזיים בקרב אתגרים של דאטה אנליסט.
האתגר הוא לא רק לסגל יכולות בסיסיות כאלו – אלא ליצור יכולת להשתדרג ברמה הטכנולוגית כל הזמן.
בסטארטאפ יחסית קל לעשות את זה – יש כל הזמן סביבכם מתכנתים שיעזרו. יתרה מכך – מי שמגיע לסטארטאפ נוטה להימשך יותר לעולם הטכנולוגי ולחפש ללמוד כלים וסביבות חדשים.
אבל בארגון גדול – הסוגיה הטכנולוגית הופכת להיות מאוד מורכבת.
לא רק שאין סביבכם אנשים טכנולוגיים, אלא גם היכולת להטמיע כלים או טכנולוגיות חדשות בארגון כזה – היא מאוד איטית.
בנוסף – מאחר וה-IT רוצה לשמור (ובצדק) שליטה על שלמות תהליכי הנתונים בארגון – המשמעות היא שאנליסט הנתונים נשאר עם סט כלים יחסית בסיסי לניתוח, מה שדי מגביל אותו.
אז אלא אם כן תילחמו על הכנסת טכנולוגיות חדשות – זה פשוט לא יקרה.
ובשביל לדרוש הכנסת טכנולוגיות כאלה לארגון – צריך קודם כל להכיר אותן…
נגישות לנתונים ואיכות הנתונים
הסוגיה הבאה קשורה ישירות ליכולת של האנליסט "לגעת" בנתונים בצורה אפקטיבית.
אזהרה – מיתוס שהולך להתנפץ:
נתונים זה לא משהו שמקבלים מוכן עם כפית. נתונים הם דבר מלוכלך ומלא ברעש!
נתונים משקפים התנהגות של אנשים – בין אם בתור פעולות של משתמשים שהמערכת מתעדת, או בין אם בתור מפתחים שמגדירים איך לשמור את הפעולות הללו.
לכן – תמיד יהיו בנתונים רעשים, חוסר עקביות, טעויות, שגיאות הזנה – ושאר מרעין בישין.
בסקר גדול, שנערך לאחרונה ע"י האתר Kaggle בקשר מדעני נתונים, עלה כי הקושי מספר אחד שלהם הוא נתונים מלוכלכים.
כל דאטה אנליסט חייב ללמוד איך מזהים רעשים בנתונים, ואיך להתמודד עם רעשים כאלה (התעלמות מהנתון/ הזנחת הרעש/ פילוח למספר קבצים/ טיוב וכיו"ב).
זה נכון במיוחד בשני מקרים עיקריים:
- נתונים ממערכות ישנות – בהן לא היתה בקרה על איכות הנתונים, או אימות על הערכים המוזנים (לדוגמה: ערכי '9999999').
- נתונים מהאינטרנט – שצריך להבין מה המבנה שלהם ומה כל שדה אומר.
בנוסף לסוגיית איכות הנתונים, קיימים הרבה מאוד מקרים – בהם מצד אחד עולה רעיון לניתוח אנליטי, אבל מצד שני – נתוני המקור הנדרשים עבור הניתוח פשוט לא קיימים או לא זמינים.
ברוב המקרים או שמוותרים על חלק מהנתונים, או שמוותרים על כל הפרויקט – וחבל.
מה שיכול מאוד לעזור כאן הוא להבין אילו נתונים בכלל קיימים בארגון – ולדעת לדרוש אותם (אפילו ברמה של שליפה חד פעמית).
זה יכול לקצר מאוד משך של פרויקטים אנליטיים – ואפילו להציל אותם.
אתגר מתודולוגי – 'ללמוד לחשוב'
אחד ההיבטים הכי מאתגרים בעבודה בתור אנליסט נוגעת בדיוק לתפר שבין עולם הביזנס לטכנולוגיה.
עולם הביזנס דורש לרוב מענה מאוד מהיר, תוך התפשרות על רמת הדיוק.
עולם הטכנולוגיה, לעומת זאת, דורש מענה מאוד מדויק – תוך התפשרות על רמת הדיוק.
מדובר בשני היבטים, שאיך נומר בעדינות – לא בדיוק הולכים ביחד…
במהלך הקריירה שלי, חוויתי הרבה מאוד תקלות –רובן המוחלט היה נגזרת של הקונפליקט הזה;
החל מקבלת החלטות מאוד גסה של ההנהלה – שהתבססה על 'חוקים עסקיים' פשוטים – מה שהרג את החדשנות ואת האפשרות ללמוד דברים חדשים מתוך הנתונים וכך להשתפר;
ועד לדוקטורים שפיתחו מודלים סטטיסטיים מפוארים – אבל שפיספסו הנחות עבודה בסיסיות וקריטיות – מה שהפך את כל התוצאות ללא ישימות…
כל ההיבטים האלה מדגישים את הצורך הקריטי בהבנה מתודולוגית מעמיקה שעיקרה מענה לשאלה אחת מרכזית:
איך למצוא את הפתרון הכי מתאים לבעיה – כזה שמצד אחד ייתן לה מענה יחסית טוב, ומצד שני לא ייקח שנתיים….
האתגר הזה מורכב מהרבה מאוד תחומים, שעיקרם:
- הבנת הצרכים העסקיים
- אפיון הפתרון האנליטי
- אפיון ומימוש של תהליכי הנתונים
- ניתוח סטטיסטי
- הטמעה (הדרכת המשתמשים + במערכות המידע).
יש אנשים שטוענים שאי אפשר ללמד אפיון מתודולוגי.
לראייתי, מתודולוגיה אנליטית היא שריר שנדרש לפתח – החל מבקשת דוח פשוט – וכלה במודל חיזוי מורכב.
אפשר ללמוד ולפתח את היכולת המתודולוגית – צריך פשוט לשים את הפוקוס במקום הנכון…
סוגי משימות – מיקוד במה שחשוב, לא רק במה שדחוף
יש לי וידוי קטן: יש תקופות שלמות בחיים שלי – שאני לא ממש זוכר לעומק…
ליתר דיוק – תקופה של שנתיים בתור אנליסט מתחיל, שבה עבדתי מעל ל-12 שעות ביום – בגלל עומס עבודה בלתי סביר.
קיבלתי כמות אדירה של בקשות לנתונים בכל יום, ועל זה עוד הוסיפו לי לא מעט פרויקטים.
לא היה מי שיכשיר אותי מה לעשות עם עומס העבודה הזה, ולא היה מישהו אחר שיעשה את העבודה הזו…
אז נכון – לא כל אחד היה מוכן ו/או מסוגל לשבת 20 שעות רצוף ולנתח נתונים…
אבל כמעט בכל צוות אנליטי שבו ייעצתי – ללא יוצא מהכלל – הבחנתי בתופעה דומה:
כמות העבודה תמיד הייתה רבה יותר מהקיבולת – ובאופן משמעותי.
ואיך זה בדיוק קשור ל'סוגי משימות'?
כי בתור דאטה אנליסט – קריטי להבין במה כן להתעסק – ובמה לא.
דאטה אנליסט אמור להיות 'מפעל תובנות', ולא רק 'ספק נתונים'.
הלב של המקצוע הוא לא בדוחות שוטפים למשתמשים או מנהלים – אלא בניתוחים אנליטיים עמוקים ובמחקרים.
הם אלה שמקפיצים את הארגון מדרגה ומאפשרים לו להשתפר.
ולכן – נדרש ללמוד איך להתגבר על עומס העבודה והבקשות לדוחות, ולהתפנות לסוגים אחרים וחשובים של משימות – שעיקרן ניתוח נתונים משמעותי ועמוק.
אז איך אני התמודדתי עם העומס הזה?
מאחר ואנשי מערכות המידע לא ממש נתנו לי פתרונות – כי גם הם היו עסוקים כל הזמן – החלטתי לפתח בעצמי מערכות שיעזרו לי.
אז לאט לאט פיתחתי מערכות מקומיות (בעיקר ב-MS Access) שסגרו לי תהליכי בקרה ודיווח שוטפים בצורה אוטומטית.
זה אמנם לקח לי שנה נוספת של 'חוסר חיים', אבל לבסוף הגעתי למצב שהתפניתי כמעט מכל העבודה השוטפת – מה שאפשר לי להתחיל לפתח מודלים אנליטיים.
הנה כמה דרכים נוספות להתגבר על עומס המשימות השוטף:
- אוטומציה
– ללמוד דרכים להריץ דוחות שחוזרים על עצמם באופן אוטומטי – ולהעביר אותם ישירות למשתמשים/מנהלים.
קריטי להבין אילו כלים קיימים בארגון שיכולים לסייע בכך – Access, פרוצדורות ב-SQL או במקרים מסוימים אפילו אקסל יכולים לעזור מאוד. - תעדוף משימות
מטבע הדברים, קיימות בכל רגע נתון משימות חשובות יותר או פחות, ודחופות יותר או פחות. חשוב להתחיל כל יום בתכנון משימות, ולא לקפוץ ישר למלאכת הדוחות. - פירוק כל משימה לטווח קצר ולטווח ארוך
כמעט כל משימה אפשר לפצל לשני חלקים: מענה מידי, ומענה קצת יותר מקיף בטווח הרחוק.
אם מדובר בדרישת נתונים מצד משתמשים – תוצאה ראשונית ולא מדויקת כמעט תמיד תהיה עדיפה על תוצאה מדויקת/מושלמת, אבל שלוקחת הרבה מאוד זמן. ברוב המוחלט של המקרים – זה יספיק, וזה יכול לחסוך ה-מ-ו-ן זמן.
סיכום – אתגרים של דאטה אנליסט
במאמר הוצגו מספר אתגרים של דאטה אנליסט. האתגרים האלה יכולים מצד אחד להרתיע, אך מצד שני – הם יכולים מאוד למקד במה צריך לעסוק.
מיקוד בפתרון של האתגרים האלה יכול לסייע לדאטה אנליסט להוביל מהפכה – לא פחות – ברמה האנליטית בארגון שלו.
ובתור אנליסט – מהפכה אנליטית יכולה להיות מתורגמת מהר מאוד לרמה מערכתית – שתקפיץ את הארגון מדרגה ותשפר את הביצועים שלו.