חשיבה אנליטית היא אולי אחד המרכיבים הכי חשובים לדאטה אנליסט.
את הפוסט הפעם החלטתי לכתוב, אחרי שבמספר פגישות הכוונה שערכתי לאחרונה, חזר על עצמו המצב הבא:

מועמדים, שרוצים להפוך לדאטה אנליסט – ניגשים לראיונות עבודה אחד אחרי השני.
וניחשתם נכון – הם פשוט לא מצליחים לעבור אותם.

 

רובם אפילו עברו קורס דאטה אנליסט, שלכאורה היה אמור ללמד אותם את הכלים הרלוונטיים (בעיקר SQL); 

ועדיין – משהו עדיין לא עובד.

 

המצב מתסכל במיוחד לאור העובדה, שאין להם מושג היכן הם מפספסים…
אף אחד לא אומר להם את זה, ולא ברור הפער בין ההשקעה הרבה בלימודים ובין התוצאות בראיונות.

 

 

מוכן/ה לשלב הבא בדרך לדאטה אנליסט? מסטרקלאס 'הרגל בדלת - קיצורי הדרך למשרת דאטה אנליסט'!

 

 

אז איפה בדיוק הבעיה?

 

כמעט בכל מקרה כזה שבו אני נתקל הדבר הראשון שאני עושה הוא להעריך את רמת ה-SQL שלהם.
מנסיוני – הדרך הישירה לאבחן בעיות אצל מועמדים היא פשוט באמצעות תרגיל SQL מאתגר.
(ואגב, ישנן עשרות סוגי בעיות הגורמות לטעות).

 

אבל בעוד שהרבה מכם חושבים עכשיו שצריך ללמוד עוד SQL, אז רגע, חכו.

סוג הבעיות אולי הכי קריטיות הוא לא רק בחלק הטכני של הפקודות…
הבעיה אולי הכי משמעותית היא דווקא במקום אחר:
בהבנה של איך משתמשים בכלי בשביל לענות על השאלות ששואלים אתכם.

 

כן – יש כאן מימד אחר לחלוטין מסתם ללמוד את הפקודות הטכניות של SQL:

חשיבה אנליטית – איך לגשת לבעיות עסקיות ולפתור אותן באמצעות SQL.

 

והנה משהו שכנראה יפתיע אתכם:
כנראה שרוב המועמדים לומדים
SQL מאנשי BI (מגיעים מעולם פיתוח התוכנה).
בין אם זה לימוד עצמי עם קורס באינטרנט.
או אפילו עם לא מעט קורסים עם הטייטל 'דאטה אנליסט' או "לדאטה אנליסט".

העניין הוא, שמעסיקים ברוב המקרים מחפשים דווקא צורת חשיבה אחרת – יותר עסקית, יותר לוגית.

במילים אחרות:

  • אנשי BI נוטים להיות יותר טכניים ולחפש פתרונות יעילים (מהירים) לבעיה מוגדרת מראש;
  • ואנליסטים נוטים להיות יותר לוגיים ולאפיין מחדש בעיות בשביל לתת להם פתרון מהיר
    (לאו דווקא כזה שיהיה יעיל מבחינת טכנולוגית כמו זמן ריצה וכיו"ב).

 

זה מתבטא בצורה מאוד ברורה בראיונות עבודה לתפקידי דאטה אנליסט .
בהרבה מהם סוג השאלות צפוי להיות לא רק טכני, אלא גם עסקי ולוגי.

לכן, כמובן שתידרשנה יכולות טכניות – אבל לא רק.
מה שיהיה אפילו חשוב יותר – הוא יכולת חשיבה אנליטית ולוגית בהיבטי האפיון.
כלומר – להבין מה רוצים מכם, איך לאפיין את הפתרון ולוודא שפתרנו נכון.

היבטי קוד יעיל שרץ בצורה יעילה – ממש לא משנה.

 

העניין הוא שאם לא תדעו לחשוב בצורה לוגית – סביר להניח שלא ממש תדעו איך לגשת לשאלות כאלו.

 

ונחשו מה?
שאלות פחות מוגדרות זה בדיוק סוג השאלות שאוהבים לשאול ברוב הראיונות לתפקידי דאטה אנליסט…

 

 

איך זה בדיוק בא לידי ביטוי? יש דוגמאות?

 

אז הנה בדיוק דוגמה להבדל בין "חשיבת BI" לחשיבה של דאטה אנליסט.

 

נניח שיש לנו 2 טבלאות מקור:

א.     Users – משתמשים באפליקציה מסוימת (ברמת מזהה משתמש, מועד רישום לאפליקציה ועוד).

ב.     Purchases – רכישות (ברמת רכישה, הכוללת בין השאר את מזהה המשתמש, תאריך רכישה וכיו"ב).

 

ונניח שנרצה לחשב את יחס המשתמשים שהפכו ללקוחות. כרגע נניח שנרצה להסתכל על כל ההיסטוריה של האפליקציה, ולא רק על חודש מסוים.

 

איך איש BI יפתור את הבעיה הזו?

 

קודם כל, הוא יבין שיש כאן יחס, כלומר – צריך לחשב מונה ומכנה.

אבל מאחר והוא רגיל לפתור בעיות יחסית מוגדרות ופשוטות, הוא יריץ 2 שאילתות נפרדות – אחת למונה והשניה למכנה, ופשוט יחלק את התוצאות.

SELECT
(SELECT COUNT(DISTINCT userId) FROM Purchases)
/
(SELECT COUNT(DISTINCT userId) FROM Users)

  

הפתרון הזה כמובן נכון ולגיטימי, 

הבעיה היא שהוא קצת פשטני מדי.

הוא לא נותן לנו את היכולת לצלול פנימה לנתונים, ולהבין האם ישנן טעויות או פערי מידע;

הוא לא בודק האם החישוב הוא נכון, אלא פשוט מניח שהנוסחה נכונה וגם המרכיבים שלה נכונים. 

 

וזה לא תמיד המצב…

 

 

ומה דאטה אנליסט יעשה?

 

דאטה אנליסט תמיד יניח שיש בעיות בנתונים (כי מה לעשות – במציאות זה ככה…).
ולכן הוא יבנה את השאילתה בצורה כזו שתאפשר לו לזהות אותן בקלות.

 

תחילה, הוא יבין שיש כאן 2 טבלאות עם שדה משותף.
זה אומר שנרצה לבדוק ברמת המיקרו שכל משתמש שביצע רכישה – גם מופיע בטבלת המשתמשים.

לכן קודם כל נבצע הצלבה בין 2 הטבלאות, כך שנקבל נתונים משותפים לשתי הטבלאות;
ורק לאחר מכן נחשב את היחס מתוך הטבלה המשותפת.

 

בצורה כזו, אם משהו לא יסתדר לנו בתוצאה…
תמיד נוכל לבצע את השליפה ברמה השמית, ולהבין האם הבעיה היא בשאילתה, בנתוני המקור או בהבנה שלהם.

אז נכון, לבצע הצלבה זו פעולה לא יעילה.

אבל בעבודה הכוללת אפיון, הדגש הנכון הוא:

קודם כל ליצור תהליך נתונים נכון, ורק לאחר מכן לייעל אותו.

 

 

אז לסיכום:

 

צורת חשיבה אנליטית היא לראייתי אחד הנכסים הכי חשובים שיש לדאטה אנליסט.

את צורה החשיבה הזו יש לפתח – כמו שריר.
על מנת שכשתגיעו לראיון העבודה תבינו מה רוצים מכם.
ודרך זה כמובן שתגדילו את הסיכויים לענות נכון על השאלה.

 

ולצערי, בצורת החשיבה הזו לא ממש מתמקדים בהרבה קורסים בשוק.

 

אז אני מקווה שהפוסט הצליח לתת טעימה ממה הכוונה בצורת החשיבה האנליטית.

אם מעניין אתכם להיחשף קצת יותר לצורת החשיבה הזו (כולל המחשה ברמת קוד SQL);
ואפילו להכיר 3 דרכים לפיתוח שלה – 

תוכלו לעשות זאת עם מסטרקלאס 'הרגל בדלת – קיצורי הדרך למשרת דאטה אנליסט' של 'מועדון הנתונים'.

 

בהצלחה בראיונות!

 

 

  מוכן/ה לשלב הבא בדרך לדאטה אנליסט? מסטרקלאס 'הרגל בדלת - קיצורי הדרך למשרת דאטה אנליסט'!

 

 

 

2 תגובות
  1. לינוי להגיב

    שלום
    היכן ניתן לקרוא מידע אודות סדנת הנתיב המהיר?

השארת תגובה