הצד האפל של גוגל אנליטיקס – 12 כללים לשמירה על איכות הנתונים שלכם

גוגל אנליטיקס נחשב לכלי מצוין, חינמי ופשוט לניטור התנועה והפעילות באתרי אינטרנט. הכלי נחשב לסטנדרט בתעשייה, ומקנה למשתמשים בו תחושה ראשונית שהם בשליטה על נתוני פעילות האונליין שלהם. הכלי דוגל בגישת ה-One Size Fits All, לפיה קיימות יכולות סטנדרטיות רחבות למדי, ובנוסף ניתן להתאים אותו לפונקציות נוספות – בהתאם לצרכים הייחודיים של כל אתר.
Research processאך בעוד שהכלי נגיש מאוד לבעלי אתרים, ומקנה להם תחושה שהם 'סופרמן של נתונים', תחושה זו לא תמיד משקפת את תמונת המצב האמיתית.

קיימים לא מעט בעלי אתרים, אשר מתמודדים עם בעיות מהותיות של אמינות ודיוק הנתונים בגוגל אנליטיקס, חשים מוצפים בנתונים שקשה להם להבין ומתקשים בהסקת מסקנות ותובנות פרקטיות שיסייעו להם לשפר את הפעילות העסקית שלהם.

במאמר זה יוצגו 12 היבטים, אשר חשוב מאוד להכיר בגוגל אנליטיקס על מנת לעבוד איתו בצורה נכונה ולהימנע מקבלת החלטות המבוססות על
נתונים שגויים.

 

להכיר את נקודת ה-80:20

העוצמה הגדולה ביותר של גוגל אנליטיקס היא בהתקנה ראשונית סופר-מהירה באמצעות העתקת קטע סקריפט קצר ל-Header באתר, ולאחר מכן הגדרת תנאים, סגמנטים וסינונים ללא שורת קוד אחת. כמעט מיד לאחר 'שתילת' הקוד באתר שלכם יש לכם ניטור לאתר ברמת Page Views.
אם ברצונכם לנטר ולנתח מידע אחר מעבר לפונקציונליות הבסיסית – תפיסת ה-One Size Fits All תתחיל להתקשות לתת לכם מענה יעיל, ותידרשו במקרים רבים להתאים את הכלי באמצעות שימוש בקוד (לדוגמה – הגדרת Event למדידת כמות המשתמשים שקראו 50% מעמוד מסוים).
חשוב להבין שחבל לבזבז משאבים יקרים – גם בפיתוח וגם בלימוד – במקומות בהם קיימים כלים נוחים ויעילים יותר. עם כל דרישה שלכם שהיא מעבר להתקנה הבסיסית – ההמלצה היא להתעניין גם בכלים חלופיים העשויים לתת פתרון נוח ומהיר יותר.

 

להיות מודע לסטיות הדגימה ומגבלות הקיבולת

בחירת מדגם הנתונים להצגה בגוגל אנליטיקסמאחר וגוגל היא ענקית טכנולוגיה, אנו מצפים שכל הפעילות המתרחשת באתר האינטרנט שלנו תנוטר ותוצג בכלי האנליטיקס. ועדיין, גוגל אנליטיקס לא בהכרח מציג את כלל הפעילות באתר. גוגל אנליטיקס מבצע סינון  אוטומטי בתצוגת הדוחות כאשר ישנם יותר מ-500,000 סשנים (בטווח תאריכים מסוים) – על מנת שהביצועים יהיו סבירים, או בהינתן שהוגדר לו לבצע דגימה.מומלץ להכיר את סרגל בחירת הדגימה (Sampling Slider), המופיע מתחת לתפריט בחירת טווח התאריכים, ויש לוודא שהבורר שלו מכוון על 100%.

 

להסתכל גם ברמת המאקרו וגם ברמת המיקרו

בהמשך לאי הדיוקים בדגימה שהוצגו בסעיף הקודם, ההתקנה הבסיסית של גוגל אנליטיקס מאפשרת הצגה ברמת המאקרו של מדדים סיכומיים על כלל המשתמשים בלבד. אין אפשרות להציג את הנתונים ברמת המיקרו – קרי לבצע drill down ולתחקר כל פעולה ופעולה של משתמש מסוים – בשאיפה בזמן אמת. הדבר גורם לבעלי אתרים רבים לחוסר הבנה כיצד הכלי הגיע למספרים שהוא מציג – ולתחושת חוסר אמון בנתונים – תופעה בה נתקלתי לא מעט אצל לקוחות.

על מנת לטפל בבעיה, מומלץ מאוד להתקין כלי אנליטיקס נוסף.
מומלץ ביותר לבחור בכלי המתעד את רמת האירוע (event) עבור כל משתמש, דוגמת Mixpanel – ולוודא שכל פעולה שמשתמש מסוים עושה – אכן מוצגת במסך בזמן אמת.
קיום של שני כלי אנליטיקס יתרום מאוד בשני היבטים – גם להבנה מקיפה יותר של התנהגות המשתמש הבודד באתר, וגם לאמון רב יותר במספרים עליהם אנו מסתמכים בקבלת החלטות – כנובע מהיכולת לתקף נתונים משתי מערכות שונות, ולהבין מה הסיבות לפערים ביניהן.

 

הפרדה בין סביבות/ תצוגות עבודה (Views)

מומלץ להגדיר 3 סביבות/ תצוגות (Views) – כבר בתחילת העבודה עם גוגל אנליטיקס:

  • סביבת ה-Production – הסביבה בה נמדוד את ביצועי האתר, וננתח את התנהגות ופרופיל המשתמשים.
  • סביבת ה-Test – בסביבה זו נבחן סינוני אוכלוסייה חדשים ושינויי הגדרות.
  • סביבת נתונים מקוריים ללא סינונים – Unfiltered.
    סביבה זו תשמש לשמירת כלל הנתונים אשר גוגל אנליטיקס מנטר – ללא כל סינון.
    קריטי ליצור View כזה בעת ההטמעה – כי לא ניתן לשחזר לאחר מעשה נתונים שסוננו ב-View קודם.

 

להוסיף הערות (annotations) ל-Timeline

הוספת הערות היא אלמנט חשוב – על מנת שנוכל להעלות בקלות השערות מדוע היה שינוי במדדים דווקא בתאריך מסוים, ולהשאיר לנו או לאנשים אחרים יכולת כזו גם בעתיד. אם שינינו הגדרות אוכלוסייה, סינונים, יעדים, סביבות עבודה וכיו"ב – זהו כלי קריטי אשר לעיתים יהיה היחיד להסביר שינויים בנתונים המוצגים בכלי.
הוספת הערות בסביבת גוגל אנליטיקס מבוצעת דרך תפריט Admin\Views.
הערות בגוגל אנליטיקס

 

להגדיר יעדים (Goals)

יעדים מרכיבים חלק ניכר משלבים שונים במשפך המכירות (Sales-Funnel), ובמדידת רמת השימוש באתר.
גוגל אנליטיקס מאפשר אפיון יעדים המתבססים על מדידות פשוטות, כמו זמן מינימלי באתר, מספר העמודים שנצפו וכיו"ב, שאינן מחייבות קידוד (לא מבוססי אירועים – Events).

מומלץ להגדיר את היעדים הבאים:

  • מדדים המתארים שלבים במשפך המכירות – דוגמת ביקור בעמוד התודה לאחר רישום ('Thank You Page'), תודה לאחר רכישה וכיו"ב.
  • מדדים לזיהוי רמת ה-Engagement באתר – דוגמת זמן באתר (מעל 5 שניות, מעל 30 שניות, מעל דקה וכיו"ב), ומספר העמודים שנצפו.

חשוב לציין, כי מומלץ לחשוב ולהגדיר מראש יעדים – כבר עם הטמעת המערכת, וזאת מאחר והנתונים לא מחושבים בדיעבד.
הגדרת יעדים כאלה תסייע מאוד גם בחישוב נכון של מדדים (מטריקות) שונים, כמו Bounce-Rate, בו נדון בהמשך המאמר.
הוספת Goals בסביבת גוגל אנליטיקס מבוצעת דרך תפריט Admin\Views.

 

לסנן את עצמכם מהמדגם

הפעילות באתר של המפתחים או המנהלים שלו מכניסה רעש רב מאוד לנתונים המוצגים בגוגל אנליטיקס. אם לא מבוצע סינון נאות של פעילות זו – הנתונים עשויים להציף תובנות שגויות לחלוטין, מאחר והן מייצגות סביבת פיתוח ובדיקות – במקום נתוני אמת של משתמשים.
קיימות שתי דרכים עיקריות לסנן את מנהלי האתר:

  • סינון לפי כתובת ה-IP, במידה ועובדים עם IP קבוע.
  • הקמת עמוד (או Event) ייעודי לזיהוי מפתח האתר
    בפתרון זה, פותחים עמוד ייעודי הידוע רק למפתח/מנהל האתר ומציבים בו את הקוד של גוגל אנליטיקס.
    לאחר הביקור של מנהל האתר בעמוד זה, יש להגדיר בסביבת גוגל אנליטיקס סינון של כל היוזרים שביקרו בעמוד זה אי פעם.
    מיותר לציין, כי חובה לוודא שעמוד הסינון לא יופיע במפת האתר או יהיה חשוף למשתמשים אחרים מלבד בעל האתר, אחרת כל משתמש יוכל לסנן עצמו מהסטטיסטיקות.
    למען דיוק מקסימלי, חשוב לוודא שמנהל האתר יבקר בעמוד הסינון בכל Device דרכו הוא מבקר בו, ובפרט כאשר הוא פועל ב'מצב פרטיות' (InPrivate\Incognito).

 

להכיר את 3 רמות המדדים השונות בכלי

דמיינו לעצמכם שכל ביקור שלכם בדף מסוים מנוטר ונשמר כשורה במערכת ניטור אירועים.
כל אירוע כזה נשמר עם מספר מאפיינים, לדוגמה: מזהה הדף, מזהה ייחודי של המשתמש (לרוב ע"י Cookie), מזהה ייחודי של הסשן, ופרטים ספציפיים על כל אחד מהם.

כל המדדים המוצגים בגוגל אנליטיקס מחושבים מתוך הסכימה של האירועים הללו, כאשר אפשר לסכום אותם או ברמת הסשן, או ברמת המשתמש, או ברמת הדף.

כל היבט מחושב באופן שונה, והסכימה של האירועים תחתיו נתונה לחוקים עסקיים שונים.
לדוגמה: אם דני ביקר בדף 100 פעמים בסשן אחד, יוסי ביקר רק בדף המסוים הזה ב-100 סשנים שונים, ובנוסף היו עוד 98 משתמשים שצפו רק בדף הזה במשך סשן אחד – זמן השהייה הממוצע בדף יחושב כממוצע על פני כל 300 הביקורים בדף שהיו – ללא קשר לזהות המשתמש או לפרטי הסשן, גם אם יוסי ודני הם משתמשים חריגים.
מדוע זה קריטי? מאחר ואנו עשויים להסיק מסקנות על כלל המשתמשים באתר, מבלי לשים לב שמדובר בהתנהגות חריגה של משתמשים בודדים, או לחילופין – לפספס את אותם משתמשים ייחודיים שעשויים להניב לנו הכנסות רבות.
המסקנה היא שעבור כל מדד אשר גוגל אנליטיקס מציג לנו – נדרש להבין באיזו רמה הוא מחושב, מהן הבעיות הספציפיות העשויות להשפיע על המדידה, והאם נדרש להסתכל במדד אחר על מנת להשלים את התמונה שאנחנו רואים.

בדוגמת הביקורים בדף, חשוב להתבונן גם במדד מספר הביקורים הממוצע למשתמש בדף – וכפי שצוין בתחילת המאמר – בהסתכלות על רמת המשתמש קיימים כלים טובים יותר מאשר גוגל אנליטיקס.

 

להכיר את אופן החישוב של ה-Bounce Rate

מדד ה-Bounce Rate מייצג עבורנו נטישות מהאתר. אך בעוד שנטישה עשויה להתפרש באופנים שונים באתרים שונים, גוגל אנליטיקס מודד את הנטישה באופן פשטני למדי – סשן שהתחיל בכניסה לעמוד מסוים באתר, והסתיים מבלי שתהיינה פעולות אחרות בדרך שגוגל אנליטיקס ניטר.

לצורך המחשת הפער, ניקח שני משתמשים לדוגמה – שצפו במאמר מסוים באתר שלנו.

  • דני – נכנס לאתר, צפה במאמר במשך 10 דקות, ולאחר מכן יצא מהאתר.
  • יוסי – הגיע לאתר דרך מנוע חיפוש, תוך שתי שניות הבין שהתוכן באתר אינו רלוונטי עבורו וחזר אחורה לתוצאות החיפוש.

בעוד שברור לחלוטין שיוסי אמור להיספר כנטישה ודני לא, גוגל אנליטיקס יספור את שניהם כנטישה.
מדוע זה קריטי? מאחר ומדובר בשתי אוכלוסיות שונות לחלוטין – משתמשים מהסוג של דני הם קהל היעד שלנו – ועבורו אנחנו רוצים לבדוק את ההתנהגות באתר, בעוד שמשתמשים מהסוג של יוסי (אוכלוסייה לא רלוונטית) יסייעו לנו למקד את מאמצי הגיוס ב-Traffic איכותי יותר.
חשוב להבחין בגוגל אנליטיקס בין האוכלוסיות, באמצעות הגדרת שני סגמנטים חדשים (לפי Session Duration – מעל ומתחת ל-X שניות) ולבחון את שניהם אחד מול השני.
להלן דוגמה לפיצול כזה בין שני סוגי האוכלוסיות, לפי סף של מעל/מתחת ל-5 שניות באתר:

נטישה בגוגל אנליטיקס

(הנתונים לדוגמה כוללים סינון למשתמשים מישראל בלבד, ללא מנהל האתר).

הפערים הדרמטיים במדדי משך השהייה באתר, ומספר העמודים הממוצע מדברים בעד עצמם – ומי שנשאר באתר לפחות 5 שניות – אוטומטית נגרע מחישוב הנטישה (Bounce-Rate = 0%).
כך, מיקדנו את בעיית הנטישה בעזיבה מידית של האתר – הנובע כנראה מחוסר רלוונטיות (כ-60% מהמשתמשים) עתה, נוכל לבחון מהו פרופיל המשתמשים באוכלוסייה הלא רלוונטית, ומהם מקורות התנועה שמהם הם מגיעים – על מנת להביא לאתר תנועה ממוקדת יותר בעתיד.

 

לדייק את חישוב משך הזמן הממוצע באתר (Average Session Duration)

דפדפתם פעם באתר מסוים, ותוך כדי קיבלתם שיחת טלפון חשובה? התחלתם לקרוא מאמר מסוים – והייתם צריכים הפסקה באמצע? מקרים כאלה קורים, ובהנחה שאנו לא סוגרים את הדפדפן מיד כאשר זה קורה – גוגל אנליטיקס לא יודע להבחין שאנחנו כבר לא גולשים בפועל באתר (למרות שגוגל לכאורה יודעים עלינו הכל…).

במקרים כאלה, המדידה של גוגל אנליטיקס מפסיקה אוטומטית את הסשן לאחר חצי שעה של חוסר אינטרקציה – וזמן השהייה הממוצע באתר נוטה להתנפח בהתאם.

קיימים מספר פתרונות לבעיה, אך חשוב להבין באופן מעמיק את ההשלכות שלהן על מנת להתאים את הפתרון הטוב ביותר עבורכם:

  • בחירת זמן מקסימלי לסשן בגוגל אנליטיקסניתן לקצר את משך הזמן ללא אינטראקציה לפחות מ-30 דקות. במקרה זה, חשוב להתאים בצורה טובה את הזמן למהות האתר. לדוגמה: 5 דקות לקריאת מאמר בבלוג 'אנשי נתונים' עשוי להיות זמן קצר מדי, לאור העובדה שהמאמרים יחסית ארוכים (עמכם הסליחה…).
  • סינון ערכים חריגים
    ניתן לסנן סשנים ארוכים (לדוגמה: סשנים שארכו מעל לשעה), ובכך לדייק משמעותית את ממוצע משך הסשן.
    את הסינון מומלץ לבצע בעזרת הגדרת Segment חדש, ובחינה ידנית איזה אחוז מהסשנים מסוננים. חשוב ביותר לבחור סף סינון מספיק גבוה, אשר יסנן רק סשנים חריגים.
  • התבססות על חציון משך השהייה
    חציון מתאים למקרים בהם קיים 'זנב ימני' להתפלגות מסוימת (משך הזמן הוא בדיוק כזה), מה שמושך את הממוצע כלפי מעלה. חישוב של חציון משך השהייה הממוצע באתר ניתן לבצע או דרך Audience\Behavior\Engagement באופן ידני, או בממשק הגדרת הסגמנטים (מספר הסשנים והיוזרים הנופלים תחת תנאי משך מעל/מתחת לסף מסוים).

לקריאה נוספת על אופן חישוב זמן הסשנים בגוגל:
https://support.google.com/analytics/answer/2731565?hl=en

 

לשמור על פשטות (Keep It Simple and Stupid)

גוגל אנליטיקס כולל מספר רב מאוד של מימדים (Dimensions) ומדדים (Metrics) לניתוח וצפיה. המשתמש הטיפוסי עשוי לאבד עצמו בתוך ים הנתונים הזה, ולכן חשוב מאוד להתמקד.
מומלץ להתחיל מהגדרת Dashboard פשוט, אשר יציג את הנתונים הקריטיים בלבד לפעילות האתר (KPI’s).
בשלב שני, מומלץ להגדיר Dashboard מקיף יותר אשר יכלול תמונת מצב יחסית מקיפה של האתר, כולל גרפים של היקפי משתמשים, דפים נפוצים, מקורות תנועה, יחסי המרה וכיו"ב. לפני הקמת ה-Dashboard המקיף, מומלץ לבחון את הגלריה הקיימת בסביבת גוגל אנליטיקס – ולייבא ממנה Dashboard מוכן, העשוי להתאים לצרכים שלכם.

לאפשרויות ניתוח הנתונים מומלץ לצלול רק בשלב השלישי – לאחר 'טבילת אש' ראשונית וצבירות בטחון מול ה-Dashboards.

 

להצליח להפיק תובנות מהנתונים

רוב הסעיפים הקודמים עסקו בהבנת הלוגיקה מאחורי הנתונים, ובטיוב שלהם על מנת שמה שמוצג אכן ייצג נכונה את מה שהמשתמשים עושים במציאות.

הסעיף האחרון, ואחד החשובים ביותר – הוא היכולת להבין את המשמעות של הנתונים, להסיק מהם מסקנות ותובנות, ולהבין מה הצעד הבא שיש לבצע בשביל לשפר אותם.
כאן כבר אין עצה אחת – אלא עולם שלם של ניתוחי נתונים אפשריים – עם אינסוף תובנות הממתינות לחשיפה.
להלן מספר טיפים אשר מומלץ לקחת בחשבון בעת ניתוח הנתונים:

  • לוודא שיש מספיק נתונים על מנת להסיק מסקנות – מספרים קטנים בפלחים מסוימים עשויים להיות לא מובהקים ולהוביל למסקנות לא נכונות.
  • עם כל נתון – גם אם הוא מתבסס על מספר תצפיות רב – יש להפעיל הגיון בריא על מנת להבין עם הוא הגיוני, ועומד בקנה אחד עם תהליך העבודה.
  • להיצמד כמה שניתן למשפך השיווקי – על מנת שכל תהליך של ניתוח נתונים באתר ישמש לשיפור מדד מוגדר.
  • זיהיתם ממצא חריג? שתפו מישהו נוסף בסוגיה, על מנת להעלות השערות לגבי הסיבות הגורמות לו, ורעיונות כיצד לשפר אותו באמצעות A|B Testing.

 

סיכום

גוגל אנליטיקס הוא כלי אפקטיבי ונגיש מאוד. חשוב להכיר את יכולותיו וגם את מגבלותיו – על מנת להוציא ממנו את המירב ולקבל ממנו נתונים אמינים ומדויקים ככל שניתן.
ההיכרות המעמיקה עם הכלי תאפשר להבין טוב יותר את מאפייני והתנהגות קהל המשתמשים באתר, את אפקטיביות ערוצי השיווק הדיגיטליים השונים, מקורות התנועה לאתר ורמת הביצועים בו.
כך, יתאפשר לקבל החלטות טובות יותר, אשר תסייענה לשפר את הביצועים העסקיים של הארגון.

 

בעל אתר – מעוניין להוציא יותר מפעילות אתר האינטרנט שלך? קרא גם את דף השירותים המקצועיים שלנו בנושא.

 

2 תגובות
  1. יוני להגיב

    מאמר מצוין. איך היית ממליץ ספציפית להשתמש ב-Google Analytics וב-Mixpanel? באותו האופן (Events זהים, כדי להינות מהשוואה של מדדים דומים) או באופן שונה כי כל אחד מהם מודד טוב יותר באספקטים אחרים?

    ספציפית, מה ההעדפה הכללית שלך לכל כלי? נדמה לי שהשימוש שאנחנו עושים בשני הכלים הוא פחות או יותר דומה, אולי מעט מוגבל יותר ב-Mixpanel לבדיקת מדדים כמו Retention.

  2. eyal להגיב

    ההבדל בין Google Analytics ובין Mixpanel הוא ארוך מספיק בשביל מאמר נפרד, אבל אנסה לתמצת…
    Google Analytics מכוון לתת סטטיסטיקות ברמה סיכומית (מאקרו) בצורה פשוטה.
    בנוסף, הרמה העיקרית של המטריקות שלו היא Session.
    לכן ההצגה ב-Dashboard המסכם את הנתונים באופן מהיר הוא יתרון מובהק של Google Analytics.

    ב-Mixpanel (וגם ב-Kissmetrics המתחרה) הדגש הוא על התנהגות המשתמש הבודד, ולכן כל הנתונים בו ינוטרו עם מזהה ייחודי של המשתמש.
    בנוסף, ה-Front End בכלי מוכוון להבין מה המשתמש הבודד עשה (על פני כל ה-Sessions שלו בעבר), כולל רשימת האירועים (Events) אותם עושה כל משתמש – ובזמן אמת.
    לכן Mixpanel הוא כלי משמעותית חזק יותר גם בשביל לנטר ולשפר את ביצועי המשפך (כי ייתכן והמרה של משתמש תארוך יותר מ-Session אחד), וגם בשביל להבין ברמת המיקרו מה משתמש עושה באתר.
    מצד שני, חשוב להבין שחוסר הרמה של ה-Session גורמת ל-Mixpanel לא לכלול ניטור זמן באתר, ולא מאפשרת באופן מיידי הצגת Flow של מאיזה דף עוברים לאיזה דף אחר.

    ההמלצה שלי היא להטמיע את שני הכלים ברמה בסיסית (אירועים של Pageviews), ולהשוות את כמויות המשתמשים והצפיות.
    עבור Dashboard פשוט – ממליץ על Google Analytics – נותן לטעמי תמונת מצב מקיפה יותר ומהירה יותר מ-Mixpanel.
    עבור הטמעת אירועים אחרים (Custom Events) – ההעדפה שלי היא Mixpanel, מאחר והוא מאפשר גם צפייה בהם בזמן אמת, וגם בחינה קלה כיצד הם משפיעים על ביצועי המשפך.

    לגבי Retention – בעוד שלשני הכלים יש Feature ייעודי (ב-Google Analytics נקרא 'Cohort'), אני חושש שהנתונים שם לא מספיק ברורים מבחינת הגדרות (עבור המשתמש הטיפוסי) על מנת להבין היכן הבעיות וכיצד להתגבר עליהן.
    אני אישית גוזר את הנתונים מה-api של Mixpanel ומבצע חישובים בבסיס נתונים בהתאם להגדרות ספציפיות שלי.

השארת תגובה