פינת התגובה ה(לא כל כך) מהירה – שאול אמסטרדמסקי

שאול אמסטרדמסקי (כלכליסט) כתב בבלוג האישי שלו רשומה מאוד מעניינת על מכונות מזל. מפעל הפיס מפעיל מכונות מזל ב-150 תחנות שונות ברחבי הארץ, בשיעורי רווחיות עצומים. אמסטרדמסקי אסף את הכתובות של כל התחנות, והראה באופן אנקדוטלי שהן נוטות להתרכז בשכונות ויישובים שמעמדם החברתי כלכלי נמוך. מי שקובע את מיקום התחנות הם המפיצים האזוריים של מפעל הפיס, שמרוויחים עמלות לפי מחזור המכירות באזור שלהם, מה שאומר שיש להם תמריץ למקם את התחנות באזורים שממקסמים מכירות.

אם התחנות אכן מרוכזות באזורים חלשים יותר, המשמעות היא שמקסום המכירות מנצל את תופעת ההימורים כ"מס על עניים". אפשר להתווכח על המוסריות או הזכות של יזם פרטי (במדינה עם הימורים חוקיים) לנצל חולשות אנוש כך, אבל כאשר "חברה לתועלת הציבור" שיש לה מונופול מטעם הממשלה על הימורים עושה זאת, זה אפילו יותר בעייתי.

אבל האם באמת התחנות מתרכזות בשכונות חלשות? אמסטרדמסקי הציע לקוראים להצליב את הנתונים שלו עם נתוני הלמ"ס על הדירוג החברתי כלכלי של השכונות השונות, וכך עשיתי.

דירוג חברתי כלכלי מבקש לסכם במספר אחד עד כמה תושבי היישוב או השכונה מבוססים, ומשקלל בתוכו בין היתר מדדים של דמוגרפיה, השכלה, הכנסה, דיור ותעסוקה. את היישובים מחלקים ל"אזורים סטטיסטיים", שהם אזורי מגורים אחידים מבחינה דמוגרפית בסדר גודל של שכונות, ומהווים את היחידה הכי קטנה בסקרי למ"ס, מתחת לרובע ותת-רובע. כל אזור סטטיסטי כזה מקבל דירוג לפי המדדים. את האזורים מסדרים לפי המדד בסדר עולה ומחלקים אותם ל-20 "אשכולות", כאשר בכל אשכול אזורים בעלי דירוג דומה. לדוגמה, שכונת כוכב הצפון בתל אביב היא באשכול 19, ושכונות מאה שערים בירושלים ואלמוראס בג'סר א-זרקא הן באשכול 2. הנתונים העדכניים ביותר לקביעת הדירוג ברמת השכונה והאזור הסטטיסטי הם מהמפקד של 2008. את הרשימה והדירוג של כל אזור לקחתי מלוח ב2 של המסמך "אפיון יחידות גאוגרפיות וסיווגן לפי הרמה החברתית-כלכלית של האוכלוסייה בשנת 2008" של הלמ"ס (קישור ישיר לטבלה).

השתמשתי באתר govMap כדי למצוא באיזה אזור סטטיסטי נמצאת כל תחנה. במקרים שבהם התבצעו איחודים, הקמות או ביטולים של אזורים סטטיסטיים מאז 2008 סיווגתי את התחנה לפי האזור הסטטיסטי שהייתה בו ב-2008 או האזור הקרוב ביותר (במקרה של התחנה בצומת בנימינה באור עקיבא שהייתה על גבול של שני אזורים סטטיסטיים, 3 ו-4, נתתי את ממוצע האשכולות של שניהם; הסיווג של תחנה זו אינו משפיע על התוצאות הכלליות). השמטתי תחנות שממוקמות בשטחים פתוחים ואזורי תעשיה (שאין להם דירוג חברתי כלכלי כי אין בהם תושבים), ובאזורים סטטיסטיים ביישובים שלא מופיעים בטבלה כלל (כולם יישובים כפריים קטנים), ונשארתי עם 124 תחנות מזל, 5 מהן ביישובים ערביים ו-119 מהן ביישובים יהודיים או מעורבים. ניתן להוריד טבלה שהכנתי עם רשימת התחנות, האזורים הסטטיסטיים שלהן והאשכולות שלהן כאן, ולהשתמש בה שימוש הוגן תוך מתן קרדיט. בתרשים 1 מוצגת התפלגות התחנות לפי אשכולות לעומת התפלגות כלל 1616 האזורים הסטטיסטיים.

תרשים 1: התפלגות תחנות ואזורים סטטיסטיים בין אשכולות

תרשים 1: התפלגות תחנות ואזורים סטטיסטיים בין אשכולות

לפני שנתחיל לנסות להסביר את התוצאות, חשוב להבין האם ההבדלים הם סתם "רעש", או מובהקים מבחינה סטטיסטית. על מנת להבין זאת ביצעתי מבחן סטטיסטי בשם "מבחן כי (χ) בריבוע", שמסתכל על הבדלים בפרופורציות של תכונה מסוימת בין דגימה לאוכלוסייה או בין דגימה אחת לדגימה אחרת (לדוגמה, האם קוביית משחק של שש פאות היא הוגנת). מי שפחות מתמצא בנושא מוזמן לדלג כמה פסקאות קדימה ולהסתפק בידיעה שמצאתי שההבדל מובהק מבחינה סטטיסטית.

השערת אפס: התפלגות תחנות הלוטו על פני אשכולות חברתיים כלכליים זהה להתפלגות האזורים הסטטיסטיים על פניהם.

את המבחן ביצעתי באמצעות הפונקציה CHISQ.TEST של Microsoft Excel, כאשר actual range הוגדר בתור התפלגות תחנות הלוטו ו-expected range בתור התפלגות תחנות הלוטו לו היו באותן פרופורציות כמו התפלגות האזורים הסטטיסטיים, כאשר לא עיגלתי שברים. לדוגמה, אם 50% מן האזורים הסטטיסטיים נמצאים באשכול מסוים, אז כך גם 50% מתחנות הלוטו בהתפלגות המצופה.

קיבלתי χ=0.00066523, מה שמאפשר לי לדחות את השערת האפס בוודאות של למעלה מ-99%. ההתפלגות של תחנות הלוטו על פני אשכולות חברתיים כלכליים שונה באופן מובהק מהתפלגות האזורים הסטטיסטיים.

בסיכון שנאבד חלק מהפרטים, אבל כדי להקל על העין, איחדתי בתרשים 2 כל שני אשכולות ל"אשכולות על" (אשכול 1 ו-2 אוחדו לאשכול על 1, לדוגמה):

תרשים 2: התפלגות תחנות ואזורים סטטיסטיים בין אשכולות על

תרשים 2: התפלגות תחנות ואזורים סטטיסטיים בין אשכולות על

מהתרשים נראה שקיים תת ייצוג של התחנות ב"קצוות" – הן באזורים ממעמד נמוך והן באזורים ממעמד גבוה. את תת הייצוג באשכולות הגבוהים יותר אפשר להסביר לפי הטענה של אמסטרדמסקי, אבל לא את תת הייצוג באשכולות הנמוכים. באשכולות הנמוכים בכלל ישנו ייצוג לא פרופורציונלי של שכונות וערים חרדיות וערביות. אם הייתי צריך להעלות השערה שניתן לבחון, הייתי אומר ששם נעוץ ההבדל: ייתכן שבשל הבדלים תרבותיים שני המגזרים האלה נוטים להמר פחות (אני לא אומר שזה ככה, ייתכן שאני טועה), ובמקרה של הערבים, ייתכן שמדובר בכלל בעוד היבט של אפליה והתעלמות מצד גופים ציבוריים. עוד הייתי משער שהריכוז הוא בשכונות של יהודים חילונים, דתיים או מסורתיים מחתך חברתי כלכלי נמוך יחסית לחילונים, דתיים ומסורתיים אחרים.

כדי לבחון את ההשערות האלה, צריך לבצע ניתוח מורכב יותר שכולל את המאפיינים הכלכליים והדמוגרפיים של האזורים הסטטיסטיים בנפרד, ולא בשקלול לאשכולות.

תוספת מאוחרת: בזמן העבודה על הרשומה, ובלי ששמתי לב עד שהעבודה המתודולוגית שלי כבר הייתה גמורה, הוקדמתי על ידי דרור גולדין מהבלוג "בנאליה" (בלוג מומלץ), שעשה עבודה דומה. למרות אי אלו הבדלים מתודולוגיים, הוא הגיע לממצאים דומים לשלי, שיש הבדל מובהק בהתפלגות אבל שהוא לא מוטה כלפי מעלה אלא כלפי ה"אמצע".

למה "התגובה הלא כל כך מהירה"? התחלתי לכתוב את הרשומה ועשיתי את רוב העבודה המתודולוגית שעות ספורות אחרי שאמסטרדמסקי פרסם את הרשומה שלו, במהלך יום חופש. קיוויתי להכות בברזל בעודו חם ולעשות follow-up מהיר. לרוע המזל, החיים עצמם העמיסו עלי בשבוע וקצת שחלפו מאז וכתוצאה מכך התעכבתי.

בהזדמנות הזו, אני מעוניין להודות לקורא גדעון על הצטרפותו לתמיכה בבלוג ולהזכיר שוב שהכתיבה בו נעשית ללא תשלום ומצריכה זמן ומאמץ. אם גם אתם\ן נהניתם\ן לקרוא, אשמח לקבל את תמיכתכם\ן.

נ.ב. לפני שנתיים וחמישה ימים פתחתי את הבלוג והעליתי את הפוסט הראשון. תודה לכל הקוראות והקוראים על התמיכה!

מודעות פרסומת
פוסט זה פורסם בקטגוריה כלכלה, עם התגים , , . אפשר להגיע ישירות לפוסט זה עם קישור ישיר.

השארת תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת / לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת / לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת / לשנות )

תמונת גוגל פלוס

אתה מגיב באמצעות חשבון Google+ שלך. לצאת מהמערכת / לשנות )

מתחבר ל-%s