December 18, 2012

מבחנים וציונים



"ישנם שלושה סוגי שקרים – שקרים, שקרים ארורים וסטטיסטיקה" – בנימין ד'יזרעלי


הנה שלושה סיפורים שלכאורה אין כל קשר ביניהם:
-         בחודש מארס השנה עלה מדד המחירים לצרכן ב – 0.4%. חודש אחד אחר כך  עלה מדד המחירים לצרכן ב – 0.9%. בימים ההם של ראשית 2012 התקשורת וה"מומחים" היו משוכנעים שהאינפלציה מכה שנית. אבל היום נראה שאלא אם כן החודש יעלו המחירים בצורה דרמטית,  תסתיים השנה הנוכחית  בעליית המדד השנתית  הנמוכה ביותר בחמש השנים האחרונות.
-         באוקטובר 1957 שיגרה ברית המועצות את הלווין ספוטניק לחלל. באפריל 1961 שוגר הקוסמונאוט יורי גגארין -  האדם הראשון שיצא את כדור הארץ לחלל. באותם ימים, היו רבים שהיו משוכנעים   שברית המועצות, עם טכנולוגיה עדיפה ומשטר חברתי מכוונן הישגים, מכה את הקפיטליזם. לפני 21 שנה, בסוף 1991, התפרקה ברית המועצות.
     
-         ב – 1984 היתה אינפלציה שנתית של יותר מ – 400%. עיתונאי כלכלי שעימו עבדתי נהג לכתוב מדי פעם מאמרים שעניינם השחיקה בשכר הריאלי (כוח הקניה של המשכורת הממוצעת). בשני המאמרים הראשונים קל היה למצוא את הממצא המבוקש. יום אחד הוא אומר לי כי לפי הנתונים של הלשכה המרכזית לסטטיסטיקה, נפסקה הירידה בשכר, ויש אפילו עליות שכר. אולי הם טועים? אמר העיתונאי. בוודאי שהם טועים, השבתי. ואחרי נבירה של שעה בנתונים תוך שינוי תקופת המדידה, הראיתי לו שהשכר הריאלי ממשיך להישחק. יצא מזה יופי של מאמר.
נזכרתי בכל אלה למקרא הידיעות על הישגי תלמידים בבחינות בינלאומיות במתמטיקה, מדעים והבנת הנקרא. כזכור ראש הממשלה ושר החינוך יצאו בסוף השבוע שעבר בידיעה דרמטית ולפיה טיפסה ישראל, במדד ההצלחה בבחינות האלה, ממקום רע בסוף, למקום טוב בצמרת. הידד להישגים שמוכיחים כי החינוך הציוני שמוענק לילדינו לא רק פטריוטי למהדרין, אלא מניב הישג בינלאומי.

 הדוגמאות דלעיל מראות עד כמה קל להוליך שולל  בעזרת סטטיסטיקה "נכונה".

הדוגמה הראשונה, על מדדי המחירים לצרכן בראשית השנה, מדגימה  את הכלל שסנונית אחת לא מבשרת את בוא האביב. ובמקרה שלנו, גם  עליה של  שני מדדים רצופים לא מבשרת  את בוא האינפלציה. מידע סטטיסטי, כל מידע סטטיסטי, הוא מדגמי ואפוף רעשים. הרעשים, מכל סוג, עלולים להביא למסקנות נמהרות. לכן מקובל כי נדרשות שלוש סנוניות לפחות, ובמקרה שלנו – שלושה מדדי מחירים – כדי להגיע למסקנה ראשונית.

הדוגמה השנייה, על פרוייקט החלל של ברית המועצות, מדגימה עד כמה הישג, במיוחד הישג יוצא דופן, יכול להטעות. כאמור הפרשנות המקובלת להצלחה של אז הייתה העליונות הטכנולוגית של ברית המועצות על פני ארצות הברית, ובמיוחד ההיקש שמכאן – מההישג של גגארין – אפשר להסיק על חוסנה ועוצמתה  של החברה. מומחים  להיסטוריה מחזיקים בהסברים מגוונים  על הסיבות לנפילתה של ברית המועצות. החזק שביניהם הוא בחולשה האיומה של הכלכלה. החיים של האזרח הפשוט בברית המועצות לא הושפעו לטובה מההישג הטכנלוגי. ויש בסיס לטענה כי המשאבים שהופנו להישג גרעו עוד יותר מרמת חיים סבירה במדינה שבה תוחלת החיים היתה 55 כאשר בישראל נטולת חלליות (אז) תוחלת החיים היתה 75.

מה שמביא אותי לכתיבת מאמרים על שחיקת שכר. כל שעשיתי היה "מדעי" לחלוטין. בכל סדרה של נתונים אפשר, כמעט תמיד, להוכיח כל השערה. פשוט צריך להזיז  את מועד תחילת המדידה, את סופה של המדידה   ואם אפשר – גם את שיטת המדידה. כך, למשל, בראשית השנה דיווחה הלשכה המרכזית לסטטיסטיקה על שיעור האבטלה שהגיע ל – 6.7%. תדהמה כללית הייתה בארצנו על רקע העובדה שהנתון הקודם היה 5.5%. "זינוק באבטלה" בישרו בתקשורת. ומה היה באמת? הלשכה לסטטיסטיקה שינתה את המדגם של שוק העבודה והגדילה אותו במידה ניכרת ועברה ממדגם  רבעוני לחודשי. לא "זינוק" ולא ציפורים. רק שינויים טכניים במדידה. מאז שיעור האבטלה "החדש" די יציב. בינתיים.

מבחנים בינלאומיים לתלמידי בתי ספר

וזה כנראה מה שקרה עם הציונים. כתבת "הארץ", טלילה נשר, טרחה לפנות לאירגון הבינלאומי שערך את המבחנים שגרמו לנתניהו ולסער להתחממות פטריוטית. ושם הסבירו כי הנתון העכשווי אינו בר השוואה, כי....שינו את המדגם, ושיחקו עם תרגום השאלות. ואחר כך התברר כי כרבע מתלמידי היסודי לא השתתפו כלל כי הם "חרדים" או "נעדרים" כלומר הם לא מדידים (אלא לצורכי קיצבאות).

ככלל מבחנים הם לכל היותר כלי לסלקציה. יש 100 מועמדים למשרה, ללימודי רפואה – תבחרו מה שבא לכם. איך מחליטים מי יזכה? עושים מבחן לצורכי סלקציה. שיטת המבחן נראית הוגנת יותר מהגרלה או ממכרז  ולכן משתמשים בה. למבחנים יש, עם זאת, חולשה מוכרת: קל לכוון אליהם, להתמקד בהם. כך למשל תעשיית בתי הספר המכשירים למבחן הפסיכומטרי, והנסיון המתמשך של המרכז הארצי לבחינות (העורך את המבחנים האלה) לנטרל את השפעת מכוני ההכשרה האלה,  מעידים על המאבק  בין המתמקדים בהישגי המבחן ובין יוצרי מבחן אוניברסאלי שישלול את היתרון שבהתכוננות. היום, ברוב בתי הספר, מכירים את בחינות המיצ"ב ויודעים כי משרד החינוך יתגמל מורים על פי הישגי תלמידיהם במבחן הזה. מה עושים המורים? מכינים את התלמידים לבחינות האלה באינטנסיביות יתרה. ומה שלא פחות חשוב, וזה ממצא כלל עולמי למקרים דומים, ממליצים לתלמידים חלשים לא לבוא לבית הספר ביום הבחינה.  וכך משפרים את הסטטיסטיקה.

עכשיו בואו בחשבון: 

אם ניתן לכל תלמיד שלא נבחן את הציון אפס (מה שראוי שייעשה כדי למנוע ממורים תמריץ לשחק עם הנתונים) ואז נחשב  מחדש את הממוצע הסטטיסטי של ציוני תלמידי ישראל  נראה שבאחת ישראל תנשור ממקום גבוה למקום בינוני מינוס. הכל עניין של מה עושים עם הנתונים.
נחום בלס, חוקר בכיר בתחום החינוך במרכז טאוב בדעה שישראל היא אכן בינונית למדי(תרגום שלי לדבריו). היא היתה כזו לפני המבחן האחרון, ונשארה כזו לאחריו. וכל השאר הם שקרים, שקרים ארורים וסטטיסטיקה. ותודה לראש ממשלת בריטניה לשעבר, בנימין ד'יזרעלי.
18.12.2012