מתמטיקה תיכונית/הסתברות/קשר סטטיסטי וקשר סיבתי
נתחיל מהשורה התחתונה" "קורלציה לא מעידה על סיבתיות אבל היא רומזת "הסתכלו כאן!".
w:סיבתיות מתקיימת כאשר A מוביל ל B.
w:מתאם מתקיים כאשר יש קשר בין הערכים של A והערכים של B.
ישנם דרכים רבות למדוד מתאם (לדוגמה מתאם פירסון, מתאם ספירמן). ההגדרה שלהם היא מחוץ לחומר הלימוד אולם הבנה אינטואיטיבית שלהם מספיקה להבנה ההבדל בין הקשרים.
אם אין כל קשר בין המשתנים A ו B אז הם יהיו בלתי תלויים וגם נטולי קשר סטטיסטי.
אם יש קשר סיבתי (נניח כי A מוביל ל B תמיד) אז ואז לרוב המדדים הסטטיסטים יעידו על קשר.
אולם, ישנם מקרים בהם קשר סיבתי אינו מעיד על קשר סטטיסטי ומקרים בהם מדדים סטטיסטים לא מזהים קשר סיבתי.
קשר סטטיטסטי שאינו מעיד על קשר סיבתי
עריכהלרוב אנו מניחים כי קשר סטטיסטי מעיד על קשר סיבתי אולם קל למצוא מקרים בהם הדבר אינו כך.
כאשר יורד גשם, אנשים הולכים עם מטריות. אנחנו נמצא קשר סטטסיטי בין המקרים ואף יש קשר סיבתי - ירידת הגשם מובילה למטריות. אולם, מדדים סטטיסטים רבים אדישים לכיוון (הם סימטרים והקשר בין A ל B זהה לקשר בין B ל A) ולכן הקשר מעיד באותו מידה על מצב בו פתיחת המטריה מוביל לירידת הגשם.
כאשר גשום, אנשים נוטים יותר לשתות מרק עוף. מכיוון שבירידת גשם גם פותחים יותר מטריות וגם שותים יותר מרק עוף, מתקיים קשר סטטיסטי בין שתיית מרק עוף ובין פתיחת מטריות. זאת למרות שברור כי אין קשר סיבתי בין השניים אלא ששניהם נובעים ממשתנה משותף אחר - ירידת הגשם.
קשר סיבתי שאינו מזוהה בקשר סטטיסטי
עריכההניחו שיש לנו שני מטבעות הוגנים.
נגדיר את תוצאות הניסוי להיות w:XOR של המטבעות, כלומר תוצאה חיובית רק אם שני המטבעות נופלים על תוצאה שונה.
שימו לב כי התוצאה היא ודאית (וסיבתית) בהנתן הטלות המטבע. למרות זאת, תוצאות הניסוי הן בלתי תלויות בכל אחת מההטלות הבודדות. בגלל אי תלות זו המדדים הסטטיסטים שציינו קודם לא מעידים על קשר.
דוגמה מוחשית יותר היא חישוב משך חיים. אם ידוע לנו תאריך הלידה ותאריך הפטירה של אדם אנו יודעים בוודאות את משך חייו. לעומת זאת אם אנו יודעים רק אחד מהם כמעט אין לנו אינפורמציה ולא נמצא קשר סטטיסטי חזק. הסיבה היחידה לקיום קשר חלש היא שתוחלת החיים עולה עם התקדמות הזמן ולכן לאדם שחי לפני 200 שנה הייתה תוחלת חיים קצרה יותר וזה מידע המוכל בתאריך לידתו.