מבוא לשיטות נומריות/התאמת עקומים - רגרסיה

  • הקדמה: נרצה להתאים עקום המתאים ביותר לנקודות נתונות. העקום עובר בין ולא בהכרח דרך הנקודות.
  • מתי:

- בניית מודלים לקשרים בין משתנים - תוצאות ניסוי וכיוב'.

- מערכות משוואות overdetermined.

- נתונים עם שגיאות משמעותיות.

- אינטרפולציה אינה מתאימה - overfitting.


  • הגדרות:

- נקודות נתונות:

משתנה בלתי תלוי -

משתנה תלוי -


- העקום המתאים ביותר לנקודות הנתונות:


- שגיאת העקום (שארית): -שגיאה

- קריטריון התאמה: least squares (סכום השגיאות הריבועיות המזערי)

ע"י קריטריון זה קובעים מהו העקום המתאים ביותר. עקום מסדר כלשהו שיתן ערך מינימלי של SSR יהיה המתאים ביותר.

- SSR של קו ישר: רגרסיה לינארית.


אמידת קו הרגרסיה

  • עבור רגרסיה לינארית קריטריון ההתאמה הוא:

הם מקדמי הרגרסיה. כדי למצוא אותם, נגזור ונשווה לאפס:

  • מתקבלת מערכת משוואות לינאריות עם פתרון יחיד:


הפתרון:

אלה הם האופטימליים.


השגיאה במודל הרגרסיה

שגיאה סטטיסטית - לא נומרית. בעצמם הם חישוב של תוצאות מדגם או ניסוי. תוצאות אלו לכשעצמן אינן מדוייקות באופן מוחלט ולכן קיימת שגיאה סטטיסטית.

סטיית תקן - התפלגות הנקודה סביב הקו.

פיזור רחב יותר של נקודות סביב קו הרגרסיה ייתן סטיית תקן גדולה יותר.

- שגיאת התקן של y.

איכות התאמת העקום

- השגיאה (ככל שיותר קטנה - המודל מתאים טוב יותר)

=> תמיד

- שגיאות נתונים במודל הנאיבי. ( הוא הממוצע)

- ההפרש

כשאר היא השגיאה היחסית בין ההפרש למודל הנאיבי.


ככל ש- גדול יותר - ההתאמה יותר טובה. זה מעיד על כמה המודל שלנו טוב בהשוואה למודל הנאיבי. אם ההתאמה מושלמת אז אם אין קשר בין המשתנה התלוי והמשתנים הבלתי תלויים אז .

רגרסיה במשתנים מרובים

בכתיב מטריציוני:

  • Least square:

זהו b האופטימלי בכתיב מטריציוני:  
  • סטיית התקן ו- :

  • אם מוסיפים משתנים אז גם כן משתנה:


התאמת עקומים לא לינאריים

עקום לא לינארי יהיה כזה שהפרמטרים שלו אינם בקשר לינארי.

- לינארית:

- לא לינארית:

- כשאנו מחפשים עקום מתאים ביותר עלינו למצוא את [b] (הפרמטרים) האופטימליים ולכן הפרמטרים הם הנעלמים שלנו ולא המשתנים x, y .

שיטות פתרון אפשריות:

1) לינאריזציה של משתנים.

2) רגרסיה לא לינארית.


1) לינאריזציה של משתנים

  • נשנה את המשתנים כך שהמודל יהיה לינארי בפרמטרים.

דוגמאות:


2) רגרסיה לא לינארית

סכום הריבועים

כאשר הוא וקטור עמודה ו- הוא וקטור שורה.


  • מתקבלת מערכת משוואות לא לינאריות. פותרים ע"י:

- פתרון איטרטיבי למערכת משוואות לא לינאריות.

-לינאריזציה של המערכת סביב הפתרון הקיים.