מבני נתונים ואלגוריתמים - מחברת קורס/אלגוריתמים/אלגוריתמים למיון בזמן לינארי
מיון מבוסס השוואות (לדוגמה מיון הכנסה, מיון מיזוג, או Quicksort) הוא כללי מאד: האלגוריתם מניח מעט מאד על האיברים - כל שהוא מניח הוא שהוא יכול להשוות כל זוג איברים. המחיר לכלליות זו הוא חסם תחתון של .
בפרק זה נראה שני אלגוריתמי מיון, מיון ספירה ומיון Radix, שפועלים בזמן נמוך יותר - זמן לינארי. המחיר ליעילות זו היא אובדן כלליות. יעילות זו מושגת בעזרת הנחות נוקשות למדי לגבי הקלט. שינויים בקלט יכולים לגרום לאלגוריתמים לא לעבוד כלל, או לעבוד בסיבוכיות גבוהה מאד.
כדאי לדעת: בספר הקורס, הפרק "Sorting in Linear Time" עוסק בנושאים אלה. |
מיון יציב
עריכהנתחיל בהגדרה נוספת על שיטות מיון - מיון יציב.
נניח שברצוננו למיין את המערך שבתרשים הבא - A. הדרישה היחידה שלנו היא שהתוצאה תהיה כבB.
אבל עכשיו, נניח שהמערך הוא בעצם כבC: הוא אינו מחזיק מספרים, אלא סטודנטים המאופיינים על ידי שמות ומספר שיעורי הבית שהגישו (קוקו, לדוגמה, הגיש 2 שיעורי בית). נניח שנמיין עפ"י מספר שיעורי הבית; כל אחד מהמערכים בD מתאים להגדרה, אך שני המערכים אינם זהים.
הגדרה: מיון הוא יציב אם הוא אינו משנה את סדרם של שני איברים שקולים יחסית לסדרם המקורי. בצורה אחרת: אם מערך כבר ממוין עפ"י קריטריון X, וממיינים אותו בעזרת מיון יציב עפ"י קריטריון Y, אז כל האיברים השקולים עפ"י Y יהיו עדיין ממוינים גם עפ"י X. |
דוגמה: המערך בC ממוין עפ"י שם. אם ממיינים אותו במיון יציב עפ"י מספר שיעורי הבית, אז נקבל את המערך העליון בD. שני האיברים שעבורם #שיעורי בית = 2, ממוינים עדיין גם עפ"י שם. |
מימוש C++ |
מיון ספירה
עריכההאלגוריתם
עריכהמיון ספירה ישים כשאנו יודעים שכל איברי המערך הם מספרים בתחום , עבור כלשהו. הוא פועל ע"י ספירת כל האיברים הקטנים או שווים לערך כלשהו.
# Counting sort.
# Takes an array (Values), and a number (k).
# Each one of (Values) is in the range 1...k.
# Returns an array of the same elements, sorted in increasing order.
Counting-Sort(Values, k)
1 Count = Make-Array(k)
2 for i in [1, ..., k]
3 Count[i] = 0
4 for j in [1, ..., Length(Values)]
5 value = Values[j]
6 ++Count[value]
7 for i in [2, ..., k]
8 Count[i] = Count[i] + Count[i - 1]
9 Sorted = Make-Array(Length(Values))
10 for j in [Length(Values), ..., 1]
11 value = Values[j]
12 count = Count[value]
13 Sorted[count] = value
14 --Count[value]
15 return Sorted
נקבע את כLength(Values)
.
1-3 מייצרות מערך חדש, Count
באורך , ומאפסות אותו. 4-6 עוברות על Values
ומעדכנות בCount
את מספר הפעמים בהן ראו כל אחד מהאיברים. נשים לב שבשלב זה, Count[i]
מכיל את מספר הפעמים בהם מופיע i
בValues
. 7-8 מחברות כל איבר של Count
לאיברים הקודמים לו. נשים לב שבשלב זה, Count[i]
מכיל את מספר הפעמים בהם מופיע איבר קטן או שווה לi
בValues
.
דוגמה: נניח ש
|
9 מייצרת מערך חדש, Sorted
, 10-14 מעתיקות את איברי Values
אליו (בסדר ממויין), ו מחזירה אותו. כעת נתמקד ב10-14. הן פשוט עוברות בלולאה אחורה על איברי Values
.
כאשר נתקלים באיבר value
, מעתיקים אותו לּSorted
במקום Count[value]
, ומורידים את ערך Count[value]
ב .
נכונות
עריכה
משפט:
|
הוכחה: כפי שצויין מקודם, בדיוק לפני שורה 9, Count[i]
מכיל את מספר הפעמים בהם מופיע איבר קטן או שווה לi
בValues
. מכאן קל לראות שהאיבר 1 אמור להופיע במקומות 1, ..., Count[1]
, האיבר 2 אמור להופיע במקומות Count[1] + 1, ..., Count[2]
, האיבר 3 אמור להופיע במקומות Count[2] + 1, ..., Count[3]
, וכולי. ואכן, 13-14 ידאגו, בהתקלן באיבר , להציב אותו במקומות Count[i]
, Count[i - 1]
, Count[i - 2]
, וכולי.
קל מאד להוכיח את המשפט הבא.
משפט:
|
ניתוח סיבוכיות
עריכהנשים לב שמיון ספירה מורכב למעשה משתי לולאות באורך ושתי לולאות באורך . מכאן נקבל את המשפט הבא.
משפט:
|
נשים לב שאם הוא קבוע, אז הוא פולינום ב מדרגה 1. מכאן נקבל את המשפט הבא.
משפט: אם הוא קבוע, אז |
מיון Radix
עריכההאלגוריתם
עריכהמיון Radix פועל על איברים שכ"א מהם הוא מספר בן ספרות, וכל ספרה יכולה לקבל ערכים אפשריים.
דוגמה: נתן לחשוב על מספר תעודת זהות כמספר שעבורו ו . |
הרעיון הוא להשתמש פעמים במיון ספירה: ראשית ממיינים את המספרים לפי הספרה הפחות משמעותית, לאחר מכן ממיינים את המספרים לפי הספרה הבאה הפחות משמעותית, וכן הלאה.
דוגמה: להלן מיון Radix במקרה , :
A מציג את שלושת המספרים במצב הראשוני. ממיינים אותם (במיון Radix) עפ"י העמודה הימנית ביותר, ומקבלים את התוצאה בB. שוב ממיינים אותם (במיון Radix) עפ"י העמודה האמצעית, ומקבלים את התוצאה בC. ממיינים אותם פעם נוספת (במיון Radix) עפ"י העמודה השמאלית ביותר. |
עכשיו תורכם: מדוע חשוב למיון Radix שמיון ספירה הוא מיון יציב? |
נכונות
עריכה
משפט: מיון Radix עובד. |
הוכחה: ההוכחה היא באינדוקציה. נוכיח שלאחר האיטרציה ה , המספרים ממויינים לפי הספרות המשמעותיות פחות.
(בסיס האינדוקציה) האיטרציה הראשונה משתמשת במיון ספירה כאשר קריטריון המיון הוא העמודה הימנית ביותר. היות שמיון ספירה עובד (הוכחנו זאת), המספרים יהיו ממויינים לפי הספרה המשמעותית פחות בסוף האיטרציה הראשונה.
(מעבר האינדוקציה) נניח שבתחילת האיטרציה ה , המספרים ממויינים לפי הספרות המשמעותיות פחות, ונוכיח שבסוף האיטרציה ה , המספרים ממויינים לפי הספרות המשמעותיות פחות. נקח שני מספרים ו , ונחשוב היכן הם יישבו זה ביחס לזה בסוף האיטרציה ה :
- נניח שהספרה ה פחות משמעותית של שני המספרים שונה; בלי הגבלת הכלליות, נניח שזו של קטנה מזו של . היות שהאיטרציה ה ממיינת לפי ספרה זו, אז בסוף האיטרציה, תשב לפני .
- נניח שהספר ה פחות משמעותית של שני המספרים זהה, אך הספרות המשמעותיות פחות אינן כולן זהות; בלי הגבלת הכלליות, נניח שאלו של קטנות מאלו של . לפי הנחת האינדוקציה, בתחילת האיטרציה ה , יישבה לפני . היות שהמיון יציב, נובע גם שבסוף האיטרציה, תשב לפני .
ניתוח סיבוכיות
עריכהמיון Radix הוא למעשה הפעלה בת פעמים של מיון ספירה. מכאן נקבל את המשפט הבא.
משפט: מיון Radix פועל בסיבוכיות . |
נשים לב שאם ו קבועים, אז הוא פולינום ב מדרגה 1. מכאן נקבל את המשפט הבא.
משפט: עבור ו קבועים, מיון Radix פועל בסיבוכיות . |
הפרק הקודם: החסם התחתון על מיון מבוסס-השוואות |
אלגוריתמים למיון בזמן לינארי תרגילים |
הפרק הבא: תכנון דינאמי |