Hocr - הפיכת תמונה עם אותיות עבריות לקובץ טקסט/המרה לטקסט: הבדלים בין גרסאות בדף

תוכן שנמחק תוכן שנוסף
Mintz l (שיחה | תרומות)
מ מתוך לינמגיזין http://linmagazine.co.il/node/view/47779
 
Mintz l (שיחה | תרומות)
מאין תקציר עריכה
שורה 2:
 
ליישום hocr, שמשמש כמימשק שורת פקודה לספריה, כח רב, אך השימוש בו מסובך. לישום 32 דגלים שונים שיכולים לשנות מאוד את תוצאות ההמרה מתמונה לטקסט. גם צורות סריקה שונות משפיעות בצורה קיצונית על התוצאה.
 
==שלב 1: עיבוד תמונה==
libhocr לא משפר תמונה בגווני אפור לתמונה בגווני אפור משופרת, אלא הופך תמונות צבעוניות/גווני אפור לתמונות שחור לבן.
האובייקט ho_array (גירסה 0.10.10 ומעלה) מסוגל לעבד תמונות אפור לתמונות אפור משופרות, אך לא נעשה בו שימוש בישומים hocr ו hocr-gtk . הסיבה לכך היא שכרגע כל הפונקציות שיודעות להבין תמונה זקוקות לתמונות שחור לבן כקלט.
 
אפשרויות הרצה, עבורן תתקבלנה תוצאות שונות של עיבוד התמונה:
<source lang="text">
hocr -i you_image.png -T 0 -B
hocr -i you_image.png -T 1 -B
hocr -i you_image.png -T 2 -B
</source>
 
* הדגל T קובע איזו אסטרטגיה לשיפור תמונה תשמש את התכנית:
:* 0 - שיטה סטנדרטית. פשרה בין חיפוש אוטומטי של נקודת המעבר למהירות.
:* 1 - נקודת מעבר קבועה.
:* 2 - חיפוש אוטמטי של נקודת מעבר אופטימאלית בין שחור ללבן.
:*:ברוב המקרים מספיקה נקודת מעבר קבועה.
* הדגל B מבקש מהישום לבצע עיבוד תמונה בלבד ואח"כ לצאת.
 
תמונה שחור לבן בפורמט png תכתב לתיקייה הנוכחית בה היישום הורץ.
 
==שלב 2==
{{להשלים}}
 
[[קטגוריה:Hocr - הפיכת תמונה עם אותיות עבריות לקובץ טקסט]]