Hocr - הפיכת תמונה עם אותיות עבריות לקובץ טקסט/המרה לטקסט: הבדלים בין גרסאות בדף

תוכן שנמחק תוכן שנוסף
Mintz l (שיחה | תרומות)
אין תקציר עריכה
שורה 1:
{{Hocr - הפיכת תמונה עם אותיות עבריות לקובץ טקסט}}
 
==סידרה 0.10==
ליישום hocr, שמשמש כמימשק שורת פקודה לספריה, כח רב, אך השימוש בו מסובך. לישום 32 דגלים שונים שיכולים לשנות מאוד את תוצאות ההמרה מתמונה לטקסט. גם צורות סריקה שונות משפיעות בצורה קיצונית על התוצאה.
 
==שלב 1: עיבוד תמונה==
libhocr לא משפר תמונה בגווני אפור לתמונה בגווני אפור משופרת, אלא הופך תמונות צבעוניות/גווני אפור לתמונות שחור לבן.
האובייקט ho_array (גירסה 0.10.10 ומעלה) מסוגל לעבד תמונות אפור לתמונות אפור משופרות, אך לא נעשה בו שימוש בישומים hocr ו hocr-gtk . הסיבה לכך היא שכרגע כל הפונקציות שיודעות להבין תמונה זקוקות לתמונות שחור לבן כקלט.
 
אפשרויות הרצה, עבורן תתקבלנה תוצאות שונות של עיבוד התמונה:
<source lang="text">
hocr -i you_image.png -T 0 -B
hocr -i you_image.png -T 1 -B
hocr -i you_image.png -T 2 -B
</source>
 
* הדגל T קובע איזו אסטרטגיה לשיפור תמונה תשמש את התכנית:
:* 0 - שיטה סטנדרטית. פשרה בין חיפוש אוטומטי של נקודת המעבר למהירות.
:* 1 - נקודת מעבר קבועה.
:* 2 - חיפוש אוטמטי של נקודת מעבר אופטימאלית בין שחור ללבן.
:*:ברוב המקרים מספיקה נקודת מעבר קבועה.
* הדגל B מבקש מהישום לבצע עיבוד תמונה בלבד ואח"כ לצאת.
 
תמונה שחור לבן בפורמט png תכתב לתיקייה הנוכחית בה היישום הורץ.
 
==שלב 2==
התכנה מגיעה עם שלושה מנשקים שונים המאפשרים להוציא את המקסימום מיכולות התכנה.
מנשק גרפי hocr-gtk , קל לשימוש ולמידה, המיועד לשימוש עבור מספר מצומצם של קבצי תמונה. מנשק שורת פקודה, המאפשר אוטמציות פשוטות על מספר רב של קבצי תמונה ושליטה טובה יותר על הפרמטרים השונים של הפעלת התכנה. מנשק תכנותי, בשפת פיתון, המאפשר כתיבת תסריטים מורכבים במשתמשים ביכולות המתקדמות של התכנה.
שורה 61 ⟵ 39:
 
קישור לדפי המידע על פקודות ואובייקטים הקיימים ביחידה: [http://hocr.berlios.de/documentation/html/index.html hocr reference]
 
==סידרה 0.8==