מה זה OCR?
OCR (זיהוי תווים אופטי) הוא למעשה זיהוי טקסט. זהו תהליך תוכנה שמזהה ומחלץ טקסט ממסמכים בפורמטים שאינם טקסטים כגון תמונות (JPG, PNG, BMP וכו') וקובצי PDF. יש לו את היכולת "לקרוא" את הטקסט בתמונות, במילים אחרות להמיר את התמונה של מילה לתווי הטקסט שלה בפועל. זה מאפשר למשתמש להעתיק או לערוך בקלות את הטקסט המקורי במסמכים, לעומת הצורך לתמלל את הטקסט באופן ידני.
כיצד פועל זיהוי תווים אופטי?
זיהוי תווים אופטי בדרך כלל מעבד מראש תמונה על ידי ביטול רוויה וניגודיות שלה כדי לייעל את הניגודיות בין האזורים הכהים והבהירים. כל מה שהוא שחור נחשב לפיכך כדמויות, וזה שהוא לבן נחשב כרקע לאותן דמויות. לאחר מכן נעשה שימוש באלגוריתמי זיהוי תבניות ושיטות אחרות כולל זיהוי תכונות כדי לזהות את המבנה החזותי של הטקסט בתמונה: מפסקאות, לשורות, משפטים, מילים וכן הלאה ועד לתווים בודדים. תהליכים אלו משתמשים כיום לעתים קרובות בבינה מלאכותית אשר יכולה ללמוד לזהות טקסט בתמונה על ידי תרגול על אלפי תמונות עם טקסט בגופנים, בגדלים ובשפות שונות.
מהם היתרונות של שימוש ב-OCR?
היתרון בשימוש בזיהוי תווים אופטי הוא כמובן הזמן שהוא חוסך בדיגיטציה של הטקסט בתמונות. השווה את הזמן שלוקח להקלדה ידנית מחדש של הטקסט מתוך ספר לסריקת הספר ועיבוד הסריקות עם תוכנת OCR שיכולה לחלץ את הטקסט תוך שניות.
כיצד אנו מטפלים בקבצים שלך
הקבצים שתבחר נשלחים דרך האינטרנט לשרתים שלנו על מנת לבצע בהם OCR.
הקבצים הנשלחים לשרתים שלנו נמחקים מיד לאחר שההמרה הושלמה או נכשלה.
הצפנת HTTPS משמשת בעת שליחת הקבצים שלך ובעת הורדת הטקסט שחולץ מקבצים אלה.
אפליקציה מקוונת זו מבוססת כולה בדפדפן האינטרנט שלך, אין צורך בהתקנת תוכנה.
אתה יכול להשתמש באפליקציה החינמית הזו כמה זמן שתרצה ללא הרשמה.
זה עובד על כל מכשיר שיש לו דפדפן אינטרנט כולל טלפונים ניידים, טאבלטים ומחשבים שולחניים.