אל תתנו לתהליך ההכנה להאטה שוב! הכלים שפותחו-העצמיים הגדילו את היעילות בכמעט פי 10 - ידע בתעשייה

אל תתנו לתהליך ההכנה להאט שוב! הכלים שלנו בפיתוח עצמי- הגדילו את היעילות בכמעט פי 10

רקע פיתוח: מקורו בצרכי ייצור בפועל

עיבוד מסמכים לפני דפוס בהדפסה דיגיטלית לוקח יותר מדי זמן. לאחר תקשורת עם מפעילי קו חזית, זוהו והובהרו שלושה צרכים מרכזיים.

(1) ספירת דפי מסמכים בבדיקת אצווה: במהלך ההדפסה והפריסה, לעתים קרובות יש צורך לוודא שלמסמך יש מספר זוגי של עמודים; אחרת, זה יכול בקלות להוביל לבזבוז של חומרי הדפסה או שגיאות כריכה.

(2) טיפול אוטומטי במסמכים אי-זוגיים-: עבור מסמכים עם עמודים אי-זוגיים, יש להוסיף עמודים ריקים בסוף, בעוד שעמודים זוגיים נשארים ללא שינוי.

(3) בדוק באצווה אם הטקסט מעוקל: כדי להימנע משגיאות הדפסה הנגרמות עקב גופנים חסרים, אשר שהטקסט במסמך הומר לעקומות (כלומר, "מעוקל").

באמצעות מחקר על Adobe Acrobat ותוספי עיבוד PDF שונים בשוק, נמצא כי הכלים הקיימים הם או מיותרים ומורכבים מבחינה פונקציונלית, או שאינם תואמים את תהליכי הייצור בפועל של החברה, במיוחד עם סיכונים נסתרים באבטחת עיבוד ההיפוך. חשוב מכך, כלים מקומיים דומים דורשים לעתים קרובות תשלום, וכתוצאה מכך-עלויות שימוש גבוהות יותר לטווח ארוך. בהתבסס על נושאים מעשיים אלה, החברה החליטה לפתח כלי מיוחד קל משקל, מדויק ומותאם פנימית.

כלי בדיקה ועיבוד של ספירת דפי PDF

01

פונקציות ליבה והיגיון שיפוט

מטרת הליבה של כלי זה היא להבטיח שלכל המסמכים שיודפסו יהיה מספר זוגי של עמודים. גישת פסק הדין והביצוע הם כדלקמן.

(1) מנגנון זיהוי עמודים: קורא את המטא נתונים של מסמכי PDF דרך ספריית PyMuPDF כדי לקבל ישירות מידע כולל על העמוד.

(2) שיפוט לוגיקה זוגיות: השתמש בפעולת מודולוס (עמוד מספר %2) כדי לקבוע זוגיות. אם התוצאה היא 1, זה נקבע כעמודים אי-זוגיים; אם הוא 0, הוא נחשב זוגי.

(3) אסטרטגיית עיבוד מובחנת: עבור עמודים-אי-זוגיים, הוסף אוטומטית עמוד ריק אחד בסוף המסמך התואם לגודל המסמך המקורי; עבור מסמכים דומים-, השאר את התוכן ללא שינוי והעתק ישירות לספריית הפלט.

(4) עקרון טיפול אבטחה: כל המסמכים המעובדים נשמרים בספריית "קבצים מעובדים" המיועדת, כאשר הקבצים המקוריים נשמרים כדי למנוע נזק לקובץ שנגרם כתוצאה מפעולה שגויה, כפי שמוצג באיור 1.

info-1-1 איור 1 ממשק כלי בדיקת ועיבוד ספירת דפי PDF

02

נקודות יישום טכניות

הכלי משתמש ב-Tkinter לבניית הממשק הגרפי וכולל בעיקר שלושה מודולים פונקציונליים.

(1) מודול בחירת ספריות: תומך בבחירה חזותית של ספריית קבצי המקור וספריית הפלט, כאשר ספריית הפלט המוגדרת כברירת מחדל היא תת-תיקיית תחת ספריית המקור.

(2) מודול עיבוד אצווה: משתמש בטכנולוגיית ריבוי השחלות לביצוע עיבוד רקע, הימנעות מהקפאת ממשק, ובמקביל מציג את התקדמות העיבוד בזמן אמת באמצעות סרגל התקדמות.

(3) מודול תצוגת תוצאות: מציג את תוצאות העיבוד של כל קובץ בפורמט טבלה, כולל ספירת העמודים המקורית, פעולת העיבוד ומידע הסטטוס, תוך הבחנה בין מצבים מוצלחים ונכשלים לפי צבע.

כלי בדיקת המרת עקומת PDF

01

פונקציות ליבה והיגיון שיפוט

כלי בדיקת המרת עקומה מתמקד בקביעה אם הטקסט במסמך הומר לעקומות. היגיון השיפוט המרכזי שלו מבוסס על ניתוח מידע הגופן במסמך ה-PDF.

(1) זיהוי קיום טקסט: קובע אם המסמך מכיל טקסט הניתן לעריכה על ידי חילוץ טקסט מהעמודים.

(2) ניתוח מידע גופנים: מנתח את רשימת הגופנים המוטבעים במסמך. אם קיים מידע גופן, זה מציין שהטקסט לא הומר לעקומות.

(3) כללי שיפוט מקיפים: אם יש תוכן טקסט ואין מידע על גופן, זה מציין שהטקסט הומר לעיקולים (סימן ירוק); אם אין תוכן טקסט, אין צורך בהמרה (סימן ירוק); אם יש תוכן טקסט ומידע על גופנים, הטקסט לא הומר לעקומות (סימן אדום), כפי שמוצג באיור 2.

כלי זה תוכנן במיוחד במצב 'בדוק בלבד, אל תמיר'. הסיבה העיקרית היא שלפי משוב המפעיל, ביצוע המרת עקומה בקבצים המכילים חותמות רשמיות עלול לגרום בקלות לאיבוד החותמות או גרפיקה אחרת, כך שהכלי שומר רק על פונקציית הבדיקה.

info-1-1

איור 2 כלי בדיקת עקומת PDF

02

נקודות יישום טכניות מרכזיות

כלי זה משתמש גם ב-Tkiner לבניית הממשק, עם שלוש נקודות טכניות מרכזיות.

(1) חילוץ מידע גופנים: באמצעות פונקציית ניתוח בלוקים של טקסט של PyMuPDF, השג את כל שמות הגופנים וספירת המופע שלהם במסמך.

(2) הדמיית תוצאות: השתמש בתצוגות עץ כדי להציג תוצאות בדיקה, תוך הבחנה אינטואיטיבית של מצבים שונים באמצעות צבעים וסמלים.

(3) פונקציית סטטיסטיקת מצב: מחשבת אוטומטית את מספר המסמכים העומדים בדרישות, ועוזרת למפעילים להבין במהירות את מצב הבדיקה הכולל.

אתגרים ופתרונות במהלך תהליך הפיתוח

כמפתח לא-מקצועי, נתקלתי באתגרים טכניים רבים במהלך פיתוח הכלים. הבעיות והפתרונות הספציפיים הם כדלקמן.

(1) בעיית עומק ניתוח PDF: ספריית ה-PDF הראשונית לא הצליחה לחלץ במדויק מידע על גופנים, אך לאחר הצעת AI, מעבר לספריית PyMu PDF פתר את הבעיה.

(2) בעיית עיכוב ממשק: בעת עיבוד מספר רב של קבצים באצווה, הממשק לעתים קרובות לא מגיב. תחת הנחיית בינה מלאכותית, יושם פתרון עיבוד מרובה הליכי, שפותר למעשה בעיה זו.

(3) טקסט סיני משובש: על ידי קביעת פרמטרי גופן והגדרות קידוד, נפתרת הבעיה של תווים סיניים משובשים המוצגים בממשקים ובקבצים מיוצאים.

(4) מנגנון טיפול בחריגים: כדי לטפל בבעיה של קריסות תוכניות הנגרמות על ידי קבצי PDF פגומים, מנגנון לכידת החריגים שופר כדי להבטיח שכשל בקובץ בודד לא ישפיע על התהליך הכולל.

לאורך תהליך הפיתוח, כלי הבינה המלאכותית מילאו תפקיד חשוב כיועצים טכניים, ולא רק סיפקו דוגמאות קוד מרכזיות אלא גם הסבירו את העקרונות של ניתוח פורמט קבצי PDF, ועזרו למפתחים לתפוס במהירות ידע מיוחד.

הערך והתחזית של יישומי כלים

היישום של שני כלים אלה הביא לשיפורי יעילות משמעותיים בעבודת הייצור, המתבטאים במיוחד בשני ההיבטים הבאים.

(1) חיסכון בעלויות זמן: בדיקות ידניות שנמשכו בעבר שעה אחת יכולות להסתיים כעת תוך 5 דקות, מה שמגדיל את היעילות בכמעט פי 10.

(2) יציבות איכות משופרת: מונעת ביעילות פיקוח מבדיקה ידנית, מה שמבטיח איכות הדפסה עקבית.

תיעוד תהליך הפיתוח של שני הגאדג'טים הללו נועד להעביר את פילוסופיית העבודה של "חקירה וחדשנות", תוך התמקדות בפתרון בעיות ספציפיות בייצור בפועל, אופטימיזציה של זרימות עבודה מסורתיות באמצעים טכניים, ובסופו של דבר להשיג הפחתת עלויות ושיפור יעילות.

אל תתנו לתהליך ההכנה להאטה שוב! הכלים שפותחו בעצמנו- הגדילו את היעילות בכמעט פי 10