סריקת מסמכים בעולם הבינה המלאכותית

מאת: רונן כהן צמח מנכ"ל קבוצת ארכיביון ומומחה בתחום ניהול מערכות ואבטחת מידע

לקוחות רבים שלנו תוהים מה תהיה ההשפעה של הבינה המלאכותית על סריקת המסמכים, עולם שירותי הארכיב הדיגיטלי והחתימה הדיגיטלית.

סקירה זו תתחלק למספר תובנות שלנו מהניסיון רב השנים בתחום:

כלים שימושיים והיישומים נכון להיום, ומהם התועלות והסיכונים משימוש בבינה מלאכותית בעתיד הקרוב.

למעשה כבר למעלה מ-15 שנים בתי תוכנה מכניסים מערכות "לימוד מכונה" לתוך תוכנות הפועלות במרחב המשרדי היישומי.

ז"א שבמסגרת פקודות שמפעילים בתוך סביבת העבודה, מנחים את התוכנה לחזור על פעולה מסוימת, שוב ושוב, ולשפר בכל פעם את התשובה.

אז מה שנקרא בעבר בינה מלאכותית בלי עצמאות ניהולית של התוכנה, נמצא בעולמות של סריקת המסמכים כבר שנים רבות ומיושם בפועל בהצלחה מרובה.

היישומים השכיחים ביותר הם:

זיהוי תווים בכתב או בדפוס, שאיבת נתונים ממקומות מסוימים המתוארים גרפית באמצעות צילום זיהוי וייצוא, זיהוי אימג' זהה בתהליך הסריקה ובחינה האם מסמך זה חוזר על עצמו ולאן עלי להעבירו, או אילו נתונים מספריים או מילוליים עלי לייצא כדי שמקסימום

מידע איכותי יוכל להיות מטויב.

ברגע שלימוד המכונה הטכני חוזר על עצמו יותר פעמים, כך הוא מכסה יותר מסמכים, מכיר ויכול ביעילות להוציא כמה שיותר נתונים ולהעביר אותם לפלטפורמה אחרת.

אין שימוש במניפולציה בשלב לימוד המכונה.

כמובן שישנם יישומים רבים שמכונות לומדות עושות בתוך תוכנה: ניקוי מסמך, שיפור נראות, פעולת גרפיות שונות המיישרות את המסמך והופכות אותו לאיכותי וקריא.

בעיקר פעולות גרפיות שונות.

בתחום הביג דאטה המטרה היא לא לשאוב מידע שהוא "זבל", מה שנקרא "מטא דאטה" שאין לה מהות עניינית ואינה משפרת בכהו זה את המידע הרלבנטי שאני צריך כדי להתקדם בטיוב המידע השימושי, ובפועל גורמת לבזבוז משאבים של מקום איחסון,

זמן, ואנרגיה.

מה התועלת במסמך בין 20 עמודים המתאר תהליך עבודה, אם כל מה שאני צריך זו המסקנה.

אז למה לטייב 20 עמודים אם המסקנה קיימת בתחתית העמוד האחרון?

אולי המידע יכול לשמש בעתיד היסטוריונים או סוציולוגים, שבאים לבחון תאוריה מסוימת והמטא דאטה יכול לציין תהליכי עומק ומגמות.

אבל לעבודה השוטפת של מרבית הארגונים העסקיים, ליעילות העבודה ולתועלת המיידית כל זה אינו רלבנטי.

בשלב זה נבחן את נושא התועלת של שימוש בבינה מלאכותית:

אם אנו מלמדים תוכנה לארכיב דיגיטלי, פעם אחת שמסמך הנושא את כותרת "חשבונית" ומה הנתונים הנמצאים בתוכה, בהמשך תוכל לקטלג מה רלבנטי ומה לא.

האם שאר המסמכים המגיעים מאותו ספק מקוטלגים כחומר חשבונאי או שהנושא הוא אחר.

עבודת המיון של המסמך ושליחתו אוטומטית למייל או לקטלוג בספרייה הנכונה יחסוך זמן רב.

המערכת תיצור משימה לביצוע או פגישה על סמך תכתובת ותלמד מתוכן המסמך את ההקשר, ותיידע או תיתן התראות לפעולות חדשות או חידוש פעולות על סמך ההקשר שנמצא במסמך.

לדוגמא: אם המסמך הוא בקשה לפגישה עם מנהל הרכש, בתוך המייל או בקשה לעדכון תעריפים / הצעה למוצר או שרות חדש / תלונה של לקוח,

המערכת תקרא, תבין את המהות וההקשר ותשלח התראה של: " שים לב נשלחה בקשה לפגישה בשבוע הבא על ידי מנהל המוצר בנושא שרות חדש נא תשומת ליבך האם לתאם אירוע?".

זמן עבודה אדמיניסטרטיבי ייחסך, זמן תיוק , הבנה של הקשר ואולי משרות נוספות שעסקו במענה למיילים או למכתבים.

בעתיד הרחוק, מכונות כאילו שמקבלות מסמכים או מיילים או מיידעים ידברו אחת עם השנייה, ומנהלים יקבלו רק תקציר משימות למה שבוצע על ידי המערכת.

בוטים חכמים שעוסקים בניתוב שיחות, לידים של מכירות, מענה שירותי אוטומטי בווטאפ מקבלים כבר היום מסמכים לפי נושא ומקטלגים אותם לפי ההקשר.

הקשיים מתגלים במספר אופנים בניהול ארכיב בינה מלאכותית מלא.

ברגע שמכונה מטפלת היא עלולה לא להיות רגישה לטיפול מסוים בלקוח שעלול להיפגע.

לא להתייחס לדחיפות בטיפול, וזה עלול לעלות בחיי אדם, אם למשל הפניה היא לקבלת מענה דחוף לצורך רפואי.

המערכת עלולה לייצר מניפולציה ולהבין דברים שאינם נכונים, כתוצאה מלימוד פייק ניוז או מרכישת ידע ברשתות חברתיות שאינו מבוסס,

למשל על סמך דוחות מזויפים שכביכול הועברה לקבוצת משקיעים אודות הרווח הרבעוני, החליטה המכונה לייצר פקודה למכירת מניות בהפסד בתום הרבעון.

מה שמנהל תיק מניות היה בודק באמצעות שיחת טלפון לאנליסט אחר, ובדיקת עובדות עלול לגרום להפסד כספי לקרן העוסקת בניהול כספים.

ישנה כברת דרך לעבור בה האנושות צריכה להחליט, איך לטפל ברגולציה בכל הנוגע לבינה מלאכותית, וקשורה למגבלות הכוח של המכונה, באילו תחומים הבינה לא תעסוק.

מהם מנגנוני הבקרה על הבינה, ומי מפקח עליהם.

מה ייחשב להפרה ויגרור השבתה של יכולות, מי יבצע את האכיפה בגבולות מדינה או אכיפה בינלאומית, והסדרת אמנה ורגולציה שתגן על אנשים, מידע, קניין רוחני אינטרסים לאומיים ועוד.

הבינה המלאכותית המשולבת בניהול כלל המידע האישי העסקי והציבורי, העוטף את כולנו, יכולה להיות אמצעי מדהים לניהול זמן נכון, חיסכון אך גם מקום בו גורמים שונים ישתמשו בטכנולוגיה הזו כדי לפגוע באינטרסים של אחרים.

אנו משלבים יכולות מתקדמות במערכות ארכיב דיגיטלי, בשירותי הסריקה וגם בהגנות הנדרשות על מערכות המידע .

השימוש בבינה מאפשר דיוק, קיצור תהליכי עבודה וחיסכון ניכר בתקציב ניהול המידע.

נשמח לעמוד לרשותכם.

חזרה לכל המאמרים

סריקת מסמכים בעולם הבינה המלאכותית

משך זמן שמירת מסמכים

החקיקה הרלוונטית בישראל