מהו השילוב המנצח לניהול המידע הארגוני?

ניהול נתונים משולב עם למידת מכונה (Machine Learning) – זה השילוב המנצח לניהול המידע הארגוני!

מחקר של חברת גרטנר שנערך לאחרונה מראה שברוב הארגונים קיים קושי להשיג נתונים שהם מוכנים לעסקים (business-ready) בשל היעדר פלטפורמה מקיפה, כלל ארגונית, הכוללת אינטגרציה עם מערכות הארגון.

קטלוג מידע משולב למידת מכונה (Machine Learning) משמש לאיתור, סיווג, טיוב וניהול נתונים. הקטלוג הנתונים שהוא ליבת מערכת הידע משמש כמקור המידע האמיתי היחיד (Single Source of Truth) אודות הנתונים בארגון. משתמשי המערכת יכולים לגשת באופן עצמאי לנתונים הארגוניים ולדעת בוודאות שניתן לסמוך עליהם ולהשתמש בהם, כך ארגונים יכולים לקבל החלטות עסקיות בצורה מהירה ומבוססת על מידע שלם, מדויק, עדכני ומהימן (business-ready).

למידת מכונה (Machine Learning) מאפשרת לארגונים להשתחרר מלוגיקה עסקית מבוססת על כללים (Rules) ולהסתמך על החלטות מונעות נתונים בתוך מערכות ניהול הידע.

למידת מכונה (ML) שימושית במיוחד בשלושה תחומים כאשר מעוניינים לצמצם למינימום את העבודה הידנית וזמן הקליטה של הנתונים:

סיווג אוטומטי של פריטי מידע
העשרת המידע בפריטי המידע
סטנדרטיזציה בתיאור המידע

תהליכים אלה קריטיים לחסכון בזמן ועלויות.

סיווג אוטומטי

באמצעות יכולות למידת המכונה (ML), משתמשי מערכת ניהול הידע יכולים לסווג באופן אוטומטי פריטי המידע לקטגוריות מתאימות, על סמך תיאור המידע או טקסט הנלווה אליו. ציון דירוג איכות הסיווג (Confidence Score) יקבע האם הקיטלוג יעבור לבדיקה ידנית. התיקונים הידניים נאספים בהפרשי זמן קבועים כמשוב לאימון מודלים של ML וכך לשפר את יכולות הסיווג לאורך זמן.

כדי לאמן את מודלי ה-ML, יש צורך בקובץ נתונים ראשוני המכיל מידע מסווג לקטגוריות צפויות. הקובץ חייב לכלול דוגמאות של נתונים (למשל שמות מוצרים או שירותים) מכל קטגוריה בכמות כזאת שמערכת הML תוכל ללמוד מספיק וריאציות של נתונים אפשריים בכל קטגוריה. למאגר של כ-500 קטגוריות יספיקו 15-20 פריטי מידע לקטגוריה.

לאחר אימון המכונה ניתן יהיה לוותר על סיווג פריטי המידע לקטגוריות והמערכת תסווג אותם באופן אוטומטי.

העשרת המידע על נתונים (Metadata) מתוך תיאור טקסטואלי

בדרך כלל מידע נלווה על פריטי המידע (ערכי Metadata) מוזן באופן ידני או באמצעות שימוש במספר כללים מותאמים המבוססים על תנאים בתיאורי פריטי המידע או טקסט נלווה להם. מערכת מבוססת למידת מכונה (ML) משתמשת במבני נתונים הסתברותיים כדי לעדכן תכונות עם ערכים מתיאור פריטי המידע. למשל, המערכת יכולה לקרוא קובץ Excel המכיל את סכמת הנתונים על מוצרים כדי להבין את התכונות האפשריות של המוצרים ואת הערכים שלהם עבור כל מוצר. התכונות מתעדכנות באופן אוטומטי.

סטנדרטיזציה של נתונים

למידת מכונה (ML) יכולה גם לעשות סטנדרטיזציה של נתונים במטרה לתקן בעיות. מערכת ה- ML לומדת ייצוגים קונטקסטואליים של תיאורי מוצרים למשל ומשתמשת בייצוגים אלה כדי לזהות בעיות בתיאורים ויכולה להמליץ על אפשרויות טובות יותר. כחלק מתהליך לימוד המכונה, מערכת ה- MLתשתמש במידע קיים המכיל את התיאורים הנכונים של המוצרים ותשתמש במשוב כדי לשפר את הזיהוי והטיפול בבעיות בהתאם.

מדוע תכונות אלה כה נחוצות?

שתיים מנקודות הכאב הגדולות ביותר לניהול מידע בארגונים הם התאמת תכונות אוטומטית וגילוי חריגות, שתיהן ניתנות לפתרון באמצעות מודלים של למידת מכונה.

לסיכום

בעת מיזוג מאגרי נתונים חיצוניים למערכת אחת, אתגרים כמו פריטי מידע כפולים, בעלי שמות שונים, כותרות חסרות ניתנים לטיפול רק באופן ידני. שימוש ביכולות של למידת מכונה יאפשרו לזהות פריטי מידע כפולים, חריגים ולחלץ תכונות ו-Metadata בצורה כמעט אוטומטית לחלוטין.

Signature-IT Data Management הינה פלטפורמה רבת עוצמה לניהול נתונים ומשלבת יכולות AI, NLP ולמידת מכונה לניתוח, סיווג ואחזור מידע.

לפרטים נוספים צרו קשר.

הישארו מעודכנים

מהו השילוב המנצח לניהול המידע הארגוני?