ניהול היררכי של המידע (HSM) - סקירה טכנולוגית
מאת: יואל בן ארי, VP לפיתוח עסקי, MBI
Hierarchical Storage Management היא תפיסה טכנולוגית ותיקה, הקיימת בסביבת ה-MF
כבר שנים רבות (20-25 שנים), תפיסה שהותאמה מאוחר יותר לסביבת המחשוב הפתוח (Open
System). בהגדרתו, ה- HSM הוא ניהול היררכי של המידע בין מספר רמות לוגיות\פיזיות של
אמצעי אחסון שונים ("Multi Tiered") תוך מתן חוקיות המוגדרת מראש ו\או משתנה בהתאם
לצורך.
כיום, במרבית הארגונים, מקובל לאחסן את המידע במערכי דיסקים מרכזיים (Centerlized
Storage) המשרתים את השרתים השונים, ולמעשה מהווים משאב המספק מידע בזמינות גבוהה
(Online Storage), כשהגידול המתמיד בנפחי המידע מחייב בהתאמה גם גידול בנפחי האחסון
של אביזר האחסון המרכזי. עלות נפחי האחסון באביזר האחסון המרכזי גבוהה, וככל שהיקף
המידע גדל, הופך גם ניהולו למורכב ויקר יותר. בנוסף, קיימות גם מגבלות
טכניות\לוגיות, כגון כמות הדיסקים הלוגים שניתן להגדיר במערך הנתון. ככל שכמות
הדיסקים גדלה (והמידע המאוכסן בהם) – ניכרת ירידה כוללת בביצועי מערכת האחסון וכן
וקשה יותר לנייד מידע ממקום אחד למשנהו בתוך אביזר האחסון.
הנחת היסוד העומדת בבסיס טכנולוגיית ה-HSM קובעת, שככל שחולף הזמן, כך גם נפח המידע
המצטבר גדל. המידע ה"חדש" יותר הוא בד"כ ה"נדרש" וה"פעיל" יותר, ואילו המידע ה"ישן"
יותר הוא ה"פעיל" פחות ((Less active, ועל בסיס הנחה זו, פועל העיקרון המנחה את
התפיסה הטכנולוגית של זיכרון המטמון Cache)). לפי עיקרון זה, מן הראוי לאחסן את
המידע ה"נדרש" יותר במערך דיסקים המאפשר זמינות גבוהה יותר וביצועים טובים יותר,
ואילו המידע הפחות "נדרש" יימצא באביזרי אחסון זולים יותר (ביחס דולר GB/) למרות
העובדה שביצועיהם לרוב יהיו פחות טובים. שמירה על עיקרון זה תאפשר לארגון לנהל את
המידע ביעילות גבוהה יותר וכן לחסוך כסף רב (הן בעלות הישירה של החומרה והן בעלות
הניהול הנלוות).
עקרון מפתח נוסף הקיים בבסיס הטכנולוגיה הוא עקרון השקיפות. לפי עקרון זה כל המידע,
כולל המידע הנמצא באביזרים המשניים, יהיה זמין ("On Line") למשתמש. רמת הזמינות
תוגדר מראש לפי קריטריונים שונים הנשמרים לאורך הזמן. עקרונות אילו ניתנים לשינוי
במידת הצורך. נגזרת של עקרון זה מגדירה מימוש של תהליך "אוטומטי" ועצמאי של מעבר
המידע (Data Magrartion) בין האביזר היקר (והמהיר יותר) לאביזר האחסון הזול והאיטי
יותר. באמצעות תהליך זה ניתן להגדיר את מעבר המידע בין האביזרים השונים (באופן דו
סיטרי) תוך מתן שקיפות מוחלטת למשתמש הקצה.
•
Automatic data migration
•
Policy driven
•
Uses different storage tech.
•
Multiple layers
•
Transparent access
•
Appears as one large FS
|
 |
ה- HSM ממומש בד"כ באמצעות שני מרכיבים עיקריים :
האחד - תוכנה המותקנת בשרת האחסון. באמצעות תפריטים שונים ניתן לבחור ולהגדיר את
התנאים (Polices) שלפיהם "ינוע" המידע מרמה אחת בהיררכיה לרמה אחרת (מרמה ראשית
לרמה משנית) ו\או חזרה. לדוגמה, פרמטר מקובל בתהליך ההגדרות הוא מידת "נגישות
הקובץ". ניתן להגדיר מראש שהקבצים ה"פעילים" יותר ימצאו בכל רגע נתון באביזר האחסון
הראשי (מערך הדיסקים) ואילו הקבצים ה"פחות" נגישים "יעברו" לאביזר האחסון המשני.
בזכות שיטה זו, יוכל מנהל המערכת להבטיח לעצמו סף מוגדר וקבוע של נפח המידע הנשמר
באביזר האחסון הראשי.
מגוון הקריטריונים הניתנים להגדרה בתהליך ה-HSM גדול ביותר. לדוגמה, ניתן להגדיר
אבחנה בין סוגי ואופי הקבצים שאנו מעוניינים "לשנע" (או כאלה שאין אנו רוצים כלל
"לגעת" בהם). את האבחנה ניתן אף להגדיר גם באמצעות חיתוך של משתמשים שונים, זמנים
שונים במשך היממה, ומשתנים תלויי עומס הרשת וכו'. בנוסף, ניתן גם לשלב בין
הקריטריונים השונים תוך ביצוע התניות לוגיות ביניהם, דבר היוצר גמישות התפעולית רבה
ביותר.
כיום, קיימות בשוק מספר תוכנות הממשות HSM, בהן OTG,Veritas ו- Migrator. גם עבור
בסיסי נתונים (דוגמת Oracle) קיימים פתרונות HSM, אם כי במגוון קטן בהרבה, וזאת
בגלל מבנה המידע הלוגי המחייב רציפות בכל רגע נתון.
מימוש מעניין ונקודתי לטכנולוגית ה-HSM ניתן למצוא בסביבת הדואר האלקטרוני (כגון
Exchange). כידוע כמות הדואר האלקטרוני המצטברת גדלה מיום ליום, ולעיתים העדר העתק
פיזי של המכתב עשוי להיות בעל משמעות משפטית מרחיקת לכת עבור הארגון. בד"כ נוטה
המשתמש למחוק דואר "ישן", דבר העלול להיות בעוכריו או בעוכרי הארגון ברגע האמת.
ה-HSM יכול להבטיח שמירת הדואר האלקטרוני באביזר אחסון מתאים לפי מאפיינים שניתנים
לקביעה מראש, דוגמת תאריך, שם שולח, שם נמען, וכו'. כל אלה ניתנים למימוש תוך הבטחת
נגישות לכל מכתב בכל רגע נתון.
הנדבך הפיזי של פתרון ה-HSM מורכב משילוב של טכנולוגיות אחסון שונות. בד"כ הדיסק
האופטי (R/W או DVD –RAM) משמש כאביזר אחסון משני (רמה 2) למערך הדיסקים המהיר. זמן
הגישה (פרמטר חשוב בתכנון הפתרון) של דיסק אופטי בודד נע באזורms 20-9, ושל ספריה
אופטית אוטומטית כ- sec30-25 (תלוי במיקום הקובץ בספרייה). נפח האחסון של מדיה
אופטית אחת הוא GB9.2 ושל מדיית DVD הוא GB4.7.
ספריית כונני הגיבוי ((Tape Library משמשת בד"כ למימוש רמה 3 של פתרון ה-HSM, אך לא
בהכרח. ניתן גם להגדיר שתי רמות HSM בלבד. לדוגמה, ניתן להגדיר מערך דיסקים המשמש
כאביזר אחסון ראשי וספריית סרטים כאביזר אחסון משני. בטכנולוגיה של היום כונני
הסרטים מבטיחים נפח גדול ביותר (עד GB 100 לקלטת) תוך הבטחת קצב העברה גבוה ביותר.
יש לציין שקיימים כונני סרטים מהירים המיועדים במיוחד לסביבת ה-HSM, כגון ה- STK
9840. כונן זה מאפשר זמן הטענת קלטת ונגישות לקובץ תוך שניות ספורות. גם "המדף"
יכול לשמש כ"אמצעי אחסון" נוסף המאפשר נפח כמעט בלתי מוגבל (בתלות מגבלת מערכת
ההפעלה) וזאת באמצעות תהליך הוצאת הקלטת (Export), באמצעות תוכנת הניהול, מתוך
הספרייה החוצה ו\או חזרה לפי אותם מאפיינים שהוגדרו מראש.
כמו בכל יישום טכנולוגי המשלב תשתיות חומרה ותכנה, גם תהליך יישום ה-HSM מחייב
ניתוח מקדמי של המערכת ואפיון סוגי המידע השונים וצרכי המשתמש במידע שבארגון. לאחר
תכנון מדויק ומקיף, ניתן להטמיע את תהליך ה-HSM בארגון ולאחר תהליך ההטמעה, יש לבצע
תהליכי בדיקה תקופתיים הבוחנים את ביצועי המערכת תוך השגת יחס עלות\תועלת מיטבי.
יואל בן ארי,VP לפיתוח עסקי MBI,
Email:
yoel@mbi.co.il
|