לחיות בצלו של איום בלתי פוסק לכשל טכנולוגי
הקדמה
שעת בוקר רגועה ביום חול.
הגברת בצד השני של הקפה מציעה: "אולי נאכל צהריים ביחד?"
תשובה: "רגע אבדוק ביומן".
נכנסתי ליומן בטלפון החכם, זו הייתה השנייה הרגועה האחרונה באותו יום.
כהרף עין גיליתי שאין לי יכולת לעיין ביומן. איני מסוגל לאחזר את המידע על סדר היום שלי, מועדי הפגישות ומיקומן הפכו לתעלומה, והחומר שצורף לפגישות אלה הפך לבלתי זמין.
ניסיונות להפעיל כלים אחרים כגון מחשב נייד או מחשב נייח כשלו וגרמו לי להבין שמדובר בכשל מערכתי ולא בתקלה בטלפון החכם שלי.
תקלה בחוות השרתים של ספק האינטרנט הצליחה לשבש את יומם של מיליוני בני אדם.
אירוע מעין זה מעלה על סדר היום מספר סוגיות.
התלות במדיה הדיגיטלית
התקלה שתוארה בהקדמה אפשרית, קרתה ותתרחש מעת לעת.
למה? מפני שהמערכות לא תוכננו לחסינות ברמה של 100%.
בדרך כלל מתכננים מערכות כך שתפעלנה בזמינות של 97%-99%, תלוי ברגישות המערכת ובחשיבותה. ההחלטה מגלמת חסכון כספי של מיליארדי דולרים, לבעלי חברות המחשוב, האינטרנט, חוות השרתים וכדומה.
מעט מאד מערכות מפותחות לפעולה בזמינות של 99.999% שמשמעותה זמינות מלאה. אבל זה עולה המון כסף ומתרחש רק במערכות מיוחדות מצילות חיים או ביטחוניות.
לנו הצרכנים, נותר רק להתפלל שאירועי כשל כאלה יתרחשו בשעות הלילה לפי השעון המקומי שלנו.
המשתמשים המסחריים והפרטיים פיתחו לעצמם "פטנטים" שונים ומשונים כדי להתגבר על תקלה כזו.
אף אחד מה"פטנטים" אינו נותן מענה מלא ורובנו מופתע כל פעם מחדש.
מערכות שפותחו במיוחד לאירוע ספציפי
לאחרונה, התקיימו בחירות לרשויות המקומיות בישראל. לקראת הבחירות תוכננו 2 מערכות מחשוב עיקריות.
במבחן התוצאה, אחת המערכות פעלה באופן חלקי והשנייה נפלה ברגע המבחן ולא ספקה את התוצר המתוכנן.
מערכת שליטה ובקרה באמצעות דיווחים מוזרמים על ידי נציגים בקלפיות
בהתאם לתכנון, כחמש עשרה אלף מזכירי קלפיות נדרשו להזרים דיווחים מסוגים שונים באמצעות הטלפון החכם שברשותם.
המערכת הותקנה בסמארטפונים מבעוד מועד נעשתה הדרכה ונערכו מספר תרגולים.
המערכת לא פעלה באופן מלא! למה? היו לכך מספר סיבות:-
- המשתמשים – בטווח גילאים משנות העשרים ועד שבעים. בדרך הטבע המבוגרים יותר התקשו בהזרמה, בעיקר כשנדרשו להקליד על המסך הקטן את תוצאות ספירת הקולות של 10-15 רשימות.
- עומס – כל המשתמשים נדרשו לדווח בשעה קבועה. העומס על המערכת גרם לכך שחלק מהדיווחים לא נקלט.
- ידידותיות – מדווחים לא קיבלו מהמערכת אינדיקציה לכך שהדיווח נקלט.
התפוקה המרכזית של המערכת הייתה אמורה להיות תמונת מצב מלאה של תוצאות ההצבעה בזמן אמת.
זה לא קרה.
הצגת תוצאות ההצבעה לציבור בזמן אמת
הבטיחו לנו שנקבל, דרך ערוצי החדשות השונים, באמצעות מרכז תקשורת ייעודי שהוקם על ידי משרד הפנים, את התוצאות מהקלפיות כשהן מלוות בסטטיסטיקות, בניתוחים ובגרפים וכל זאת בזמן אמת.
הבטיחו, אך לא קיבלנו. המערכת נפלה.
היישום מהפכני בקנה מידה בינלאומי ומבוסס על מערכות gis שפותחו על ידי ענקית טכנולוגית מידע גאוגרפי בשם esri. esri, חברה גדולה ומוכרת ואחת הגדולות בעולם, אם לא הגדולה והמובילה בתחום, נפלה בדיוק בנושא הזמינות.
יום יומיים לאחר הנפילה שלח נשיא החברה מכתב התנצלות לשר הפנים והסביר שחוות השרתים נפלה.
סיכום
מרבית המערכות ובכלל זה מערכות מחשב לא מתוכננות לתת מענה בזמינות מלאה.
כולנו יודעים זאת עוד מתקופת מלחמת המפרץ הראשונה (נפילת מערכות הטלפוניה כל אימת שנפל טיל עיראקי בישראל), עבור דרך גל הפיגועים, נפילת מגדלי התאומים, וקריסת הרשת של חברת "גולן" סלולר בסוף נובמבר 2018.
מנהלים ומשתמשים חייבים להפנים עובדה זו ולקבל החלטה מבעוד מועד כיצד להתמודד עם מצב של הפסקת פעולה של מערכות.
מנהלים חייבים לקבוע לעצמם מהי רמת הזמינות שהם מצפים לקבל, לתקצב זאת בהתאם ולקבוע שיטת פעולה כשמערכת נופלת.
תגיות:- כשל טכנולוגי, ניהול, זמינות
המערכת שפעלה באופן חלקי וזאת על פי המאמר, כשלה בגלל שלושה גורמים:
משתמשים.
עומס.
ידידותיות.
שלוש הגורמים האלו אינם גורמים טכנולוגים אלא גורמים ניהוליים בלבד.
שלום דב,
מבחינת המשתמש הטלפון החכם זהו המכשיר שהשבית את השרות.