Tip:
Highlight text to annotate it
X
מתרגם: Yubal Masalker מבקר: Boaz Hovav
זוהי תמונת כדור-הארץ.
היא מאוד דומה לתמונות מהחללית אפולו
המוכרות לכולם.
אבל יש הבדל;
ניתן להקליק עליה,
ואם עושים זאת,
מקבלים זום על כמעט כל אזור בעולם.
לדוגמא, זהו מבט ממעוף ציפור
על קמפוס ה- EPFL.
במקרים רבים, ניתן גם לראות
כיצד בניין מסויים נראה מהרחוב ליד.
זה די מדהים.
אבל משהו חסר בסיור מופלא זה:
הזמן חסר.
איני בטוח מתי תמונה זו צולמה.
איני אפילו בטוח
שהיא צולמה באותו זמן של המבט ממעוף הציפור.
במעבדה שלנו, אנו מפתחים כלים
למסע לא רק במרחב
אלא גם בזמן.
השאלה שאנו שואלים היא:
האם ניתן לבנות משהו
כמו מפות גוגל של העבר?
האם ניתן להוסיף כפתור בראש מפות גוגל
ולשנות באמצעותו את השנה,
כדי לראות כיצד זה היה לפני 100 שנה,
לפני 1,000 שנה?
האם זה אפשרי?
האם ניתן לשחזר רשתות חברתיות מן העבר?
האם ניתן ליצור פייסבוק של ימי-הביניים?
האם ניתן לבנות מכונות זמן?
אולי אפשר פשוט לומר, "לא, זה בלתי אפשרי."
או שאולי ניתן לחשוב על כך מנקודת מבט של מידע.
לזה אני קורא פטריית המידע.
אנכית, זה הזמן.
אופקית, כמות המידע הדיגיטלי הזמין.
ברור שב-10 השנים האחרונות, יש לנו המון מידע.
וברור שככל שאנו נעים אל העבר, יש פחות מידע.
אם ברצוננו לבנות משהו כמו מפות גוגל של העבר,
או פייסבוק של העבר,
עלינו להגדיל מרחב זה,
עלינו להפכו לצורת מלבן.
כיצד עושים זאת?
דרך אחת היא דיגיטליזציה.
יש המון חומר זמין --
עיתונים, ספרים, אלפי ספרים.
ניתן להפכם לדיגיטליים.
ניתן לשלוף מהם מידע.
ברור שככל שנעים אל העבר, נקבל פחות נתונים.
לכן זה עלול שלא להספיק.
אז אפשר לעשות מה שהיסטוריונים עושים.
לעשות אקסטרפולציה.
לזה אנו קוראים, במדעי המחשב, הדמיה.
אם אני לוקח יומן,
אני יכול להחשיבו לא רק בתור יומן
של רב-חובל ונציאני המפליג למסע מסויים.
אני יכול להחשיבו בתור יומן
המייצג הרבה הפלגות של אותה תקופה.
אני עושה אקסטרפולציה.
אם יש ציור של חזית מבנה,
אני יכול להחשיבו לא רק ככזה השייך
למבנה מסויים, אלא ככזה המייצג שיטת בניה
של מבנים אחרים שאין לנו מידע עליהם.
לכן אם ברצוננו לבנות מכונת זמן,
דרושים לנו שני דברים.
אנו זקוקים למאגרי נתונים מאוד גדולים,
ואנו זקוקים למומחים מצטיינים.
מכונת הזמן הונציאנית,
המיזם שאני עומד לדבר עליו,
הוא מיזם משותף בין ה-EPFL
ואוניברסיטת Venice Ca'Foscari.
יש דבר אחד מאוד מיוחד בונציה,
והוא שהממסד שם היה תמיד
מאוד ייקה.
הם שמרו שם הכל,
כמעט כמו גוגל היום.
ב- Archivio di Stato,
יש 80 ק"מ של ארכיונים
המתעדים כל אספקט של החיים
בונציה במשך יותר מ-1,000 שנה.
יש רישום של כל ספינה שהפליגה,
כל ספינה שנכנסת.
של כל שינוי שבוצע בעיר.
הכל מתועד שם.
אנו מתחילים מיזם דיגיטליזציה בן 10 שנים
שמטרתו להפוך את
הארכיון הכביר הזה
למאגר מידע ענקי.
היעד שאנו רוצים
להגיע אליו זה 450 ספרים ביום שיעברו דיגיטליזציה.
אבל ברור שזה לא מספיק לעשות דיגיטליזציה,
כי מסמכים הללו,
ברובם הם בלטינית, טוסקנית,
בניב ונציאני,
לכן צריך לתעתק אותם,
לתרגמם במקרים מסויימים,
למספר אותם,
וברור שכל זה לא קל.
במיוחד, השיטה המסורתית לזיהוי אופטי של אותיות, המשמשת
לכתבי-יד מודפסים,
אינה יעילה למסמכים הכתובים ביד.
הפיתרון לכך מגיע
מתחום אחר: זיהוי דיבור.
זה משהו שנראה בלתי אפשרי,
אבל בעצם ניתן להוציאו לפועל,
פשוט על-ידי הוספת אילוצים.
אם יש לנו דוגמה טובה
של השפה שבשימוש,
אם יש לנו דוגמה טובה של מסמך,
כלומר, אם הוא בנוי כהלכה.
ואלה הם מסמכים מנהלתיים.
ברוב המקרים הם בנויים כהלכה.
אם מחלקים את הארכיון הענקי הזה למרכיבי-משנה
בהם כל מרכיב כזה, יש לו תכונות הדומות לאחרים,
אז יש סיכוי להצליח.
אם מגיעים לשלב הזה, נתקלים בעוד משהו:
ניתן לשלוף ממסמך כזה אירועים.
קרוב לודאי ניתן לשלוף 10 מיליארד
אירועים מארכיון זה.
ניתן לחפש בתוך מערכת מידע
ענקית כזו בהמון דרכים.
ניתן לשאול שאלות כגון,
"מי חי במבנה מפואר זה ב-1,323?"
"כמה עלה דג דניס בשוק של
מחוז ריאלטו בשנת 1,434?"
"מה היתה משכורתו
של נפח זכוכית ב-Murano
במשך עשור?"
אפשר אף לשאול שאלות
יותר מורכבות כי המאגר יכיל הגדרות סמנטיות.
ואז מה שניתן יהיה לעשות זה לשים מידע במרחב,
כי הרבה מהמידע הוא מרחבי.
ומזה, ניתן לעשות דברים כמו
לשחזר את המסע יוצא-הדופן
של עיר מסויימת שהיה בה פיתוח מתמשך
במשך 1,000 שנה,
ושהצליחה במשך כל
אותה תקופה לשמור על איזון עם סביבתה.
ניתן לשחזר אותו מסע
ולצפות בו באופנים שונים.
אבל ברור שלא ניתן להבין את ונציה רק מתוך צפייה בעיר.
יש למקם אותה בהקשר אירופאי רחב.
לכן הרעיון הוא לתעד את כל הדברים
שהצליחו ברמה האירופאית.
אנו יכולים לשחזר גם את תולדות
האימפריה הימית של ונציה,
כיצד היא הלכה והשתלטה על אזור הים-האדריאטי,
כיצד היא הפכה לאימפריה הכי חזקה של ימי-הביניים
בתקופתה,
שולטת על מרבית הנתיבים הימיים
מהמזרח דרומה.
אבל ניתן לבצע עוד דברים אחרים,
כי בנתיבים הימיים הללו,
יש תבניות קבועות.
ניתן לעשות צעד נוסף
וממש ליצור מערכת הדמיה,
ליצור סימולטור של הים-התיכון
שיהיה מסוגל ממש לשחזר
אפילו את המידע שחסר,
דבר שיאפשר לנו לשאול שאלות
כאילו אנו משתמשים במתכנן מסלולי שיט.
"אם אני נמצא בקורפו ביוני 1,323
ורוצה להגיע לקונסטנטינופוליס (היום איסטנבול),
היכן אוכל לעלות לספינה?"
כנראה שנוכל לענות
על השאלה בדיוק של יום או יומיים או שלושה.
"כמה זה יעלה?"
"מה הסיכויים להיתקלות בשודדי-ים?"
אתם בטח מבינים
שהאתגר המדעי המרכזי במיזם כמו זה
הוא איפיון, כימות והצגה של אי-הודאות
וחוסר העקביות בכל שלב של התהליך.
ישנן שגיאות בכל מקום,
שגיאות במסמך, שם לא נכון של רב-החובל,
חלק מהספינות כלל לא הפליגו בים.
יש שגיאות בתרגום, הטיות בפרשנות,
ומעל הכל, אם מוסיפים עיבוד נתונים אלגוריתמי ממוחשב,
יהיו שגיאות בזיהוי,
שגיאות בשליפת מידע,
כך שהנתונים מאוד לא ודאיים.
אם כך, כיצד נוכל לאתר ולתקן אי-התאמות אלו?
כיצד ניתן לבטא חוסר ודאות כזו?
זה קשה. דבר אחד שאפשר לעשות
זה לתעד כל צעד בתהליך,
לא רק לתעד את המידע ההיסטורי,
אלא את מה שאנו מכנים נתוני המידע ההיסטורי,
כלומר כיצד המידע ההיסטורי בנוי,
תוך תיעוד כל שלב.
זה לא יבטיח שאנו
מתכנסים לעבר סיפור אחד ויחיד של ונציה.
אבל קרוב לודאי שנוכל לשחזר
סיפור מלא ומתועד אפשרי של ונציה.
אולי אין מפה אחת ויחידה.
אולי ישנן כמה מפות.
המערכת אמורה להרשות זאת,
מכיוון שעלינו להתמודד עם צורה חדשה של אי-ודאות,
שהיא באמת חדשה בסוג כזה של בסיס נתונים ענקי.
וכיצד עלינו להציג
מחקר זה לקהל הרחב?
שוב, ונציה היא חריגה.
עם מיליוני מבקרים הבאים אליה כל שנה,
זהו בעצם אחד המקומות
הטובים ביותר כדי לנסות להמציא את מוזיאון העתיד.
דמיינו שרואים אופקית את המפה המשוחזרת
של שנה מסויימת,
ואנכית רואים את המסמך ששימש
לשיחזור,
את האיורים, לדוגמא.
דמיינו מערכת היקפית תלת-מימדית
המאפשרת לצלול פנימה ולשחזר את ונציה של שנה מסויימת,
חוויה כלשהי שניתן לשתף בקבוצה.
ולהיפך, דמיינו שמתחילים
ממסמך, כתב-יד ונציאני,
ואתם מראים מה אפשר לבנות ממנו,
כיצד הוא מפוענח,
כיצד ניתן לשחזר את ההקשרים שבמסמך.
זוהי תמונה מתערוכה
המתקיימת כעת בג'נבה
בעזרת מערכת מהסוג הנ"ל.
לסיום, אפשר לומר
שהמחקר במדעי-הרוח עומד לעבור אבולוציה
שעשויה להידמות
למה שקרה במדעי-החיים לפני 30 שנה.
זו רק שאלה של מידה.
אנו רואים מיזמים שהם
מעבר ליכולת הביצוע של קבוצת מחקר בודדת,
וזה דבר באמת חדש בתחום של מדעי-הרוח,
שלעיתים קרובות רגילים לעבוד בהם
בקבוצות קטנות או רק עם מס' חוקרים בודדים ביחד.
כאשר מבקרים ב-Archivio di Stato,
חשים שזה משהו מעבר ליכולתה של קבוצה בודדת,
ושצריך להתקיים מאמץ משותף.
לכן מה שעלינו לעשות בשביל שינוי תפיסתי זה
הוא לטפח דור חדש של
"אנשי-רוח דיגיטליים"
שיהיו מוכנים לשינוי זה.
אני מאוד מודה לכם.
(מחיאות כפיים)