נורמה סידרתית להשוואת גרסאות
צעד ראשון לקראת מתודה פילולוגית-פילוגנטית-ממוכנת

אבישי יורב

מתפרסם לראשונה באתר דעת, אלול תשס"ג


תוכן המאמר:

1. פתיחה
2. סוגי שיבושים וסיבותיהם
    א. תפיסה חושית לקוייה
    ב. בעיות זיכרון, ריכוז ותת-מודע
    ג. השפעת תהליכים פסיכו-לינגויסטיים כלליים
    ד. הבנה לקוייה
    ה. שיבושים מכניים וטכניים
3. ספירת גרסאות שוות ושיבושים כבסיס לקישור עדי-נוסח
4. "צבת ראשונה" - שקלול חילופי גרסאות כתנאי לעיבוד ממוכן
5. מודל סודר להשוואת חילופי גרסאות
    5.1 דרגות מובהקות
    5.2 סולם אחיד לחילופי גרסה ושיבושים
6. סיום (שאיננו אלא פתיחה)

תקציר:
המאמר עומד על שני קשיים מתודיים בפילולוגיה-היסטורית. האחד הוא כמות הנתונים העצומה העומדת בפני חוקרי עדי-נוסח בחיבורים ארוכים ו/או נפוצים. השני הוא הקושי בבחירת קריטריונים להפיק אילן-יחס קוהרנטי מאוסף הבדלי הגרסאות של עדי-הנוסח.
מאמר זה הוא עיון מקדים להצגת מתודה כוללת, שאמורה לתת פתרון בו-זמני לשני הקשיים. בחלקו הראשון מוצג ניתוח פנומנולוגי של סוגי שיבושי-העתקה וסיבות לשיבושים. בחלק השני מוצע סולם אחיד לחילופי גרסאות ושיבושים. רשימת הסולם מהווה כלי תיאורטי ראשוני לעיצוב וליישום המתודה.
במקביל לפיתוח המתודה, נערכה סידרת ניסויים קונקרטית לקידוד חילופי גרסאות ועיבודם באלגוריתם פילוגנטי, שפותח לצורך מחקרים גנטיים. דיווח מפורט על הליכי הניסוי, משמעותו ותוצאותיו יימסר בעתיד.

מילות מפתח: מחקר תלמודי, גרסאות.

1. פתיחה
כל העוסק במחקר כתובי-יד1, נתקל כבר בצעדיו הראשונים בשיבושים מרובים, מהם גדולים ומהם קטנים. אחת הסיבות החשובות לקשיים בהבנה נכונה ומדוייקת של טקסטים עתיקים, היא השיבושים שהשתרבבו לתוכם. "דרך המלך" בה חודרים השיבושים לטקסט היא ההעתקה. לעיתים קרובות, נשארים השיבושים בעדי-הנוסח, וכידוע, כל העתקה נוספת מחדירה לטקסט שיבושים נוספים. בדרך כלל, הטפסים ששרדו מימי הביניים נכתבו עשרות ומאות שנים אחרי כתיבת החיבור, פער שמשמעו "דורות" רבים של העתקת טפסים והצטברות שיבושים על גבי שיבושים. איתור השיבושים, ניפויים ושיחזור הגרסה הנכונה, הן ממשימות היסוד של הפילולוגיה ההיסטורית באמצעות ביקורת הטקסט. במצבים רבים קשה להחליט מה אופיו של השיבוש ואפילו האם הוא בכלל קיים (כלומר, שמא דווקא זו הגרסה הנכונה). אין פלא אם כן, שגם במדע ביקורת הטקסט מקובלת הערכת-יתר לטיעונים אינטואיטיביים, ונהוג בו להסתמך בעיקר על אמון באינטואיציה של בעלי ידע ונסיון במקצוע. שיבושי גרסאות מציגים מצב פאתולוגי של טקסט. אבל, כמו שחקר מחלות עשוי לתרום להבנה טובה של מערכות האורגניזם ותיפקודן, כך חקר השיבושים עשוי לסייע בהבנת תהליכי השתלשלות הטקסט ולתרום חלק בשיחזורו. באופן פאראדוקסאלי למדיי, שיבושי טקסט מהווים "גרסאות מקשרות", וככל שהן מרובות, אפשר להבחין ביתר דיוק בין עדי-הנוסח, לחלקם לקבוצות ולמשפחות, ולהבנות את הקשרים שביניהם כ"אילן-יחס". מאידך גיסא, כמו ששיבושים משותפים "קושרים" עדי-נוסח, כך גרסאות בלתי-תלויות מצביעות על אי-תלות גניאלוגית ביניהם. יתירה מזאת, זיהוי תהליך השיבוש עשוי ללמד על הטקסט המקורי, גם אם לא השתמר בשום עד-נוסח שלפנינו.
מדעי הרוח אינם משופעים בכלים טכניים אובייקטיביים לטיפול בחומרים שבהם הם עוסקים2. למרות ההישגים וההתקדמות המתמשכת בכל ענפי מדעי הרוח, עדיין שמור בהם מעמד מכריע לגישתו האישית של החוקר, לידע ולניסיון שלו, בבואו לקבוע מה היא התיאוריה המקובלת עליו, מה המתודות לבדיקה ולביקורת שישתמש בהן, ואפילו מה הן העובדות הרלבנטיות שיכללו בדיון.
ביקורת הטקסט הקלאסית של טקסטים ספרותיים, התנהלה עד עתה בשיטות מובנות (ב' שוואית) למקוטעין3. הן הניתוח התיאורטי והן הניסיון, העלו קשיים מרובים ביישום המתודה, אך לא זה הוא נושא המאמר. לענייננו מספיק לציין את הקשיים העיקריים בזיהוי "שלשלת העתקה" על סמך השיבושים: מקריות יצירת השיבושים, הטמעה (conflation, contamination) בין נוסחים שונים ותופעת תיקון-מלומד.
בדור האחרון, ובמיוחד עם חדירת השימוש במחשבים גם לתחומים שמחוץ למדעים המדויקים, הוצעו שיטות שונות לעיבוד ממוכן של נתונים טקסטואליים4. אתגר בלתי קונבנציונלי שכזה, דורש עבודת הכנה רבה, הן תיאורטית והן מעשית. ברור, שכל מתודה מתמטית או סטטיסטית-הסתברותית וכל אלגוריתם, מניחים הנחות מסוימות על "העולם" ומערכות היחסים בין ה"אירועים" שבו. גם הפילולוגיה ההיסטורית מניחה הנחות-עבודה מסוימות. שימוש מושכל בכלים החדשים, צריך לציין במפורש מה הן ההנחות של שני השותפים, וצריך לבדוק את מידת ההתאמה בין המערכות.
לאחרונה נעשו ניסיונות מעניינים של שימוש בשיטות פילוגנטיות5, שמקורן במדעי החיים לניתוח טקסטים עתיקים6. פרוייקטים אלה, שהתחילו כגישושי-סרק בשיטת "נסה וטעה", מציבים כעת אתגר של פיתוח תיאוריה, מתודולוגיה ומתודות לפאראדיגמה חדשה בפילולוגיה ההיסטורית. עד כה, החוקרים לא עסקו (כמעט) במשימה זו, ועלינו לפתוח ב"חריש ראשון"7.
דומני, שאחת הדרישות המוקדמות ביותר היא כימות העובדות הנחקרות. אלא שעוד קודם לכן מן הראוי לסקור - ולו בראשי פרקים - מקצת מן הרקע, שיבהיר באלו נתונים עסקינן8. במאמר זה ברצוני להציג תיאור טיפולוגי (מצומצם) של סיבות לשיבושים, לנמק את הצורך בשיקלול התופעות ולעצב מודל נורמטיבי אחיד של חילופי גרסה ושיבושים. ה"סולם" המוצע לבסוף, אמור לסייע בהגדרה כמותית של מובהקות הקשרים בין הגרסאות. הגדרה כזו היא תנאי להערכה יחסית כוללת של הגרסאות, ובעיקבותיה גם להקבצה מתוכנתת של עדי-הנוסח.

2. סוגי שיבושים וסיבותיהם
מעתיקי ספרים משתבשים בדרכים שונות. הם מבצעים לא רק חילופים גראפיים ופונטיים, אלא גם מעתקים סמאנטיים, אפילו עד כדי שיכתוב הטקסט9. עירוב תופעות כאלו גורם קשיים רבים באבחנה המחקרית בין "מסורת נוסח" לבין "גרסאות מסירה"10. זיהוי "שיבוש" הוא הכרעה פרשנית בעיקרה. ברם, לעיתים קרובות, מעורבת בה גם עמדה לגבי שאלות נוספות, כגון סוג השיבוש האפשרי ותהליך היווצרותו. הגדרת שיבושים למקורותיהם ולצורותיהם השונות וסקירתם השיטתית, יכולה לסייע בזיהוי גרסאות בעייתיות כשיבושים. בנוסף, יש בה לתת כלי-עזר להעלאת אופציות של גרסאות היפותטיות, ולהציע ארועים שיכולים להסביר נתונים טקסטואליים מוקשים. ניתוח הסיבות לשיבושים, עשוי לעזור גם בהבנת הקשר בין גרסאות, ובשיחזור הגרסה שקדמה לשיבוש. למשל, קיום גרסאות דומות-שאינן-זהות בעדי-נוסח שונים, עשוי לרמז על ניסיונות לתקן גרסה קשה, שהיתה לפני כל אחד מן המעתיקים. חוץ מן התועלת בניתוח בעיות קונקרטיות, עשוי הסיווג לסייע לעיתים בהגדרת "פרופיל שיבושי המעתיק", שגם הוא כלי אפשרי להליך השיחזור (בדרך השלילה, כמובן11). ולבסוף, ניתוח טיב השיבושים ומקורם, הוא אמצעי חשוב במיון עדי-הנוסח, בשיבוצם כמשפחות באילן-היחס, ובזיהוי כיוון ההשפעה בין טיפוסי-נוסח.
ניתוח השיבושים ומקורם איננו (בעיקר) בעיה לוגית, אלא אנושית- התנהגותית. "שיבושים אינם קורים אלא נגרמים", ולכן יש צורך לבדוק כיצד הם נגרמים, ומה משמעותם במקום שהם מופיעים. מעתיק ספר עלול לטעות בגלל גורמים רבים, מהם התלויים באישיותו ומהם חיצוניים לה. השפעת אישיותו של המעתיק באה לידי ביטוי לעיתים קרובות בשיבושים קטנים, שלא תמיד ניתן בקלות לזהות אותם ככאלה.
טיפולוגיה של שיבושים יכולה להערך על בסיס קריטריונים שונים. מהם כמותיים (שיבוש באות, מילה או משפט), מהם איכותיים (שיבוש שאינו משנה משמעות לעומת שיבוש משנה משמעות ושיבוש חסר משמעות), תוספות (הכפלה והחדרת גלוסות) לעומת השמטות, שיבושי כתיבה כנגד שיבושי דיבור ושמיעה, ואחרים. כצפוי, השיבושים יכולים להיות מסוגים שונים ויכולים לנבוע מסיבות שונות. מכל מקום, חשוב להבחין בין השיבושים כשלעצמם, לבין סיבותיהם. למען האמת, גם הסיווג וגם הסיבות אינם אקסקלוסיביים. לא תמיד ניתן לשייך בוודאות סיבה מסוימת לשיבוש מסוים. לעיתים קרובות, יתכן ששיבוש אחד יכול לנבוע מאחת מבין כמה סיבות שונות, או מצירוף של כמה סיבות. גם ההיפוך אפשרי: סיבה מסוימת אחת, עלולה לגרום לשיבושים מסוגים שונים. הוא הדין גם בסיווג. מטעמים דידאקטיים נוח להציג את הסיבות לשיבושים ביחד עם סוגיהם, ודעת לנבון נקל. האבחנה החשובה ביותר היא, לדעתי, שאלת המודעות של המעתיק לשינוי הטקסט. שינוי הגרסה יכול שייעשה ביודעין (למשל, מתוך רצון לתקן שגיאה שעשה המחבר, או להבדיל, מתוך כוונת זיוף) או כטעות בבלי משים, של אדם שמתכוון להעתיק את טופס החיבור כמות שהוא לפניו, ולא עלתה בידו. ישנן בעיות טקסטואליות שמקבלות משמעות שונה לחלוטין אם מעמידים אותן על בסיס של שיבוש טכני, או על בסיס של שינוי מגמתי.
מחקר מקיף על העתקת ספרים בכלל ושיבושים בפרט, חייב לקחת בחשבון את הרקע התרבותי וההיסטורי הרחב של הנפשות הפועלות12. ברשימה הבאה נמנים כמה סוגים שיסודם באישיות הכותב והרגליו, ואחד חיצוני-טכני. הרשימה איננה ממצה את הנושא, אך מספקת מיפוי ראשוני למרחב הדיון13.

א. תפיסה חושית לקוייה
אחת התופעות הבולטות ביותר בהעתקה, היא דילוג על קטע המתחיל במילים זהות לאלו של הקטע הבא (homeoteleuton), או מסתיים במילות הקטע הקודם (homeoarcton) - ושתיהן "דילוג בין הדומות". דילוג כזה יכול שיהיה אופקי - בתוך השורה, או מטור לטור, או שיתרחש בצורה אנכית - בין שורות סמוכות (לא תמיד רצופות!). נדיר מאד, אך אפשרי, דילוג "הדומות" במירווח של דף שלם או יותר. יש גם - לעיתים יותר נדירות - שהמעתיק כופל קטע בגלל מילה או מילים שחוזרות בקטע הבא. ככל שהקטע קצר יותר וככל שמספר המילים הזהות רב יותר, כן גדל הסיכוי לטעויות כאלו. הנסיון מלמד, שתופעת "דילוג בין הדומות" עלולה להתרחש אפילו ממילה יחידה לחברתה הדומה לה, ואילו "הכפלה עקב הדומות" (שהיא יותר נדירה) מתרחשת דווקא כשיש רצף של כמה מילים דומות. תופעה נפוצה אחרת היא השמטה של יחידת טקסט (אות, מילה, או קבוצת מילים) כפולה מן הרצף (haplography). כלומר, כתיבתן פעם אחת במקום פעמיים, כנדרש. קיימת גם תופעה הפוכה - של הכפלת יחידות טקסט (ditography). כפי הנראה, הסיבה המשותפת לשגיאות מסוגים אלה, היא התנועה הרוטינית של העיניים מטופס האב אל גליון הכתיבה ובחזרה. סירוגיות זו, עלולה לשבור את הרצף התפיסתי הנדרש מהמעתיק. במיוחד ניתן לצפות לשגיאות כאלו, אם וכאשר המעתיק מעיד (בקולופון) על כושר ראייה לקוי, על עייפותו, או על מהירות כפויה בהעתקה. סוגים אחדים של שיבושים אפשר לחלק לפי אופני התפיסה: קריאה ושמיעה. למשל, טעות בקריאת המקור. זו עלולה לקרות בגלל מצע (נייר או קלף) באיכות גרועה, או בגלל כתב לא ברור בטופס המקור. במקור הכתוב ללא רווחים תיקניים בין מילה למילה, הקורא במהירות יוצר לעצמו תבניות מילים חדשות: שילוב תנועה סופית עם התנועה הראשונה במילה שאחריה (syneresis), וכן היתוך מילים והברות, עם חברותיהן הצמודות להן מלפנים או מאחור (metanalysis). בדומה, יתכן גם פיצול מילה ארוכה לשתי מילים נפרדות, וקומבינאציות שונות בין התופעות. ברור, שכתיבה רשלנית עשויה להשתלב עם חוסר הבנה של הקורא ולהוליד יצורי-כלאיים מוזרים14.

כמו טעות קריאה, גם טעות שמיעה15 יכולה לגרום השמטת הגאים, היתוך או פיצול16. אותיות נחות (בלתי מבוטאות) מועדות ביותר להשמטה.

התופעה של גרירה או נטיה לשינוי מורפולוגי, בהשפעת מילים שכנות17, מתחזקת לעיתים על ידי צליל משותף בשתי מילים קרובות, אשר גורר השלכת הצליל הבא שבמילה הראשונה אל השניה18, או להיפך. מאותה סיבה, נמצא לפעמים שימוש מוטעה במילה אחת במקום בחברתה, בגלל דמיונן בצליל או בכתיב (heterophemy), והן מוחלפות זו בזו.

ככלל, יש סיכוי מוגבר להחלפה בין מילים בעלות כתיב או צילצול דומה, אם הן גם דומות במשמעותן או לפחות מאותו מרחב סמאנטי19.

ב. בעיות זיכרון, ריכוז ותת-מודע
נקודת-כשל קלאסית של מעתיקים, היא המעבר לקונטרס חדש, לדף חדש, לעמודה חדשה, ואפילו משורה לשורה ("מעבר" - בין בטופס-האב, בין בטופס-הבן). תהליך זה דורש "התארגנות" מיוחדת20 ומוציא את המעתיק מריכוזו. תופעה נוספת מעין זו, היא השמטת קטע מן הרצף (או חזרה על קטע) עקב הפסקת-מנוחה שערך המעתיק, ולא איתר כראוי את נקודת העצירה21.

חוסר ריכוז (אך לעיתים גם בעיית השכלה וידע) עלול לגרור טעויות כגון העתקת-חסר של אחת מתוך שתי אותיות דומות בחיתוכן22 או החלפת רכיבים בתוך ניב ידוע23.

מקרה נדיר, אבל מרתק בייחודו, הוא אשגרה של תלמיד חכם, תוך כדי העתקה24. אפשר שקרה בשעת חולשה, עייפות רבה או זיקנה.

ב"בעיות שמקורן בתת-מודע", אני מתכוון בעיקר לחוסר קואורדינציה בין המוח והיד הכותבת. בדומה לפליטת פה, תופעות אלו קשורות למערך העיצבי והפסיכולוגי. מצבים ותופעות אלו עלולים לגרום לשגיאות מסוגים שונים:

- שיכול (spoonerism) - החלפת הגאים, צלילים או הברות בתוך מילה, או בין מילים סמוכות25.

- השמטת מילים - או החלפת סידרן - בתוך "יחידת הכתיבה" שנשמרת בזיכרון המעתיק, בשעת המעבר מן הקריאה אל הכתיבה.

דומה להן, אולי, גם התופעה של השמטת מיליות קצרות, ללא סיבה ניכרת לעין (לעיתים אפילו של מילות מפתח כמו: לא, אין וכדומה, שמשנות לחלוטין את המשמעות!).

- טישטוש ההבדל המורפולוגי במין או במיספר, או יחוסו לרכיב אחר שבמשפט (במיוחד נפוץ באזורים שבהם לא עסקו בלימוד דקדוק).

- חילופי מילים מאותו מרחב סמאנטי ("אשגרה מעלמא")26

- הוספת מילים או שינוי מילים בגלל קשר אסוציאטיבי שנוצר אצל הכותב27, כשנתקל במילה המהווה חלק מניב ידוע28, או לביטוי מיוחד29. לפעמים, אפשר שזו פשוט חזרה על מילה או ביטוי שהופיעו בטקסט כמה שורות למעלה, ונשארו בזיכרון המעתיק. אם ביטוי זה נפוץ בטקסט, הוא יכול "להתקע" בזיכרון ואז המעתיק חוזר עליו עוד ועוד, אם צריך או לא צריך. לפעמים הדליק את הדמיון ביטוי מוכר מן המקרא30 או מן הספרות התלמודית31, שקשור למילים32 או לענין33. יש שרתיעה נפשית ממושגים שליליים עלולה לגרום לשינויים בהם34 או לדילוג עליהם35.

קורה אפילו, שאשגרה אסוציאטיבית נסמכת על השתבשות של המעתיק (בקריאה או בהבנה)36, בנקודה זו37 או בקטע הקודם38.

- תיקון-יתר שאינו אלא שיבוש ותצורה בלתי תיקניתhyper-correction39.

בקטגוריית התת-מודע, אפשר אולי להכניס גם שיבושים אופייניים למעתיק מסוים, כאשר לא ניתן למצוא להם הסבר פשוט יותר40.

ג. השפעת תהליכים פסיכו-לינגויסטיים כלליים
בנוסף לתופעות הייחודיות להעתקה, יש ששיבושי טקסטים כתובים משקפים תופעות ותהליכים מקבילים לאלו המתרחשים בהתפתחות הלשון כשלעצמה. הכותב - כמו הדובר - נתון להשפעת תהליכים פסיכו-לינגויסטיים שונים, והדבר מתבטא בכתיבתו. בדרך כלל, שפת הדיבור יותר גמישה ונתונה לשינויים. לעיתים מזומנות, נאלץ המעתיק להתמודד עם לשון ארכאית שאינה מוכרת לו או מקובלת עליו (אפילו אם הוא תלמיד חכם). חדירת השינויים לשפה הכתובה היא תהליך מעניין כשלעצמו. למרות שכעת ענייננו בחדירת "שיבושים" דווקא, נראה שלעיתים אין כאן אלא הבדל של זמן ושל דרגה. רצוני לומר, ששיבושי תקופה אחת, עשויים להפוך בתקופה אחרת לשפת-דיבור תיקנית, ולבסוף גם לשפת-כתיבה תיקנית. השינויים בלשון הכתובה דומים בעיקרם לשינויים בלשון המדוברת (אם כי באחרונה חזקה יותר הנטייה לבידול ובראשונה לאנאלוגיה)41.

מעתיקי ספרים קוראים את הטקסט שלפניהם (אפילו בקריאה שתוקה), ועלולים לשכתב אותו בעיקר באחד או יותר מן התהליכים הבאים:

- הידמות (assimilation) צלילים שונים שמבוצעים בסמיכות זה לזה, מקבלים תכונות משותפות42, לעיתים עד כדי הזדהות מלאה43. ההידמות עלולה להיות הדדית, פרוגרסיבית, רגרסיבית, או מרוחקת.
- ביטול קוליות של עיצור חסר הגה עלולה לגרום להשמטתו גם מן הכתב44.
- הפחתת הגה(elision) 45.
- חיסור סמנטי (ellipsis) - כאשר המשמעות עוברת מן הצירוף השלם לאחד ממרכיביו, גם הכתיבה נוטה להתקצר46.
- חילוף במילה השווה במשמעותה לחברתה, והיא גזורה מאותו שורש או משורשים קרובים, אך שונה קמעה בצורתה (polymorphy) 47.
- צימוד מסולף (zougma) - מילה האמורה לשרת שני רכיבים, אך מותאמת כהלכה רק לאחד מהם.
- שינוי צורה דיקדוקית של מילה, בהשפעת צורה "דומה" סמוכה48.
- בידול (dissimilation) - שינוי הגה והפיכתו לדומה פחות להגה הסמוך לו.
- צורות בלתי תקניות בשפה, בהשפעת שימוש יום-יומי בשפה זרה49.
ועוד.

ד. הבנה לקוייה
מעתיק ספרים אופייני (יהודי, בימה"ב המאוחרים, באירופה), שייך לשיכבת האינטליגנציה הבינונית-נמוכה. את ההבנה (או חוסר ההבנה) שלו, ניתן לחלק לכמה מישורים: הבנת הנושא של החיבור, ידע בשפת החיבור, אך גם מיומנות טכנית בקריאת צורות כתב מיוחדות (במיוחד באותיות שכתיבתן דומה, כתב רהוט קיצוני, אותיות משולבות או משובצות וכד'). כאשר המעתיק איננו מבין את תוכן החיבור או לשונו, העתקתו רצופה בשיבושים רבים50.

במקרים קיצוניים של חוסר הבנה בסיסי, או חוסר תשומת-לב, המעתיק עלול שלא לחוש בחסרונם של דף או יותר בטופס המקור, ולהמשיך ברצף הכתיבה הלאה, חוסר הבנה נקודתי עלול לגרום לתקלות מצורות אחדות. למשל, מילים בודדות עלולות להיות בלתי מובנות למעתיק משום היותן נדירות (במיוחד מילים לועזיות)51, או משום היותן צורות ארכאיות או מחודשות ע"י המחבר52. ישנן פעמים שהמעתיק מחליף או משנה שם נדיר בשם אחר, דומה לו, אך נפוץ יותר. מאד נפוץ שיבוש במיספרים, בגלל הנוהג לייצג אותם באותיות (גימטריה), וכן פיענוח שגוי של ראשי-תיבות, או תפיסתן כמילה בפני עצמה (תוך ביטול הסימון הגראפי המייחד).

גם מנהגי-סופרים מסויימים עלולים להיות בלתי מוכרים למעתיק בלתי מיומן. ישנם סופרים שמשלימים את קצה השורה באותיות הפותחות את המילה הבאה, עם או בלי חזרה עליהן בתחילת השורה הבאה. נוהג זה עלול להטעות את המעתיק, אשר חושב שלפניו מילה בפני עצמה. וכן קורה גם שהמעתיק משלב מילות-קשר ("שומר דף" ו"שומר קונטרס") של הטופס שלפניו, אל רצף הטקסט. שיבוש מצוי בהעתקת פירושים הוא אי-הבחנה בין "דיבור המתחיל" של המקור ומילות הפירוש של הפרשן.

ה. שיבושים מכניים וטכניים
שיבושים רבים יש לזקוף לחובת סיבות טכניות גרידא. תופעה ידועה היא בלייתם המוגברת של הדפים החיצוניים (הראשונים והאחרונים) בספרים. לא אחת מעיר המעתיק: "עד כאן מצאתי". ומכל מקום, כל צאצאיו של אותו טופס יהיו קטועים. כאשר דף פנימי מטושטש או קרוע, עלול המעתיק להמשיך משני עברי הקטע כאילו היה רציף. קורה לעיתים שמעתיק טופס-הבן משאיר רווח מתאים להשלמה, ורק מעתיק טופס-הנכד מצמצמו כטקסט רציף. לפעמים חסר דף באמצע טופס-האב, והמעתיק שלא הרגיש בכך, ממשיך את רצף ההעתקה. תופעה כזו אפשר להסביר גם בכך שהמעתיק דילג על דף קיים, אך ההסבר הראשון מוכח, אם וכאשר הקטע החסר מועתק בטופס-הבן במקום אחר. במצב כזה, ברור שלפנינו ארוע של "דף שנתלש וחזר שלא למקומו". ואריאציה יותר מורכבת היא קבוצת קטעים בסדר משובש. אם ניתן להראות שהקטעים הם בעלי גודל אחיד פחות או יותר (כלומר, כל אחד "אוכל" דף) אפשר לשער שמקורם במיספר דפים שנתלשו ורוכזו ביחד, אך לא לפי הסדר הנכון53. אין צורך לציין שלא רק דף בודד עלול לנדוד ממקומו. יש גם שקונטרס שלם נמצא במקום זר54.

תופעה דומה, אך שונה במקצת, אפשר למצוא כאשר קטע טקסט נמצא שלא במקומו, אבל אותו קטע נמצא גם במקומו הנכון. במקרה זה, יתכן שדף בודד הוכנס לטופס-האב מתוך עותק אחר של החיבור, ושולב גם הוא בהעתקת טופס-הבן.

עוד תקלה שמקורה טכני (אמנם נדירה ביותר), נוצרת למשל עקב קרע במצע הכתיבה (של טופס-האב). הכותב עשוי לכתוב בשני צידי הקרע בכדי לנצל את מירב השטח. ואילו המעתיק עלול שלא להבחין בדבר, ולהעתיק לפי סדר השורות במקום סדר הטורים55.

במקרים רבים, נמצא שהשיבושים הטכניים "שקופים", אפשר לזהותם מיידית ואף להגיע בבטחון יחסי אל הגרסה המקורית שלהם.

3. ספירת גרסאות שוות ושיבושים כבסיס לקישור עדי-נוסח
אם יש בידינו נוסח טקסט בסיסי, ניתן להשוות את גרסאותיו לגרסאות כל אחד משאר עדי-הנוסח. חיבור שהגיע לידינו בכמה טיפוסי-טקסט, מעיד על תוספים ושינויי גרסאות56 שחדרו לתוכו כבר בשלביו הקדומים57. שינויים נוספים, יתכן שחדרו יותר מאוחר לאחדים מן העותקים. אם גם הם הועתקו לטפסים הבאים, נוצרות משפחות ותת-משפחות של מסורות הנוסח. במידה וניתן להגדיר את כיוון ההשפעה ביניהן, ניתן לעצב את הקשרים ההדדיים כתבנית "אילן-יחס".

הדרך לעמוד על קשר (תלות) בין עדי-נוסח, היא באמצעות קטעי טקסט אשר משותפים לשניים או יותר עדים, ושונים בגירסתם מעדים אחרים. בין אם הם שיבושים וודאיים, ובין אם אופיינו בזהירות כ"גרסה מקשרת" בלבד. הנחת עבודה בסיסית היא, שתיזמון של גרסאות משותפות בדרך כלל איננו אקראי גרידא. גרסאות משותפות - ועוד יותר שיבושים משותפים - עשוים לאפיין עדים אחדים כמשפחה או כטיפוס של טקסט. הגרסה המשותפת מצביעה על קשר-העתקה כלשהו ביניהם. הדיון בגרסה הבודדת נערך כמובן במושגי הפילולוגיה הקלאסית ובשיטותיה. אבל, בשעה שאנו עוברים להערכה כוללת של כל הפיסקאות בטופס מסוים, מול כל הפיסקאות שבטופס אחר, השיקולים העיקריים הופכים להיות שיקולים כמותיים-סטאטיסטיים.

כאשר קובעים מהו היחס בין שתי גרסאות (למשל שאחת משתלשלת מן השניה), ורוצים להכליל קביעה זו על שני עדי-הנוסח, אין מנוס מן החובה לבדוק עד כמה הנתון הספציפי הזה מייצג את המערכת כולה, ומה משקלו היחסי, מול נתונים אחרים שאולי מציגים יחס אחר ביניהם (כיוון השתשלות הפוך, או אב משותף לשניהם).

השלב המבוקש הבא הוא, אם כן, מציאת דרך לפרוט את העיקרון לאמצעים כמותיים, אשר יאפשרו הערכה יחסית של קשרים ספציפיים בין הגרסאות, לצורך עיצוב הקבצה כוללת של הקשר בין עדי-הנוסח.

המתודות הקלאסיות של המקצוע, לא טיפלו בשיטת ה"מעבר" מאיסוף הבדלי הגרסאות אל הקבצת עדי-הנוסח ועיצובם כאילן-יחס. המתודות הממוכנות לעומתן, תובעות הגדרה ברורה (קרי: כמותית) של הקריטריונים להקבצה ולקישור תורשתי.

הדרך המקובלת לקישור ולהקבצת עדים, היא על פי כמות הגרסאות והשיבושים המשותפים שלהם. זאת, כאשר הציון לכל גרסה הוא בינארי (שווה/שונה). עד כה, מי שרצה לעשות עבודה שיטתית, היה נאלץ לערוך השוואה טוטאלית של כל הבדלי הטקסט בין כל העדים. בחיבורים ארוכים ו/או מרובי עדים, זוהי ממש משימה בלתי אפשרית58 (השוואה פרטנית בכל lema, אמנם נערכת במהדורות מדעיות, אך כאן מדובר בהשוואה מסכמת ומשלבת). רוב החוקרים מסתפקים בהתייחסות למיספר מצומצם של הבדלים משמעותיים (לדעתם), ומהם הם מסיקים את מסקנותיהם באשר לקשר הגניאלוגי בין העדים59. חשוב לציין, שכל ההקבצות והקישורים שנערכו עד כה - הן האינטואיטיביים והן הממוכנים - התבססו על ספירת שיבושים משותפים כאמת מידה יחידה למדידת ההבדל (או הדמיון) בין עדי-הנוסח60. כלומר, "שקילת" העדויות התבטאה רק בהשוואה ישירה של מיספר השיבושים שנמצאו בזוגות עדים (לפעמים גם שלשות או רביעיות). תיאורטיקנים מודרניים שילבו חישובים מורכבים לשיקלול יחסי של המיספרים שנמצאו61. כמו כן נמצא מי שהתחשב במיספר הוואריאנטים שאינם דומים62, שהרי ככל שהגרסה נדירה יותר, גוברת הוודאות שקיים קשר הדוק בין העדים השותפים בה. לאחרונה, יש שעשו שימוש באלגוריתמים טבלאיים להערכת המרחק (המתמטי) בין הנשאים63. כאמור, בכל המחקרים הנ"ל, הנתון הבסיסי הנכנס לתחשיב הוא מיספר השיבושים. אך יש לזכור, שלא פחות מתיחכומו של האלגוריתם המופעל (שספק אם ניתן לתת לו הצדקה תיאורטית), מה שקובע את איכות התוצאה, הוא טיב הנתונים וערכם64.

4. "צבת ראשונה" - שקלול חילופי גרסאות כתנאי לעיבוד ממוכן
מן הראוי לחזור ולהציב בבירור את המשימה: עיצוב כל עדי-הנוסח של חיבור במיבנה של אילן-יחס. ניתוח יסודי קשר (בדרגות מסוימות) בין עדי-הנוסח. ואילו השניה מייחסת לקשר זה כיוון. הגיוני לטפל בהן בצורה עוקבת65. ואכן, בשלב זה נתמודד עם המטלה הראשונה בלבד, וגם אותה נבצע בצעדי-ביניים.

הצעד הראשון ייושם כאן על ידי סילום רשימת כל ההבדלים ודירוגם היחסי. הדירוג הבא, מעמיד את כל ההבדלים לסוגיהם השונים על סולם אחד, ומאפשר להגדיר את מקומו של כל פריט (חילוף גרסה) ביחס לאחרים. מטרת הרשימה המוצעת, היא הערכה יחסית ל"מובהקות ההבדל" בין הבדלי גרסאות ושיבושים משותפים מכל המינים. אחרי דירוג הגרסאות בצורה אחידה וכללית, נפתחת הדרך גם לשקילה ושיקלול יחסיים שלהן. מאחר שמקובלת עלינו הטענה שהדימיון בגרסאות הוא הבסיס לקשר בין עדי-הנוסח, ננסה בצעד הבא לכמת את הקשר הזה בדרך פורמאלית - תרגום ערך המובהקות של הגרסאות הספציפיות ל"עוצמת קשר" בין עדי-נוסח. המשקל היחסי של כל הבדל גרסה, הוא ערך כמותי שאפשר להפעיל עליו מאניפולאציות מתמטיות. סיכום של ערכי-הקשר של כל הגרסאות, יתן הערכה כמותית להקבצה כוללת של עדי-נוסח שונים, על בסיס כל הגרסאות הדומות והשונות שבהם. החלוקה לקבוצות ולתת-קבוצות תעלה מתוך שיקלול הערכים שיתקבלו בצעד השני.

ואם לנסח זאת בצורה קונקרטית - כימות השוואת הגרסאות, מהווה אמצעי חשוב להכרעה במצבי התנגשות: עד יחיד שנמצא קשור באופן חזק ("מובהק") לקבוצת עדים אחת, ובאופן חלקי וחלש לקבוצת עדים אחרת, אנו רואים אותו כשייך לקבוצה המובהקת. הקירבה לקבוצה האחרת אינה אלא סימן ל"הטמעת נוסחים". כפי שציינו בפתיחה, מהווה ההטמעה בעיה מתודולוגית חמורה, והרי לפנינו כאן כלי-עזר "לשים אותה בין סוגריים".

בין מהדירי הטקסטים מקובל הכלל lectio deficilior. לאמור: חזקה היא, שדווקא הקריאה "הקשה" - היא המקורית. בדומה לכך, אני מבקש להעמיד כלל: ככל שההבדלים בין גרסאות הם "מובהקים" - לא סביר שהם יתרחשו באופן בלתי תלוי זה בזה. מובהקות ההבדל יכולה להוות קריטריון לעוצמת הקשר בין הגרסאות, ובאמצעותה גם לעוצמת הקשר בין עדיהן. כלומר, הקשר בתוך קבוצת עדים (מול קבוצה אחרת) חזק יותר, ככל שגבוהה יותר מובהקות הגרסאות המשותפות להם, ביחס לגרסאות הקבוצה האחרת. האלגוריתם המפורט המממש כלל זה יעוצב בשלב מאוחר יותר.

גם בעיית הזימון המקרי של שיבושים, מקבלת בדרך זו תשובה חלקית. השיבושים ה"קטנים, פשוטים ונפוצים" מרוכזים בקבוצה הראשונה (ב"תחתית הסולם"), וניתן להעניק להם משקל נחות ביחס לשאר המימצאים.

חשוב לציין: למיטב הבנתי, שיבושים שמקורם ב"תיקון מלומד", אינם ניתנים בדרך כלל לשקילה אפריורית, והערכתם נשארת כאתגר לאינטואיציה של החוקר66. אני מקבל כהנחת-עבודה שהשיבושים ה"בלתי מודעים" הם הכלי העיקרי להקבצת עדי-הנוסח.

ועוד: במציאות הטקסטואלית הנפוצה, "טבעי" ששיבושים טריביאליים (בלתי מובהקים) מרובים יותר משיבושים מנקרי-עיניים. רקע תיאורטי לתופעה והשלכותיה על המתודה יידונו גם הם בעתיד67.

המשך המאמר