נורמה סידרתית להשוואת גרסאות
צעד ראשון לקראת מתודה פילולוגית-פילוגנטית-ממוכנת

אבישי יורב

- המשך -


5.
מודל סודר להשוואת חילופי גרסאות

5.1 דרגות מובהקות
"מובהקות ההבדל" המוצגת להלן, היא הערכה איכותית-יחסית של הבדלים בין גרסאות. ככלל, מדורגת הרשימה בשש קבוצות, זו למעלה מזו.

דרגה (1) חילופים רגילים ו"סבירים" של אותיות בודדות, וכן שינויים במילים שכמעט אינם משפיעים על המשמעות
דרגה (2) חילופי אותיות בלתי רגילים בתוך מילה וגם שינוי מילים שיש בו שינוי משמעות
דרגה (3) ואריאציה לשונית, לגיטימית באופן בלשני-עקרוני, אך בלתי סבירה בהקשר הנתון
דרגה (4) ואריאציה אבסורדית (מבחינה עניינית) הדורשת שיקול דעת כדי לגלותה
דרגה (5) ואריאציה אבסורדית גלויה. מילה בלתי תקנית. משפט חסר מובן בעליל
דרגה (6) ואריאציה אבסורדית בדרגה חמורה ביותר. החלפת העניין כולו במהלך "משפט".

ביסוד המודל מוטבעת הנחת-עבודה שכל מעתיק-ספר מתכוון לדייק בהעתקתו68. המערך המוצע מסדר את המימצא הטקסטואלי (ה"חילופים") על פי קריטריון משולב במישור הלשוני ובמישור הלוגי כאחד. הסבירות ה"ערטילאית" הופכת כך לדרגת מובהקות קונקרטית, גבוהה יותר או נמוכה יותר, מסבירותו של דמיון (קרי: קשר) בין שתי גרסאות אחרות. הרציונאל המנחה את מיבנה המודל, היא ההנחה, שככל שחילוף הגרסאות יוצר אבסורד לשוני חריף יותר, כן יורדת הסבירות ששני מעתיקים הגיעו לאותה גרסה באופן בלתי תלוי, ועולה הסבירות שיש קשר גינאלוגי ביניהם. כלומר, שגרסה אחת הועתקה (או השתלשלה) מחברתה, או שיש להן אב משותף. בכוונה תחילה לא נעשית כאן אבחנה מהי הסיבה להופעת ה"אבסורד" או האופן שבו הוא נוצר.

חשוב להדגיש, שבשתי הדרגות הראשונות של המודל, הקריטריון איננו: עד כמה ברור לנו שיש כאן שיבוש דווקא. למרות שבמקרים רבים יש זהות בין הקריטריונים, בשלב זה של המתודה אין הכרעה בשאלה זו. לכאורה, יש בכך נסיגה ועימעום ההבחנה בין "הבדלי גרסאות" ו"שיבושים". הדבר נעשה בכוונת מכוון. הנסיון מלמד, שרוב חילופי הגרסאות אכן מצויים ב"אזור הדימדומים" שיש בו לגיטימיות (לעיתים רק בדוחק) לשתי וואריאציות או יותר. רק לעיתים נדירות יחסית ניתן לקבוע ללא צל של ספק, שגרסה כלשהי היא שיבוש של גרסה אחרת. עיקר הפרובלמטיקה של ביקורת הנוסח מתמקדת בגרסאות חלופיות שהיחס ביניהן בלתי ברור, לפחות על-פניו. הצבעה על אחת כ"מקורית" ועל חברתה כ"משובשת", טומנת בחובה הכרעה בדבר כיוון ההשתלשלות. כנזכר למעלה, הכרעה זו אמורה להיות מסקנה העולה מן הניתוח הראשוני (ההקבצה), וחייבת להדחות לשלב מאוחר יותר של העיבוד. אי לכך, סולם המובהקות קודם, מתודית, להכרעה מי היא הגרסה הנכונה-המקורית ומי היא המשובשת. מטרת הסולם איננה לזהות אותנטיות של טקסט, אלא להגדיר את מידת הקפדנות היחסית בעבודתם של מעתיקים69.

מבקר חריף עשוי להעמידנו על סתירה בולטת בלוגיקה הפנימית של מיבנה המערכת. כיצד אפשר לטעון שאין הכרעה מהו שיבוש, אם הסולם מודד שיבושים?

ואכן, הטענה דורשת סיוג. הסולם הוא כלי-עזר למבקר-הנוסח "למדוד" לגיטימיות של גרסה מול גרסאות אלטרנטיביות (קונקרטיות או היפותטיות). פעולה זו כפופה כמובן למשפט השכל הישר. כך שלמעשה, מחציתו הראשונה של ה"סולם" (כלומר 3 הדרגות הראשונות), מוצגת מתוך עמדה ניטראלית פחות או יותר. במחצית השניה אנו עוסקים בהבדלים יותר ויותר חריפים, שהלגיטימיות הלוגית והלשונית שלהם הולכת ופוחתת, בהתאמה. גם פילולוג זהיר "פר-אקסלאנס" אינו יכול להתעלם ממימצאים משובשים בעליל.

לבסוף, עוד הערה אחת. ברור, שיש מידה לא קטנה של שרירותיות בסילום התופעות הטקסטואליות. זו תוצאה בלתי נמנעת, בעת המרת "פונקציה רציפה" ל"פונקציית מדרגות".


5.2 סולם אחיד לחילופי גרסה ושיבושים
סולם חילופי הגרסה והשיבושים בנוי בשלבים מדורגים מן הקל אל החמור. הרשימה בנויה כרצף מסודר של אוסף של תופעות טקסטואליות, מסוגים שונים ומסיבות שונות, ממויין על פי קריטריון אחיד. קריטריון זה הוא האי-גיון (nonsense). רצוני לומר, מידת אי-ההיתכנות של מיבנה לשוני מכל בחינה שהיא (פונטית, מורפולוגית, תחבירית או סמאנטית). הבסיס לדירוג היא השאלה: עד כמה סביר/לא סביר ששני מעתיקים "רגילים" יכתבו בצורה מסוימת באופן מקרי, למרות שאיננה כך בטופס שלפניהם. נעשה מאמץ לסדר את הפריטים בתוך כל "דרגה". סדר הסולם הוא מן האפשרי כמעט ללא הסתייגות, אל האבסורד הטקסטואלי המוחלט. מיבנה הסולם מסתמך על רשימת דרגות המובהקות שהובאה בסעיף הקודם, אבל איננו פועל-יוצא ישיר ממנה. מיקומם של הפריטים נקבע לפי שיקול ענייני, מיוחד לגופו של כל פריט.

תיאור הפריטים ברשימה נעשה במישורים שונים ומנקודות מבט שונות: טכניקת הכתיבה, הרגלי מעתיקים, מאפייני השפה, מאפיינים תחביריים ועוד. למרות הבסיס ה"שרירותי" של הרשימה, נעשה מאמץ לעצב אותה בצורה סבירה ועקבית ככל האפשר. "סולם אחיד" לתופעות לשוניות, גראפיות, קודיקולוגיות ופסיכולוגיות, הוא הצעת שיטת-עבודה יוצאת-דופן, ודורשת הצדקה תיאורטית. העימות מול אתגר זה יערך בשלב אחר.

הסולם הבא והפריטים הנכללים בו, עוצבו על פי בדיקה והשוואת כתובי-יד מסיפרות ההלכה הרבנית בימה"ב. אי לכך, ערכם המחקרי תקף אך ורק לגבי המיסגרת התרבותית-היסטורית שמתוכה ועל גבה הם נבנו70. כידוע, בעניין זה יש הבדלים מכריעים בין כתיבה יומ-יומית וכתיבה סיפרותית וכן בין פרוזה ושירה. סביר להניח, שמקטעים אחדים ממנו (ומן המתודה בכללה) ניתן להעתיק או להתאים לסוגות אחרות ולתנאים היסטוריים ותרבותיים אחרים. מכל מקום, העושה זאת, פועל על אחריותו בלבד.

(1) חסור/ייתור/חילוף באימות הקריאה ובאותיות השימוש
שימוש בקיצורים, ראשי תיבות ואותיות במקום מיספרים.
השלמה שונה (אך סבירה) של קיצור מילה, או פיענוח ראשי תיבות.
חילופי זכר-נקבה, יחיד ורבים.
חילוף אותיות דומות בצורתן (למשל בכתב מרובע: ב-כ, ה-ח, ו-ז, י-ו-ן, ם-ס, ף-ץ).
חילוף אותיות דומות בהגייתן (למנ"ר, א-ע,כ-ק,ט-ת באשכנז, ג-ק,ז-ס-צ-ש בספרד).
חילופי כתיב שאינם משנים משמעות (חרש-חרס).
חילוף אותיות בכל"ם במיליות: בתוך, כמו, אל, מן, כאילו וכדומה.
טעות פשוטה בכתיב (למשל לא-לו, דמים-דמיו, וכן-וכל).

גרירה והלחמה (לפנים או לאחור) של אות, הברה או מילית בין מילים צמודות
(שלשל את > שלשלת).
דילוג על הברה זהה, אחת מתוך שתים (אי אפשר > איפשר).
סיכול מילים צמודות ללא פגיעה בתיקניות המשפט.
החלפת מקום מילה במשפט, ללא שינוי של ממש במשמעותו.
השמטת יחידה בתוך ניב-כפול (אחד אחד, ראשון ראשון).
קיצור או השלמת פסוקים מהתנ"ך או מהתפילה.
קיצור או השלמת ציטטה ממקורות תושב"ע.
אי-דיוק זעיר בציטוט מן המקורות.
דילוג "הדומות" עד 4 מילים.
חילופים כדוגמת: גויים - עובדי כוכבים ומזלות, עבודה זרה - דבר אחר.
שינוי/השמטה של נוסחאות פתיחה וסיום (עמ"י עש"ו, בריך רחמנא דסייען).

(2) חילוף במילים אף-אם-או-אלא, או השמטתן
השמטה או תוספת של מילות קישור (גם, כל, רק וכו').
ייתור או חיסור של אות כפולה במקור (חוצת < חוצצת > חוצצצת).
ייתור או חיסור של הברה כאשר התוצאה לגיטימית (אדמימות-אדמות).
השמטת אות נחה או גרונית בסוף מילה (כסות > כסו, טפיח > טפי).
שינוי אות (או מיקומה) במילה זרה.
שינוי (דילוג, החלפה, סיכול) אות עיצורית, ויצירת מילה תיקנית אחרת (פרוטה-פטורה).
שינוי שמקורו (כנראה) מילוי כתיבה מקוצרת או פתיחת ראשי תיבות.
שינוי מילה מסיבה גראפית (בגדים-כגריס).
קיצור מילה שגם הוא מילה (הוא' - הואיל).
חילוף מילים נרדפות ממקור לשוני זהה (אומד - אומדן, ישראל-ארץ ישראל, ר' שמעון בן לקיש-ריש לקיש).
חילופי מילים נרדפות (קרוב-סמוך, בי"ד-דיינים, דבריהם-דברי סופרים).
החלפת כינויי הקב"ה.
תוספת/השמטה של מילה נרדפת או מסבירה (מתנה - דורון).
תוספת/השמטה של מילה מתבקשת (חכמים [גדולים], חרש ושוטה [וקטן]).
שינוי קטן במילה מסיבה אסוציאטיבית "סבירה" (חרס הנשאר > חרס הנשבר).

חילוף בין מילים מאותו שדה סמאנטי, עם עוד "הצדקה" (למשל צליל או כתיב) כדוגמת: תפילה-טבילה, כד שמן-נר שמן, שוכר-סוחר (וגם: שפחת-עולם > שמחת-עולם).
שינוי סדר המילים במשפט, ללא שינוי גדול במשמעות.
שינוי מקום מילה במשפט, למרחק של למעלה מ 5 מילים (ועדיין יש מובן למשפט).
שינוי מקום משפט-לוואי בתוך המשפט העיקרי.

הוספה או השמטה של מילה/ביטוי בהיקרות שניה במשפט, להשלמת התבנית
הוספה או השמטה של מילת מפתח בניב כפול (ספק ספקא, קדשי-קדשים).
שירבוב (אשגרה) של מילה שנזכרת במשפט הקודם.
דילוג "הדומות" עד 6 מילים (בתוך שורה?).
דילוג בין "הדומות" שאינן זהות לגמרי (עד 6 מילים).
דילוג אל/מן מילה הסמוכה למילה דומה (עד 6 מילים).

(3) דילוג על אחת משתי מילים זהות רצופות (שאינן ניב)
דילוג על מילה כלשהי במשפט.
דילוג על מילה לועזית או נדירה.
הוספת מילה ("סתמית") זהה.
החסרת פריט מסידרה בלתי ממוספרת (הבוגרת והממאנת והמגורשת והחרשת).
תוספת/השמטה של ניב "בלתי חיוני" (למשל: וכן כל כיוצא בזה).
חילופי ניבים שווי-ערך ענייני.
וואריאציה סיגנונית לביטוי עם שינוי משמעות קל (כל/רוב העולם יודעים).
חילוף מילה או ביטוי נדיר בתדיר.
שירבוב (אשגרה) של ביטוי שנזכר בקטע קודם.
החלפת מילה מאותה סביבה סמאנטית (בית-חצר-שדה, אכילה-מלאכה).
סיכול עיצורים שאינם צמודים בתוך המילה.
שינוי אותיות או הברות, ויצירת מילה חסרת קשר לחלוטין.
שימוש במילה בלתי שייכת לעניין.
שינוי היוצר "מילה" בלתי תיקנית.
שינוי בשני עיצורים במילה אחת
שימוש בניב אשר "משתלב" בהקשר המילולי אך משנה מאד את משמעותו.
חילופי מותר-פטור, אסור-פסול.
השמטת מילה חיונית במשפט (נושא, נשוא, מושא, "לא", "חייב").
השמטת או סיכול מילים בצורה היוצרת משפט בלתי תיקני.
דילוג על השני מבין שני קטעים המתחילים במילים דומות.
דילוג "הדומות" 7-14 מילים (=שורה או שתיים?), מהן 3-5 דומות.
דילוג "הדומות" 7-10 מילים (=שורה?), מהן 1-2 בלבד דומות.
הוספת ביטויים נפוצים (במיוחד מן התפילה ופרקי-אבות).

(4) שינוי מקומו של פריט ברשימה, בהפרש של 2 מקומות לפחות
שינוי סדר המשפטים בתוך סעיף אחד.
הכפלת קטע בן 2-4 מילים.
שינוי של 2-4 מילים שיש בו שינוי משמעות המשפט.
דילוג 3-9 מילים רצופות ללא סיבה נראית.
דילוג "הדומות" 11-14 מילים, מהן 1-2 בלבד דומות.
דילוג "הדומות" כאשר התוצאה היא דמיון רק במיבנה המשפט ובמיקצבו.

(5) חילופי "מותר"-"אסור"
שירבוב מילה בלתי תקנית בעליל (מילונית או תחבירית).
עיוות ב 2-3 מילים רצופות.
הכפלת קטע בן 9-5 מילים, כולל 1-2 "מילות-קשר" בקצות הקטע.
פיסקה של 2-4 מילים שעברה לקטע אחר בהפרש 4 מילים לפחות.
דילוג על קטע בן 10-15 מילים ללא סיבה נראית.
דילוג "הדומות" 15-20 מילים.
שינוי סדר בין שני קטעים ופיסקאות רצופים (היחידות הבסיסיות שבחיבור).

(6) הכפלת קטע בן 10 מילים ומעלה
דילוג "הדומות" 21 מילים ומעלה.
דילוג על יותר מ 15 מילים ללא סיבה נראית.
גרסה אלטרנטיבית שנכנסה לתוך הטקסט.
הערת שוליים חיצונית (בוודאות!) שנכנסה לתוך הטקסט.
רשימה דווקנית זו, דורשת הרבה הסברים, הסתייגויות והתנצלויות. העיקריים שבהם הם:

(א) הרשימה נבנתה על בסיס אמפירי, כלומר על סמך נסיון מסוים בבדיקת כתובי-יד עבריים הלכתיים. נסיון נוסף ובדיקות נוספות עשויים לשנות את הרשימה. אין ספק שניתן לשפר ולעדן אותה על ידי: הוספת פריטים ודוגמאות, פיצול פריטים, הגדרות מדוייקות יותר, שינוי הסדר של פריטים אחדים ועוד. כאמור, סוגות סיפרותיות אחרות (ועל אחת כמה וכמה תרבויות אחרות) זוקקות כיול שונה, ואולי אף כלי שונה.

(ב) גם בחלוקת הדרגות של הסולם יש מקום לתיקונים. למשל, ע"י שינוי מקום החיתוך והמעבר לדרגה חדשה, כמו גם במיספר הדרגות. חלוקה זו עשויה להשתנות מחיבור לחיבור71 וממעתיק למעתיק72. במיוחד יש מקום לשיקול מחודש בהקשר זה, באשר למיקומם היחסי של השיבושים המודעים.

(ג) על פניו, אין חובה לתפוס את הרשימה כסקאלה ליניארית. ריבוי הדוגמאות מאפשר צימצום הפערים הפילולוגיים והגראפיים, אם כי כמובן איננו הופך את הרשימה הכוללת ל"סולם רווחים" תיקני73. אמנם, ככל שנתקרב למטרה זו, כן תגבר ההצדקה התיאורטית לשימוש באלגוריתמים ממוכנים לעיבוד המימצאים.

(ד) שינויי הכתיב74 שניצבים כאן בתחתית הסולם כקריטריון לקשר גניאלוגי, עשויים לקבל חשיבות מרובה בחקר מסורות כתיב ומיבטא, אך בהקשר שלנו מעמדם שולי75. להערכתי, חילופים (ושיוויונות) ברמה זו מציגים יותר מאפיין של המעתיק הספציפי, מאשר את הקשר בינו לבין הטופס שלפניו. ועדיין צריכים אנחנו למודעי, כיצד לזהות את מסורת הנוסח, המשתקפת מבעד ל"מסננת" המעתיק76.

(ה) הסולם מתגלה כחסר תועלת כאשר מופיעים שלוש (או יותר) גרסאות חלופיות לאותה מילה/פיסקה. למרבית המזל, לאור נסיוני, ארוע כזה הוא נדיר, יחסית (%10-15 כקירוב ראשון). אך מכל מקום יהיה צורך לתת את הדעת על כך בשלב עיצוב המתודה.

(ו) מתודולוגית, חשוב להדגיש שוב, שהרשימה מבטאת צורות שונות של הבדלי גרסאות, אך איננה מניחה שאחת מהן היא הנכונה והשניה שיבוש (על פניו, אי-גיון איננו חייב להיות טעות, וסטייה מהנורמלי איננה בהכרח סילוף). הדירוג איננו מבטא את מידת האפשרות שכל אחת מהגרסאות היא המקור או השיבוש, אלא את הסבירות של שינוי "מן הסברה" מגרסה אחת לשכנגדה. תיאורטית, כל ביטוי כדוגמת "דילוג" ניתן להמיר ב"תוספת" מנקודת המבט של הגרסה הנגדית, וכן להפך77. כמובן, שיש גבול ללגיטימיות שהשפה מוכנה להעניק ליצירתיות סמאנטית ולגמישות תחבירית. האיפוק מן ההכרעה: נכון/משובש, הוא דרישה שצריך להענות לה עד קצה גבול הסבירות, אך לא יותר. בנוסף, חשוב להדגיש, שהסולם אינו מייצג את חומרת השיבוש העניינית, אלא את מידת היכולת שלנו להסיק מן ההבדל או השיבוש על קשר גניאלוגי בין עדי הנוסח (ראו למשל את מעמדה ה"נחות" של תוספת/השמטת המילה: לא!).

6. סיום (שאיננו אלא פתיחה)
רשימה סודרת כפי שתוארה כאן, מהווה צעד ראשון להגדרת נורמה כמותית, ולהגדרת עוצמת הקשר בין גרסאות. בשלב מתקדם של המתודה, נצמיד ערכים מיספריים לכל דרגה בסולם, וכך נוכל לבצע תחשיב סטאטיסטי על המימצאים הטקסטואליים. כימות עוצמת הקשר בין הגרסאות, הוא הקדמה חיונית לשקילת הקשר בין עדי הנוסח באמצעות מתודה פילוגנטית מתאימה. יחד עם זאת, יתכן שיש ערך עצמי לסולם גם ללא שימוש במתודה על כל רכיביה. כידוע, הכרעות על יסוד כמותי, הן בסיס לדיון רציונאלי, גם (ולפעמים דווקא) כשאין הסכמה קונקרטית בין המתדיינים. מודל הסולם הוא כלי סביר להערכה, והוא מוצג כאן - על שולחן מלכים - כבסיס למתודה כללית לעיצוב אילן-יחס של עדי-נוסח. פראדיגמות ומתודולוגיות לא ניתן להוכיח "אפילו" במדעי הטבע. בסופו של דבר, הערך של המתודה הזו, ייקבע על סמך הפוריות והתועלת המעשית שאפשר יהיה להפיק ממנה בהמשך תהליך המחקר. בדיקות אימות, תיקוף ורגישות למתודה אציג אי"ה לכשינותחו לעומקם המימצאים שעלו בניסויים78. יישום ממוכן (מצומצם) של המתודה מלמד שיש טעם להמשיך בדרך זו.

על מנת להסיר ספק מראש, אודה שאין לי יומרה להציע מתודה שתחליף את מערכת השיקולים הפילולוגית-היסטורית הקונבנציונלית. אלא לעצב מתודה שתסייע לחוקר בהצגת אפשרויות ובבקרתן. המתודה משאירה את ההכרעות הספציפיות בידי החוקר האנושי, אך מעבדת אותן בהליכים ממוכנים, לצורך הסקת מסקנות כלליות. גם במדעי-הרוח, שילוב מושכל של ידע אנושי עם בינה מלאכותית עשוי לקדם את המחקר לתובנות חדשות.

הערות:1.
אני מעדיף מילה זו בכדי להבחין את משמעות manuscript ממשמעות "כתב-יד" כ handwriting.
2.
יתכן שהארכיאולוגיה יוצאת דופן בעניין זה. כתב העת ARCHAEOMETRY העוסק במדידות פראמטרים מדוייקים וניתוח סטאטיסטי, הגיע כבר לכרך 44.
3.
ספר היסוד בענין זה הוא: 1958 P.Mass, Textual Criticism (B.Flower, tr.) OXFORD
שני לו: W.W.Greg, The Calculus of Variants, OXFORD 1927
סידרת פוסטולאטים מתודיים-דוגמאטיים, ללא תבנית פרוצדוראלית, ראו: A.A.Hill, "Some Postulates for Distributional Study of Texts", in: Studies in Bibliography 3 (1950-1) pp. 63-95.
סיכומים וביקורות למתודות שונות בביקורת הטקסט ראו למשל:
D. C.Greetham (ed.), Schollarly Editing, A Guide to Research. N.Y. 1995 L.Patterson, Negotiating the Past. U. of Wis. 1987
4.
ראו דיווחים בכינוסים השנתיים של Association for Lierary and Linguiatic Computing
ובכתבי העת The Compter in Literary and Linguistic Studies, Literary and Linguistic Computing
5.
פילוגנטיקה היא שם לאוסף מתודות מתמטיות-סטאטיסטיות, שמטרתן לסדר פריטים שונים בקבוצות, ולהציע את כיוון הקשר הגנטי ביניהם, על בסיס תכונות שונות ושוות שיש בהם. מתודות אלו פותחו בעיקר לצורך מחקר גנטי וכרומוזומלי.
6.
A.R.Lee, Analysis of Contamination in Textual Tradition. in: Computers in Literary and Linguistic Research 15 (1988) pp. 261-292.
Idem, Numerical Taxonomy Revisited. in: Studia Patristica 20 (1989).
D. Xhardez, Computer-Assisted Study of a Textual Tradition. In: Research in Humanities Computing (RHC) 2 (1994) pp. 67-88. (בפרוייקט חשוב זה הצליח החוקר לנתח 54 עדים של טקסט בן 12,000 מילים ולהציג קבוצות ("אשכולות") של עדים, תוך מתן הערכה של רמת הקירבה ביניהם).
P. W.Robinson and R.J.O'Hara, Cladistic Analysis of an Old Norse Manuscript Tradition. in: RHC 4 (Oxford 1996) pp.115-135. ראו גם: www.cta.dmu.ac.uk/projects/ctp
Studies in Stemmatology, P.VanReenen & M.VanMulken (ed.), Amsterdam-Philadelphia 1996
במיוחד המאמר שם: B.J.P.Salemans,Cladistics or the Resurrectio of Lachmann pp. 3-70.
M. Spencer and C.J.Howe, Estimating Distances between Manuscripts. in: Library and Linguistic Computing 16:4 (2001) pp. 467-484.
7.
העבודות שנערכו ביוונית ולטינית אינן תורמות הרבה למחקר הפילולוגי-כמותי בעברית, בגלל השוני הבסיסי ביניהן. המחקרים בלשונות הלאומיות האירופיות עוד פחות משמעותיים, בגלל היותן "שפות צומחות" בתקופה הנדונה (ימה"ב המאוחרים). נתוניה הייחודיים של העברית בימה"ב, ועוד יותר - התנאים ההיסטוריים-גיאוגרפיים-פוליטיים של היהודים הם מן הפרמטרים החשובים ביותר לענייננו.
8.
בשלב זה ניתן להבין את כל המושגים הנזכרים במאמר במשמעותם האינטואיטיבית המקובלת. ריכוז הגדרות מדוייקות למושגים הטכניים אני מקווה לספק בהזדמנות אחרת.
9.
מודעא רבא לאורייתא: הדיון הנוכחי מתייחס לשאלות העתקה של חיבורים "חתומים". לא לבעיות של "מהדורות" ולא לתופעת "הספר הפתוח" (כהגדרת י.תא שמע). אכן, האבחנה בין הבעיות קשה, אך לא כאן מקומה.
10.
חכמי ישראל משתמשים במושגים "לשונות סופרים", "מסורות נוסח" ודומיהם, מבלי להגדירם ומבלי להתחייב למשמעות אחת ואחידה. העמדת מתודה שיטתית ומסודרת עשויה לתקן את המצב. אני מבחין בין ה"נוסח" כמצע כללי ו"גירסה" (reading) כתופעה במילה או בפיסקה מסויימת. כמובן שחובה לזכור שלא כל "תופעה מוזרה" היא שיבוש. לעיתים זהו נוהג לשוני או גראפי מוגבל (ומובן שצריך להגדיר את גבולותיו).
11.
למשל, מעתיק שנכשל לעיתים קרובות בשיכול-אותיות, לא יישקל בשעת הכרעה על צורתה המקורית של מילה נדירה.
12.
אפשר שהסקירה הבאה תוסיף תובנה גם לדיון בשאלת דרכי מסירתה של תושבע"פ בתקופות קודמות. חוקרים אחדים ניסו לזהות סוגי שיבושים מסויימים כשיבושי מסירה בע"פ דווקא (ראו למשל, י.ברודי "ספרות הגאונים והטקסט התלמודי", בתוך: מחקרי תלמוד א'. במיוחד עמ' 276-281). הדברים שלהלן, מעמידים בספק קביעה זו ועל כל פנים דורשים דורשים הסתייגות.
13.
תחום ההתעניינות שלי הוא הסיפרות ההלכתית הרבנית (במיוחד משנה תורה לרמב"ם, להלן משנ"ת). האיפיון נעשה מתוך אוריינטציה זו והדוגמאות כאן נבחרו מקורפוס זה. תאור כולל, מפורט וייחודי של נהגי מעתיקי סיפרות ההלכה עדיין לא נכתב.
ראו בינתיים M.Beit-Arie', The Makings of the Medieval Hebrew Book. Magnes, Jerusalem 1993 pp.75-108.
הגדרות ותיאורים מדוייקים לתופעות הלשוניות ולמושגים המקצועיים, אם כי בהקשר שונה, ראו (במפוזר): א.רודריג-שורצולד ומ.סוקולוף מילון למונחי בלשנות ודקדוק, רכס תשנב. ברשימתי שלהלן מניתי רק תופעות רלבנטיות לענייננו.
הדוגמאות רובן נלקח מן המציאות הטקסטואלית. חלקן פיקטיביות, וניתנו לשיבור האוזן בלבד.
14.
השוואה בין שני כתובי-יד מסויימים של משנ"ת העלתה שהכותב של הראשון נוהג לשרבב את ראש האות ל' עד השורה הקודמת. בכמה מקומות חודרת האות אל ר', ה' או כ'. במצבים כאלה, סופר כתוב-היד השני טעה והעתיק את האות ק' במקומן.
15.
למשל החילוף כותל-תל נובע בודאי משיבוש-קריאה בשעה שכותל-קוטב נראה להיות שיבוש-שמיעה.
16.
דוגמא: "ספיקו לחומרא" > "ספק או לחומרא". ועל דרך ההלצה: "אכלתי דג - אך אל תדאג". תודה לבתי רבקה, על הדוגמא האחרונה.
17.
לדוגמא: לויה וישראלית > לויה וישראלה (שיבוש לפנים). "מביא קרבנו[ת] שלש בהמות" (תוספת ת', שיבוש לאחור).
18.
לדוגמא: רצתה ויצאה > רצתה ויצתה. חיילים וקצינים > חיילים וחצינים.
19.
לדוגמא: פגע-פגש, טבילה-תפילה, חצב-חטב-קטף, זבחים-פסחים.
20.
בדיוק לשם כך פותחה הטכניקה של "שומר קונטרס"/"שומר דף", ע"י רישום בתחתית הגליון של המילה הבאה בתור.
21.
יותר נדיר מצב של דילוג עקב חילופי מעתיקים.
22.
לדוגמא: בפתח הבית > פתח הבית.
23.
למשל, עם הארץ - חוץ לארץ.
24.
כהמשך לביטוי "לא נצרכה אלא", הוסיף בטעות: "למקום חתך". ביטוי זה מופיע בשלושה מקומות בתלמוד במסכתות אחרות. ראו: מ.סבתו "בבלי סנהדרין" בתוך: סוגיות בתלמוד עמ' 93-94.
עוד דוגמא ל"עילוי מפוזר" שמחשבתו ממהרת מעטו, והוא כותב ההיפך ממה שרצה לומר, ראו: "תוספות ישנים" מהד' האלפערן, לונדון תשכ"ו, מבוא עמ' XIX.
25.
תופעה ידועה זו אינה מלמדת בהכרח על בורות. ראו לדוגמא כבש-כשב ועוד דבר שזרח מפרחוני.
26.
לדוגמא: חתן תורה > חתן ברכה
27.
"לצלות דג או להדליק [צ"ל להדביק] פת בתנור". "והכלב הכופרי עם השועל <והזאבים> [והצבאים] עם העיזים", כ"י י-ם 694 למשנ"ת הל' כלאים ט,ג.
28.
הוספה: גר [ותושב], חסד [ואמת]. שינוי: הרג נחש > הרג נפש.
29.
דבש בכוורתו > דבש בדבורתו
30.
במיוחד כאשר יש קשר ענייני בנידון. לדוגמא, במשנ"ת הל' פרה אדומה ז,א כתוב בכ"י ששון 1043 (ס' 11404): "עלה עליה עול" [וצריך להיות: עלה עליה זכר]. בהל' תמידין ומוספין ז,כב מוסר כ"י פארמה 528 (ס' 13601):"מצווה למנות הימים עם השבועות שנא' תספרו חמישים ומאת יום". אולי נכתבו הדברים למחרת שבת פרשת נח.
31.
למשל, במשנ"ת הל' שאר אבות ב,ז כתוב בכ"י ירושלים 1193 -4 (ס' 65B) "לא טומאת אוכלין ולא טומאת משקין" וצריך להיות "לא טומאת אוכלין ולא טומאת נבלות".
32.
כך נוצרת למשל החלפת "נטילת ידיים" ב"נטילת לולב".
33.
דוגמא בהחלט מפתיעה לשיבוש "פרוידיאני": במשנ"ת הל' פרה אדומה ד,יז הוסיף כ"י סינסינטי 673 (ס' 22002): "שכנסתו אשה או שעשה מלאכה אחרת בשעת (תשמיש) כניסתו הרי זו (טהורה) כשרה". בין סוגריים תוספות המעתיק. שיבוש מעין זה באותו כ"י ראה בהל' מטמאי מו"מ ה,ו בהל' שאר אבות ג,א בכ"י שטוקהולם 1 (ס' 18561) ישנו סיכול אותיות בביטוי "בית הבליעה". וכן בכ"י מוסאיוף 190 (ס' 23006) הל' שאר אבות ו,ו "המכניס ראשו ורובו בבית עבודה זרה", במקום שתי המילים האחרונות כתב: הסתרים. שרא להו מרייהו.
34.
למשל, כ"י ערפורט לתוספתא דמאי א,יא: "הלוקח מן הספינה ביפו מן הספינה בציפורי..." במקום "בקיסרי".
35.
למשל מעתיק מכילתא דרשב"י שדילג כמה פעמים על המילים: מת, מיתה. ראה מהד' אפשטיין-מלמד עמ' לט.
36.
למשל בהל' מתנות עניים ח,ט הפך "מלך או שר" ל"מלך אשור" בכ"י ששון 1043 (ס' 11404).
37.
למשל בהל' שאר אבות יא,יד במקום "תשלומי תרומה וחומשה" נדפס בדפוס רומא "תשלומי ארבעה וחמישה".
38.
למשל בכ"י בהמ"ל 350 RAB (ס' 50553) הל' כלים ו,ז "הגננים...בלנין..." שונה ל: "הגנבים...הכלבים.." אפשר שהמילה "הכלבים" נמשכה עקב האסוציאציה השלילית שנוצרה מן המילה "הגנבים", שגם היא טעות.
39.
וכאן דוגמא מודרנית: טרם הספיקותי.
40.
לדוגמא, מעתיק כ"י אוקספורד 599 (ס' 20189) למשנ"ת, שמתבלבל פעמים רבות במיספור הפרקים. הגדיל לעשות, כשהתחיל את הלכות איסורי מזבח בכותרת "פרק שני"!
41.
ג. בן-עמי צרפתי "מסורת לשון חכמים" (בשם מ.בר אשר), בתוך: מחקרי לשון, עורכים מ.בר אשר ואח' עמ' 452.
42.
לדוגמא: כבר נפסק > כפר נפסק.
43.
לדוגמא: שפיכודמים.
44.
לדוגמא: [ז]קנה, [כ]שירצה.
45.
לדוגמא: מונע את הטומאה > מונעת הטומאה.
46.
לדוגמא: הגדה [של פסח], [ליל ה]סדר, מחד [גיסא] ומאידך [גיסא].
47.
לדוגמא: אופל-אפלה, אומד-אומדן.
48.
לדוגמא: לא מדיבשך ולא מעוקצך > לא מדובשך ולא מעוקצך.
49.
לדוגמא: שושן-פורים.
50.
לעיתים לא נדירות, דווקא שיבושיו של עם-הארץ הם אוצר בלום לחוקר המשחזר. מעתיק כזה עשוי לשמר צורות ארכאיות, בלא לנסות לעדכנן. ומכל מקום, על פי רוב שיבושיו קלים לזיהוי ולתיקון.
51.
לפעמים לפנינו חוסר-ידע ולא חוסר הבנה. למשל, כאשר מעתיק ספרדי כותב "מדינת לוהייר" במקום "מדינת לותייר".
52.
תקלות כאלו אופייניות בחיבורי חכמים בעלי סיגנון ייחודי. לדוגמא משנ"ת לרמב"ם.
53.
לדוגמא: כ"י אוקספורד 568 (ס' 19439) בהל' מעשרות פרקים ד-י מועתקים הדפים בסדר 3-2-1.
דוגמא מעניינת ומורכבת במיוחד קיימת בהל' ביאת המקדש פרקים ז-ח-ט. בכ"י נים 25 (ס' 4423) הגוש כולו נחלק לשניים - החצי הראשון - ח,ד עד ח,יב - שורבב לאמצע ז,ז והחצי השני - ח,יב עד ט,יא - שורבב לאמצע ט,יג ואילו בכ"י בהמ"ל 1618 (ס' 42156) החצי הראשון חסר לחלוטין והחצי השני שורבב לאמצע ז ז. כמעט אין ספק ששניהם העתיקו מאותו טופס-אב ששני דפים נתלשו בו. בנים 25 (סוף המאה ה 13?) הדף הראשון שורבב לפנים והדף השני לאחור. נראה שכאשר הגיע הטופס לידי מעתיק בהמ"ל 1618 (מאה 14-15?) כבר אבד הדף הראשון והדף השני שורבב לפנים. מימצא זה ממחיש את התועלת ההדדית שיכולות הפילולוגיה והקודיקולוגיה להפיק זו מזו.
54.
במקרה כזה יש לדון האם זו תופעה שמקורה קודקולוגי (שיבוש בכריכה) או פאליאוגרפי (שיבוש בהעתקה).
55.
דוגמאות מאלפות ראה: ש.עמנואל "טעות סופר", בתוך: תרביץ 58 (תשמט) עמ' 145-135.
56.
יש חוקרים אשר משתמשים במושג "ניגוד גירסאות". לעניות דעתי, הדיכוטומיות המרומזת בו מגבילה את הדיון ועלולה להתעות ולהטעות.
57.
כאמור, במיסגרת זו אנו דנים רק בחיבורים בעלי גיבוש טקסטואלי יציב. די לחכימא ברמיזה, שלא נזקקנו למושג "טקסט מקורי".
58.
לחוקר במדעי היהדות מוצע להתבונן במשנ"ת - חיבור המכיל כ 800,000 מילים ואשר מצויים ממנו יותר מ 400 כי"י (אמנם רובם חלקיים).
59.
ראו למשל M.Bevenot, The Tradition of Manuscripts. חוקר זה בדק (ידנית) 18 כי"י בכ 400 פיסקאות. הוא הצליח לערוך טבלת "שוויון ואריאנטים" (שם,עמ' 126) ואפילו להצביע על כמה "משפחות", אך לא יותר.
עוד ראוי לציין את ש.י.וולד, (בבלי פסחים, פרק שלישי, ביהמ"ד לרבנים באמריקה, ניו-יורק וירושלים, תש"ס) אשר בדק 11 כתובי-יד ועוד 7 קטעי גניזה ב 128 פיסקאות והציג את מימצאיו בכ 20 טבלאות השוואה (שם עמ' 274 ואילך).
60.
יש לשים לב ששיטה זו אפשרית רק בעדי-נוסח שלמים. אלא אם כן מוכן החוקר להסתפק במידגם חלקי, ולהתייחס רק לקטעי-טקסט שבהם קיימים כל העדים.
61.
ראו בסיפרות שבהערות 4 ו 6 לעיל, ובהפניות המאמרים אל המוקדמים מהם.
62.
כך אצל ( K.O'Brien O'Keefee & A.R.P.Journet, "Numerical Taxonomy", in: Manuscripta 27 (1983
pp. 131-145
63.
M.Spencer and C.J.Howe לעיל הע' 6.
64.
חוקרים אחדים העדיפו "לוותר" על קטעי-טקסט מרובי שיבושים, ועל קטעים שבהם גירסה-כפולה, מתוך הנחה שמצב זה עלול לטשטש את תמונת ההקבצה היסודית. בעיני זו שגיאה מתודית. לפעמים, דווקא סיטואציות פרובלמטיות עשויות לספק מידע ייחודי. כמובן שהפקתו תובעת התייחסות תיאורטית ופרקטית ברורה.
65.
אני עומד על סדר זה בדווקא, למרות שלעיתים יש בידינו מימצאים וודאיים על קשר אב-בן (גלוסות-שוליים באחד, שחדרו לעמוד בשני, וכד'), אפילו בשעה שההקבצה בכללותה עדיין מסופקת. בהצדקת המתודה אראה שלא נאבד מידע אם נשים בינתיים "בין סוגריים" את שאלת כיוון הקשר.
66.
אתגר הרבה יותר מורכב ומסובך מן המוצג כאן, הוא הרכבת רשימת שינויים טקסטואליים אופייניים לעריכה ולהתערבות מודעת. ככל שעולה משקלם של שינויי-נוסח מכוונים, פוחתת יעילותה של המתודה. הדברים אמורים הן כלפי חיבורים שנשמרו בלתי-מקובעים בהיותם נמסרים בעל פה, והן כלפי תופעת "הספר הפתוח". אך אין כאן מקומו.
67.
משום "אל תמנע טוב" הרי הערה מיקדמית: השיבושים בדרגות 4-6 שלהלן מועטים בחיבורים קאנוניים. מאידך, ככל שמתקדם תהליך הקאנוניזציה של חיבור, מתגברת החשיבות הסטמטולוגית של הבדלי הגירסאות בדרגות 1-3. גם לטענה זו תבואנה הדגמות בעיתן ובזמנן.
68.
מכאן שאין הוא יעיל בניתוח חיבורים בלתי מגובשים טקסטואלית, או שעברו עריכה-עמוקה. כמו כן אין בו תועלת בניתוח עבודת זייפן בכוונה.
69.
בסיטואציה שבה ידוע טופס-אב וטופס-בן אפשר להשתמש במודל זה על מנת לתת "ציונים" לדייקנות מעתיקים. אלא שלא זו משימתנו.
70.
הדעת נותנת, שכל סוגה סיפרותית זוקקת סולם שונה במעט או בהרבה. אינה דומה העתקת ספר תורה להעתקת פיוטי תפילה, ולא זו לתרגום הארמי לנ"ך. ואכן ברשימת שיבושים של התרגום נמצאו רק מימצאים מדרגות 3-1 שבסולם שלפנינו. ראו: A.Sperber, The Bible in Aramaic (IV B), Leiden 1973 pp.351-375.
נראה שלא תמיד יש צורך במתודה מורכבת כשלנו. בהשוואת נוסח התנ"ך נהוגה השוואה ע"י ספירה פשוטה של הבדלים. ראו למשל: יוסף וינטר, מצחפי תנ"ך שלם מימה"ב, עבודת מ.א. בר אילן, תשמ"ג.
דין אחר יש לפסוקי-מקרא, המופיעים בסיפרות ההלכה בנוסח שונה מזה שבמסורה. ואין כאן מקומו.
71.
לדוגמא: ספר משנ"ת נכתב בסיגנון מיוחד שיש בו חזרות תכופות על קטעי משפטים (כנראה מתוך כוונה להקל על שינונו בע"פ). לגמרי לא מפתיע המימצא של "דילוג הדומות" מעל ומעבר המקובל בחיבורים אחרים. אי לכך, הפרמטרים של "דילוג הדומות" צריכים להשתנות בו בהתאם.
72.
לזאת רמזתי למעלה בביטוי הסתום "פרופיל שיבושי המעתיק".
הערה המקדימה את המאוחר: בבדיקת כתובי-היד של משנ"ת, התגלה שדייקנותם המופלגת של המעתיקים התימנים (של משנ"ת אך לא של התלמוד!), דורשת שימוש בכלי הרבה יותר מעודן מאשר הסולם התיקני. הצעה להתגבר על הקושי תוגש בבוא המועד.
73.
כלומר, אינני טוען שהרווח בין השלבים קבוע.
74.
הוא הדין לגבי טכניקות קיצור מילים, צורת שם הוויה ועוד.
75.
רווח צדדי יש ב"התעלמות" מחילופי י-ו, אשר מנטרלת את ספיקות הקורא באבחנה מדוייקת ביניהן.
76.
ראו למשל: ש.י.פרידמן "כי"י של התלמוד הבבלי - טיפולוגיה של כתיב" בתוך: "מחקרים בלשון העברית" עמ' 190-163.
במבוא המתודולוגי החשוב לספרו תלמוד ערוך, חלק הנוסח, עומד ש.י.פרידמן על שהנוסח, הכתיב והכתב מהווים, במידה רבה, קריטריונים בלתי תלויים למיון, להקבצה ולפיצול משפחות כתובי יד. דומה שטענה זו דורשת עידון וזיקוק.
77.
אמנם עיון בטבלה יראה, שתוספת קטע משותפת לכמה עדים, מצביעה על קשר יותר "חזק" ביניהם, מאשר חיסרון משותף. אך גם טענה זו איננה מניחה שהתוספת היא השיבוש או החיסרון. בביקורת הנמוכה אין תוקף לכלל: הקצר - עדיף (lectio brevior). מצד שני, השמטה בכתיבה מסתברת (ואף שכיחה) יותר מאשר הכפלת הכתיבה. זאת עקב השאיפה הבסיסית למהר בהעתקה. אם וכאשר ניצב החוקר מול תופעה שאיננו מסוגל להכריע בה: תוספת כאן או דילוג כאן, העצה היעוצה היא לדרג אותה כממוצע חשבוני ביניהן.
78.
התוכנה PHYLIP הופעלה על קבצי-ניסוי שהופקו מהשוואת חילופי גירסאות של כתובי-יד של חיבורי הלכה שונים.
תודה לפרופסור דן גראור ולגב' טל דגן מהמחלקה לזואולוגיה באוניברסיטת תל אביב. אני מקווה לפרסם בעתיד פירוט מלא של מהלך הניסוי ותוצאותיו.

חזרה לתחילת המאמר