Archive for the ‘חוסר דיוק’ Category

רכשתי את המהורה החדשה של „דקדוק הפה והאוזן” של עוזי אורנן. נתקלתי שם ברשימת מילים שבהן יש א כאת קריאה (עמ׳ 40). בהן – „פֹּארָה” ו„נְכֹאת”. זה היה חשוב לי, כי אני מתחזק את הערך חולם בוויקיפדיה, ויש בו רשימת מילים שבהן יש א במקום ו. כמובן, לפני שהוספתי אותן לערך, רציתי להצליב עם מקורות אחרים, וגיליתי דברים מעניינים.

עם „נכאת” אין בעיות מיוחדות, אבל היה נחמד לראות שאבן־שושן מספר ש„נכאת” זה מין בושם, ובאותו הערך אומר ש„בית־נכות” היא מילה אחרת שנכתבת באות ו. טוב להזכיר טעויות נפוצות כאלה באותו הערך.

הסיפור של „פארה” מעניין יותר. פירושה המילה הזאת הוא „ענף”, והיא מופיעה מספר פעמים בספרי הנביאים. אבן־שושן מפנה ליחזקאל לא ד, אבל לא התעצלתי ובדקתי בספר תנ״ך אמתי, והנה מסתבר שהפסוק הנכון הוא יחזקאל לא ה, ולא ד. כמה פסוקים אחרי־כן, ביחזקאל לא יג אפשר לראות גם הבדל בין התנ״ך של אהרן דותן לבין תנ״ך קורן – המילה הזאת מופיעה שוב, ואצל דותן כתוב „פֹּארֹתָיו” ובקורן – „פֹּרֹאתָיו”. יהיה מעניין לבדוק את זה יותר לעומק.

תראו איזו מילה נהדרת גיליתי באבן שושן: מְנֻבָז. ככה, בלי הדגש התבניתי בבי"ת, אף על פי שהוא אמור להיות שם בגלל בניין פֻּעַל.

כנראה לא מְדֻבָּר בטעות: זוהי מילה מהעברית החדשה (לפי הסימון ח) ותופעה ידועה היא בעברית החדשה שאנשים גוזרים מילים לפי התנועות של הבניין ולא בהכרח לפי הדגש. זכור לי ראש צוות מתכנתים שאמרו לו ששרת הפיתוח לא עובד והוא מיד השיב: "מְעַבְדִים אותו?"

המילה מְעַבְדִים לא מופיעה באבן שושן וזה כנראה בסדר. דוגמה אחרת שכן מופיעה באבן שושן היא "הִתְחַבֵר", אבל לא כערך ממש, אלא כסעיף תחת הִתְחַבֵּר עם ההערה "בדיבור בהיגוי ב' רפויה, כאילו בניין התפעל" והמשמעות היא "נעשה חבר ל־, נעשו חברים זה עם זה". אני לא בתחום מדעי החברה, אבל נדמה לי שמושגים שגזורים מהמילה הזאת כבר הפכו למושגים מקצועיים שגורים.

אז טוב לדעת שאבן שושן מודע לתופעה ולא מתעלם ממנה כי היא חורגת מהדקדוק המסורתי. עם זאת, יש מספר בעיות. על מְנֻבָז נאמר: "רק בצירוף נֶבֶז מְנֻבָז – תצורה עממית מן נִבְזֶהח", אבל מילון הסלנג המקיף של רוזנטל דווקא מביא דוגמה שבה מְנֻבָז עומד לבדו, ללא נֶבֶז. הערך באבן שושן רק מביא את הדוגמה "מפקיד זה לא תקבל כלום, אינו אלא נבז מנובז!" ולא רשום מה מקורה. קצת קשה לדמיין שמשפט עם הצירוף "אינו אלא" הוא משפט לגמרי עממי, אבל אולי דיברו כך לפני כמה עשורים. חוץ מזה, עצם השימוש במושג "עממי" לא עקבי ולכן לא מדויק.

חוסר עקביות נמצא גם בייצוג: אם מְנֻבָז הוא ערך שעומד בזכות עצמו, למה לא הִתְחַבֵר? מעבר לזה, הלכתי לבדוק את המילה נִבְזֶהח, שממנה גזור מְנֻבָז ומצאתי דבר מעניינים מאוד. קודם כול, נִבְזֶה היא בכלל לא ח, אלא מקראית. לערך נִבְזֶה עצמו יש אטימולוגיה די משונה: "מן בזה, נִבְזֶה" – כאילו מעצמו. בערך נֶבֶז יש ציטוט של יזהר עם "נבז מנובז" – מה שפותר את בעיית המקור של מְנֻבָז. ויש גם ערך לשורש נבז, שעליו כתוב "בלשון הדיבור" – הציטוט מיזהר כבר מוכיח שהשורש הזה ספרותי וקיים לא רק בלשון הדיבור, וגזירת מילים בסגנון כזה עשה גם רבי סעדיה גאון במאה העשירית. עוד כתוב על השורש הזה "ראו גם נֵבֵז" – הכוונה כנראה לערך נֶבֶז והניקוד צירי-צירי כמובן לא נכון. לבסוף, תחת השורש נבז מופיע הפועל נֻבָּז ללא הגדרה ועם הפניה לערך… מְנֻבָּז – בדגש.

כל הבלגן הזה מצביע שוב על בעיה כללית מאוד בעריכת אבן שושן: הכול כנראה נעשה ידנית ללא עזרת מחשב. ניהול ממוחשב ומנורמל יותר של ערכים היה חוסך עבודה ומונע טעויות וגם מניח יסודות לטכנולוגיה של ניתוח טקסט סמנטי בעברית.

שפלה – ארצות השפלה – "הולנד ששמה הלועזי נדרלנד" – לא מדויק. הולנד הוא השם העברי הנפוץ של כל נדרלנד, אבל בפועל זה רק אחד מהאזורים במדינה. נדרלנד זה באמת "ארצות השפלה".