?הנוכמה השוע המ
שדחמ הבכרה ,םוגרת ,הנבומ גוציי ,םימרוגל קורפ


,Translation Memory לש םילדומ יפ לע תודקפתמ םויכ תוירחסמה תוכרעמה בורש תורמל
תולעופ ןניאש) ןייל-ןוא-םוגרת תונכות םג ומכ ,תוינדיתעו תוירקחמ םוגרת תונכותש ירה
.ןאכ ראתנש ןפואב תולעופ ,(םגרתמה םע היצקארטניאב

:םינוש םיגוסמ עדיב רזענ ישונא םגרתמ
דציכו תודדובה םילימה ןבומ לש עדי ,הרטמה תפש םע תורכיה ,רוקמה תפש םע תורכיה
.'וכו תומכסומ ,יתרבח ,יתוברת - יללכ עדי ,תועמשמ לעב טפשמ תונוב ןה

:הנבומ ןפואב ,הנוכמל ריבעהל םיסנמ ונא הזה עדיה תא
הלימה תא םיאטבמ דציכו םיתייאמ דציכ - יגולונופ עדי -
רשקהב םתוגהנתהו('וכו םיבר-דיחי ,תויטה ,םישרוש) םילימה הנבמ - יגולופרומ עדי -
can't וא I'm ןוגכ םייוטיב תריצי רשפאמ יגולופרומ עדי   
קלחתמ אוה תוזארפ הזיאלו טפשמ יונב דציכ - יטקטניס עדי -
טפשמב םילמה רדס ,לשמל ,הנבמ תורצויו דחי תופרוצמ םילמ וב ןפואל סחייתמ syntax וא ריבחת   
אלמה טפשמה לשו ,הזארפו הלימ לכ לש תועמשמה המ - יטנמס עדי -
ןיבהל ןיא םהלש תועמשמה תאש תיריבחת הניחבמ םינוכנ םיטפשמ תויהל םילוכי   
.Colorless green ideas sleep furiously(:יקסמוח לש תיסאלק אמגוד)   
:טפשמה .ןבומכ - ןמצע םילימה ךותמ םג תלבקתמ תועמשמ   
םילוחמה םיבנרקה תא ונפליפ םיקצרחה   
.תירבעה ירבוד בור לש םילימה רצואב תועמשמ רסח לבא תיריבחת הניחבמ ןוכנ טפשמ אוה   
.'יתימא'ה םלועל הפשה לש םירשקהב קסועה םוחתה - הקיטמגרפ -

:ללוכ ךילהתה
Representing Linguistic Knowledge -(יטקטניסו יגולופרומ) יקודקד גוציי -
רצנ לעי לש התאצרהב ,היגולופרומ לע דוע
Grammars and Constituent Structure, Grammatical Relations  
יללכ עדיו הקיטמגרפ ,הקיטנמס - תויועמשמ גוציי -
Meaning
.(סקטניסו היגולופרומ) םיללכ יפ לע ,PARSING - םימרוגל קורפ -
.ןינבה ינבא לש ידפולקיצנא ינולימ םוגרת -
(הפשה יללכ יפל) דעיה תפשב שדחמ הבצה -


PARSING
:ליעל רומאכ ותוא גציינו ותוא קרפנ ,אבה טפשמה תא אמגודל חקינ

יגולופרומ חותינ ךכל םדוקש בל ומיש

:PARSING תונכות תלועפב ןנובתנ ,ךילהתב הזה קלחה תא ןוחבל ידכ

Glossary of Parsing Terms

CG Tagger

םידקונמ אל םיירבע םיטסקטל יתורבתסה ינרוצ חתנמ

Automatic Scripture Translation Exploratory

Lingsoft parser

Universal Grammar in Prolog

Connexor Machinese

Parse a sentence

Automatic Mapping Among Lexico-Grammatical Annotation Models (AMALGAM)

List of parsers


language guesser

SEMANTIC - Semantic fields, networks or taxonomies
:תואבה תולאשה לע תונעל רומא יטנמס גוציי
"דחי" תויהל תוכייושמ םילימ הזיא -
?םילימ תוצובק ןייפאנ דציכ -
?ןהיניב רשקה יפוא המ -

:אמגוד

Semantic Taxonomies and Disambiguation

Semantic fields, networks or taxonomies can be used to store lexical knowledge (that we all take for granted) regarding the semantic relationships between words. Meijs(1992) describes this knowledge as being attempted answers to the questions : Which words `belong' together ?

How can we characterize the groupings that emerge ?
What is the nature of the links that connect them ?
An example semantic taxonomy is ISA relationships (for which the technical term is hyponymy). For example,
coupי ISA car ISA vehicle
Such relationships can be derived automatically through the use of meaning definitions in a MRD.
coupי
n. "an enclosed car with two doors and a sloping back."
car

n. "a road vehicle with usually four wheels which is driven by a motor." The LDOCE MRD (but not the printed version) contains `subject-field codes' which indicate the semantic field to which the senses of a lexical item belong : zoology, botany, sports, religion etc. Most main subject fields also contain subfields; for example `substance' has the subfields `liquid' and `gas'.
The relationships between `subject-field codes' may be represented using a semantic network, as in this example which shows the top-level ISA relationships between nouns in LDOCE, derived from a study of their meaning definitions.

Semantic disambiguation involves identifying the correct sense or meaning of each word in a particular sentence, using the context in which it occurs as a guide. MRDs will list several senses for most words, but very common words will have many more. For example, LDOCE gives 13 meaning definitions for `bank'. The problem is complicated though by the number of possible sense combinations involved in disambiguating a sentence of words, giving a large problem search space. For example :

The  man  drove  the  car  into  the  bank

      8     10         3                9  (word senses)

Number of possible sense combinations = 8*10*3*9 = 2160

Note that no attempt is made to disambiguate function words, as otherwise they will significantly increase ambiguity (for example, `the' has 21 sense meanings and `for' has 35 meanings in LDOCE) without introducing any obvious semantic information for the disambiguation algorithm. (The semantic distinctions are very abstract, and don't represent finer grained subject-field distinctions.)
Two approaches to automatic semantic disambiguation using MRDs have involved using (i) Semantic Field Codes, and (ii) Sense Meaning Definitions.


:םיפסונ םיגשומו תורדגה

Automatic syntax analysis, or parsing, is one of the oldest and most developed subfields of CL. A parser, as the corresponding analysing system is dubbed, in the CL sense is a program assigning structural descriptions to input sentences (Hellwig 1989, 348). Parsing methods and parser implementations can be classified, among other criteria, according to parsing strategies (serial or "depth first" vs. parallel or "breadth first"; "reductive" or "bottom-up" vs. "expansive" or "top-down"), intrinsic grammar types ("Chomsky hierarchy") and formalisms, parsing techniques and parser architectures (e.g. King, ed. 1983; Hellwig 1989).

A program that only checks sentence structures in order to decide, for instance, whether they are "well-formed", is a recogniser. A program that assigns descriptive "tags" to parts of utterances especially words and parts of sentences or phrases, is a tagger, and the corresponding operation is known as tagging. Tags, as a rule, represent grammatical categories ("word class" labels), sometimes also citation forms of words like those used in dictionaries as lemma signs, or various other grammatical and semantic information - depending on the application. Different kinds of tagging are correspondingly distinguished, as morphological, syntactic or semantic tagging. Automatic word class tagging together with the determination of citation forms was formerly also termed lemmatisation.