Grammatical Formalisms Postgraduate course «Technoglossia» Stella Markantonatou Athens, October 2012 LECTURE 1 Context Free Phrase Structure Grammars (CFPSG) and Constituency CONTENTS 1. 2. 3. 4. 5. 6. 7. Two trends in the study of linguistic knowledge .................................................................. 1 The Symbolic Approach: Knowledge representation and formal languages ...................... 1 Context Free (CF) Grammars................................................................................................. 2 Diagnostics for phrases.......................................................................................................... 2 Application ............................................................................................................................. 3 Homework ............................................................................................................................. 4 References ............................................................................................................................. 5 1. Two trends in the study of linguistic knowledge A—Symbolic approaches Formal languages and inferencing B--- Quantitative approaches Apply measurements on texts and do statistical analysis. Measurements may be applied on basic information such as n-grams. However, they often apply on symbolic information (grammatical tags, syntactic tags etc) extracted with both quantitative and symbolic processing. 2. The Symbolic Approach: Knowledge representation and formal languages A formal language is a set of words, that is, finite strings of letters, symbols, or tokens that are defined in the language. The set from which these are taken is the alphabet over which the language is defined. A formal language is often defined by means of a formal grammar. Formal languages are often used as the basis for richer constructs endowed with semantics. Example Vocabulary {N, Det, Adj, NP} Formal Grammar NP Det (Adj) N (NP) Strings in the language { Det N, Det N NP, Det Adj N, Det Adj N NP, Det N Det N, ...} A number of formal languages have been used in Linguistics: the language of transformational grammar/of Lexical Functional Grammar etc. Those languages are still evolving. Their alphabet, grammar and semantics are under constant scrutiny—if evolution had stopped then the study of natural languages would have been concluded, which is by no means the case! 1 Grammatical Formalisms Postgraduate course «Technoglossia» Stella Markantonatou Athens, October 2012 3. Context Free (CF) Grammars Most of the formal languages used in Linguistics are Context Free (CF) ones. CF languages are described by rules of the general type (1), where A is a non terminal symbol and γ a string consisting of terminal and non terminal symbols. (1) A γ A terminal symbol can not appear in the left hand of the rule (1) while a non terminal one can. Rules conforming to (1) are NP Det N VP V NP NP, VP are non-terminal symbols. Det, N, V are terminal symbols. Central is the notion of part of speech (also a word class, a lexical class, or a lexical category): a linguistic category of lexical items that is generally defined by the syntactic or morphological behaviour of the lexical item in question. Most times, but not always, phrases develop around some predicate that is called the HEAD of the phrase and can be classified under one of the parts of speech that are available in the corresponding language. Sentences, however, have no lexical head. Table 1 gives an overview of the most common phrases and their names in Greek (EL) and English (EN). Part of Speech (EL) Όνομα Ρήμα Επίθετο Πρόθεση Phrase (EL) Επίρρημα Επιρρηματική Φράση Πρόταση Ονοματική Φράση Ρηματική Φράση Επιθετική Φράση Προθετική Φράση ABBR Part of Speech (EN) Noun Verb Adjective Preposition ΟΦ ΡΦ ΕΦ ΠΡΟΘΦ ΕπιρΦ Adverb Π Phrase (EN) Noun Phrase Verb Phrase Adjectival Phrase Prepositional Phrase Adverbial Phrase Sentence ΑΒΒR ΝΡ VP AP PP AdvP S Table 1. Parts of speech and corresponding phrases in Greek (EL) and English (EN) 4. Diagnostics for phrases (1) Distribution: the same string of words (morphology does not matter) can fulfill different grammatical functions. Subject Οι ποδοσφαιριστές μπήκαν στο γήπεδο The footballers entered the football pitch. 2 Grammatical Formalisms Postgraduate course «Technoglossia» Stella Markantonatou Athens, October 2012 Object Τα πλήθη καλωσορίζουν τους ποδοσφαιριστές The crowds welcome the footballers. Phrase introduced with a preposition Έχουν γραφτεί τόσα πολλά για τους ποδοσφαιριστές So many things have been written about the footballers. (2) Substitution: A phrasal constituent can be replaced by pronouns. Οι ποδοσφαιριστές μπήκαν στο γήπεδο --- Ποιοι μπήκαν στο γήπεδο? The footballers entered the football pitch --- Who entered the football pitch? Τα πλήθη καλωσορίζουν τους ποδοσφαιριστές --- Ποιους καλωσορίζουν τα πλήθη? The crowds are welcoming the footballers --- Whom are the crowds welcoming? Έχουν γραφτεί πολλά για τους ποδοσφαιριστές --- Για ποιους έχουν γραφτεί πολλά? So many things have been written about the footballers --- About whom have so many things been written? -Βαριέμαι την Υπολογιστική Γλωσσολογία—I am bored of Computational Linguistics. -Το ίδιο και εγώ – So am I. (3) Coordination (…caution!!!) Θέλω [μακαρονάδα και παγωτό]. I would like [spaghetti and ice cream]. *Θέλω [μακαρονάδα και έρχεται ο Γιάννης]. * I would like [spaghetti and John is coming]. Πήγα [στην αγορά και στην θάλασσα]. I went [to the market and to the sea]. *Πήγα [στην αγορά και πόλη]. *I went [to the market and town]. However, coordination is possible across non-phrasal constituents --- so this is a sufficient but not a necessary condition: Έδωσα [χρήματα] [στην Ελένη] και [την αγάπη μου] [στον Φάνη]. I gave [money] [to Helen] and [my love] [to Fanis]. 5. Application In the Greek text below there are several NPs (phrases built around a noun). In Table 2, some of those NPs are listed in the leftmost column. In the next columns are listed the diagnostics used to identify them. Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη. Το πρώτο είναι η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως. 3 Grammatical Formalisms Postgraduate course «Technoglossia» Stella Markantonatou Athens, October 2012 NPs Distribution Substitution Coordination Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη. Τί γίνεται μέσα στην τρέλα και ένταση των στιγμών? Έκανα δύο μεγάλα λάθη. Τί έκανες? Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη και δύο επικίνδυνες αβλεψίες. Έστρεψαν την προσοχή τους στα δύο μεγάλα λάθη αγνοώντας τα μικρότερα. Το πρώτο είναι η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως. Αποδέχονται εύκολα την ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως. Σε τί έστρεψαν την προσοχή τους? η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων η ανεξέλεγκτη δαιμονοποίησή τους Ποιανών η ανεξέλεγκτη δαιμονοποίηση ...? Ποιοι δαιμονοποιούνται? η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων Ποιο ειναι το πρώτο? *Ποιο είναι το πρώτο, γενικώς και αορίστως? Τί αποδέχονται εύκολα? Οι δημόσιοι υπάλληλοι δαιμονοποιούνται Δαιμονοποιούν τους δημόσιους υπαλλήλους. Το πρώτο είναι η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως και η πάνδημη κατακραυγή τους. η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων και των ιδιωτικών μεταφορέων Ποιους δαιμονοποιούν? Table 2. NPs and the identification diagnostics Note on Table 2. Substitution. Actually, the application of the criterion says that the set of words in question is a phrasal constituent in a given environment. A phrasal constituent is a structured set of words that plays a certain syntactic role in a phrase as such. The substitution criterion actually shows that a particular set of words fills a certain syntactic slot in the phrase. 6. Homework 1. In the text below underline the Noun Phrases (NPs). NPs are phrases that are built around a noun. However, NPs may contain many more things than a noun: they may contain relative clauses, other types of subordinated clause, a series of genitives etc 2. Create a table with as many columns and as many lines as necessary. In the leftmost column list the NPs you identified in the second paragraph of the text (the yellow one). In the remaining columns indicate the diagnostics you used to identify each case. Take Table 2 as an example H KAΘΗΜΕΡΙΝΗ Hμερομηνία : 28-09-11 4 Grammatical Formalisms Postgraduate course «Technoglossia» Stella Markantonatou Athens, October 2012 Η ανεξέλεγκτη δαιμονοποίηση Του Αλεξη Παπαχελα Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη. Το πρώτο είναι η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως. Ωστόσο είναι άλλο πράγμα να μιλάμε για την ανάγκη μείωσης του δημόσιου τομέα και άλλο να τα βάζουμε προσωπικά με όποιον έτυχε να πάρει σύνταξη στα 50 ή να προσελήφθη σε μία ΔΕΚΟ χωρίς ιδιαίτερα προσόντα. Πηγαίνετε λίγο πίσω, όχι και πολύ πίσω, και σκεφθείτε πώς δούλευε το σύστημα. Ενας Ελληνας πολίτης τελείωνε μια σχολή και είχε τη βεβαιότητα ότι θα προσληφθεί στο Δημόσιο, γιατί «έτσι γινόταν». Ο άνθρωπος δεν είχε ιδέα ούτε για τη... δυναμική του χρέους ούτε για τίποτε άλλο. Ακολουθούσε πιστά τους κανόνες και τις παραδόσεις μιας κοινωνίας και ενός πολιτικού συστήματος. Αίφνης, ο εν λόγω άνθρωπος νιώθει ότι έχασε το έδαφος κάτω από τα πόδια του. Εχει κάνει τους λογαριασμούς του και τα κουμάντα του με βάση την αρχική «σύμβαση» με το πολιτικό σύστημα. Ηταν βέβαιος ότι θα έχει μια αξιοπρεπή σύνταξη, ότι θα μπορεί να πληρώνει τα φροντιστήρια των παιδιών του και τα κοινόχρηστα, χωρίς να σκέφτεται πότε θα ανάψει το καλοριφέρ. Υπάρχουν βεβαίως και οι εξαιρέσεις, όπως οι 50άρηδες συνταξιούχοι ΔΕΚΟ με μεγάλη σύνταξη που δουλεύουν και σε μια «μαύρη» εργασία... Δεν είναι όμως η πλειοψηφία. Είναι λάθος να δαιμονοποιούμε αυτούς τους ανθρώπους επειδή βρήκαν μια δουλειά - όπως έκανε και ο υπόλοιπος κόσμος. Exercise 2. XLFG: https://signes.bordeaux.inria.fr/xlfg5/index.php Tutorial1. Getting familiar with XLFG. 7. References Δήμητρα Θεοφανοπούλου-Κοντού. 1989. Μετασχηματιστική Σύνταξη. Από την θεωρία στην πράξη. Αθήνα: Εκδόσεις Καρδαμίτσα Dalrymple, Mary. 2002. Syntax and Semantics 34: Lexical Functional Grammar. Academic Press 5