Μάθημα 1

advertisement
Grammatical Formalisms
Postgraduate course «Technoglossia»
Stella Markantonatou
Athens, October 2012
LECTURE 1
Context Free Phrase Structure Grammars (CFPSG) and Constituency
CONTENTS
1.
2.
3.
4.
5.
6.
7.
Two trends in the study of linguistic knowledge .................................................................. 1
The Symbolic Approach: Knowledge representation and formal languages ...................... 1
Context Free (CF) Grammars................................................................................................. 2
Diagnostics for phrases.......................................................................................................... 2
Application ............................................................................................................................. 3
Homework ............................................................................................................................. 4
References ............................................................................................................................. 5
1. Two trends in the study of linguistic knowledge
A—Symbolic approaches
Formal languages and inferencing
B--- Quantitative approaches
Apply measurements on texts and do statistical analysis. Measurements may be applied on basic
information such as n-grams. However, they often apply on symbolic information (grammatical tags,
syntactic tags etc) extracted with both quantitative and symbolic processing.
2. The Symbolic Approach: Knowledge representation and formal languages
A formal language is a set of words, that is, finite strings of letters, symbols, or tokens that are defined
in the language. The set from which these are taken is the alphabet over which the language is defined.
A formal language is often defined by means of a formal grammar. Formal languages are often used as
the basis for richer constructs endowed with semantics.
Example
Vocabulary {N, Det, Adj, NP}
Formal Grammar NP  Det (Adj) N (NP)
Strings in the language { Det N, Det N NP, Det Adj N, Det Adj N NP, Det N Det N, ...}
A number of formal languages have been used in Linguistics: the language of transformational
grammar/of Lexical Functional Grammar etc. Those languages are still evolving. Their alphabet,
grammar and semantics are under constant scrutiny—if evolution had stopped then the study of natural
languages would have been concluded, which is by no means the case!
1
Grammatical Formalisms
Postgraduate course «Technoglossia»
Stella Markantonatou
Athens, October 2012
3. Context Free (CF) Grammars
Most of the formal languages used in Linguistics are Context Free (CF) ones. CF languages are
described by rules of the general type (1), where A is a non terminal symbol and γ a string consisting of
terminal and non terminal symbols.
(1) A  γ
A terminal symbol can not appear in the left hand of the rule (1) while a non terminal one can. Rules
conforming to (1) are
NP  Det N
VP  V NP
NP, VP are non-terminal symbols. Det, N, V are terminal symbols.
Central is the notion of part of speech (also a word class, a lexical class, or a lexical category): a
linguistic category of lexical items that is generally defined by the syntactic or morphological behaviour
of the lexical item in question.
Most times, but not always, phrases develop around some predicate that is called the HEAD of the
phrase and can be classified under one of the parts of speech that are available in the corresponding
language. Sentences, however, have no lexical head. Table 1 gives an overview of the most common
phrases and their names in Greek (EL) and English (EN).
Part of Speech
(EL)
Όνομα
Ρήμα
Επίθετο
Πρόθεση
Phrase (EL)
Επίρρημα
Επιρρηματική
Φράση
Πρόταση
Ονοματική Φράση
Ρηματική Φράση
Επιθετική Φράση
Προθετική Φράση
ABBR
Part of Speech
(EN)
Noun
Verb
Adjective
Preposition
ΟΦ
ΡΦ
ΕΦ
ΠΡΟΘΦ
ΕπιρΦ
Adverb
Π
Phrase (EN)
Noun Phrase
Verb Phrase
Adjectival Phrase
Prepositional
Phrase
Adverbial Phrase
Sentence
ΑΒΒR
ΝΡ
VP
AP
PP
AdvP
S
Table 1. Parts of speech and corresponding phrases in Greek (EL) and English (EN)
4. Diagnostics for phrases
(1) Distribution: the same string of words (morphology does not matter) can fulfill different
grammatical functions.
Subject
Οι ποδοσφαιριστές μπήκαν στο γήπεδο
The footballers entered the football pitch.
2
Grammatical Formalisms
Postgraduate course «Technoglossia»
Stella Markantonatou
Athens, October 2012
Object
Τα πλήθη καλωσορίζουν τους ποδοσφαιριστές
The crowds welcome the footballers.
Phrase introduced with a preposition
Έχουν γραφτεί τόσα πολλά για τους ποδοσφαιριστές
So many things have been written about the footballers.
(2) Substitution: A phrasal constituent can be replaced by pronouns.
Οι ποδοσφαιριστές μπήκαν στο γήπεδο --- Ποιοι μπήκαν στο γήπεδο?
The footballers entered the football pitch --- Who entered the football pitch?
Τα πλήθη καλωσορίζουν τους ποδοσφαιριστές --- Ποιους καλωσορίζουν τα πλήθη?
The crowds are welcoming the footballers --- Whom are the crowds welcoming?
Έχουν γραφτεί πολλά για τους ποδοσφαιριστές --- Για ποιους έχουν γραφτεί πολλά?
So many things have been written about the footballers --- About whom have so many things
been written?
-Βαριέμαι την Υπολογιστική Γλωσσολογία—I am bored of Computational Linguistics.
-Το ίδιο και εγώ – So am I.
(3) Coordination (…caution!!!)
Θέλω [μακαρονάδα και παγωτό].
I would like [spaghetti and ice cream].
*Θέλω [μακαρονάδα και έρχεται ο Γιάννης].
* I would like [spaghetti and John is coming].
Πήγα [στην αγορά και στην θάλασσα].
I went [to the market and to the sea].
*Πήγα [στην αγορά και πόλη].
*I went [to the market and town].
However, coordination is possible across non-phrasal constituents --- so this is a sufficient but not a
necessary condition:
Έδωσα [χρήματα] [στην Ελένη] και [την αγάπη μου] [στον Φάνη].
I gave [money] [to Helen] and [my love] [to Fanis].
5. Application
In the Greek text below there are several NPs (phrases built around a noun). In Table 2, some of those
NPs are listed in the leftmost column. In the next columns are listed the diagnostics used to identify
them.
Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη. Το πρώτο είναι η
ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως.
3
Grammatical Formalisms
Postgraduate course «Technoglossia»
Stella Markantonatou
Athens, October 2012
NPs
Distribution
Substitution
Coordination
Μέσα στην ένταση
και την τρέλα των
στιγμών γίνονται
δύο μεγάλα λάθη
Μέσα στην ένταση και την τρέλα
των στιγμών γίνονται δύο
μεγάλα λάθη.
Τί γίνεται μέσα στην
τρέλα και ένταση των
στιγμών?
Έκανα δύο μεγάλα λάθη.
Τί έκανες?
Μέσα στην ένταση και την
τρέλα των στιγμών
γίνονται δύο μεγάλα λάθη
και δύο επικίνδυνες
αβλεψίες.
Έστρεψαν την προσοχή τους
στα δύο μεγάλα λάθη
αγνοώντας τα μικρότερα.
Το πρώτο είναι η ανεξέλεγκτη
δαιμονοποίηση των δημοσίων
υπαλλήλων, γενικώς και
αορίστως.
Αποδέχονται εύκολα την
ανεξέλεγκτη δαιμονοποίηση
των δημοσίων υπαλλήλων,
γενικώς και αορίστως.
Σε τί έστρεψαν την
προσοχή τους?
η ανεξέλεγκτη δαιμονοποίηση
των δημοσίων υπαλλήλων
η ανεξέλεγκτη
δαιμονοποίησή τους
Ποιανών η ανεξέλεγκτη
δαιμονοποίηση ...?
Ποιοι δαιμονοποιούνται?
η ανεξέλεγκτη
δαιμονοποίηση
των δημοσίων
υπαλλήλων
η ανεξέλεγκτη
δαιμονοποίηση
των δημοσίων
υπαλλήλων
Ποιο ειναι το πρώτο?
*Ποιο είναι το πρώτο,
γενικώς και αορίστως?
Τί αποδέχονται εύκολα?
Οι δημόσιοι υπάλληλοι
δαιμονοποιούνται
Δαιμονοποιούν τους δημόσιους
υπαλλήλους.
Το πρώτο είναι η
ανεξέλεγκτη
δαιμονοποίηση των
δημοσίων υπαλλήλων,
γενικώς και αορίστως και
η πάνδημη κατακραυγή
τους.
η ανεξέλεγκτη
δαιμονοποίηση των
δημοσίων υπαλλήλων και
των ιδιωτικών
μεταφορέων
Ποιους δαιμονοποιούν?
Table 2. NPs and the identification diagnostics
Note on Table 2. Substitution. Actually, the application of the criterion says that the set of words in
question is a phrasal constituent in a given environment. A phrasal constituent is a structured set of
words that plays a certain syntactic role in a phrase as such. The substitution criterion actually shows
that a particular set of words fills a certain syntactic slot in the phrase.
6. Homework
1. In the text below underline the Noun Phrases (NPs). NPs are phrases that are built around a
noun. However, NPs may contain many more things than a noun: they may contain relative
clauses, other types of subordinated clause, a series of genitives etc
2. Create a table with as many columns and as many lines as necessary. In the leftmost column list
the NPs you identified in the second paragraph of the text (the yellow one). In the remaining
columns indicate the diagnostics you used to identify each case. Take Table 2 as an example
H KAΘΗΜΕΡΙΝΗ Hμερομηνία : 28-09-11
4
Grammatical Formalisms
Postgraduate course «Technoglossia»
Stella Markantonatou
Athens, October 2012
Η ανεξέλεγκτη δαιμονοποίηση
Του Αλεξη Παπαχελα
Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη. Το πρώτο είναι η
ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως. Ωστόσο είναι άλλο
πράγμα να μιλάμε για την ανάγκη μείωσης του δημόσιου τομέα και άλλο να τα βάζουμε προσωπικά
με όποιον έτυχε να πάρει σύνταξη στα 50 ή να προσελήφθη σε μία ΔΕΚΟ χωρίς ιδιαίτερα προσόντα.
Πηγαίνετε λίγο πίσω, όχι και πολύ πίσω, και σκεφθείτε πώς δούλευε το σύστημα. Ενας Ελληνας
πολίτης τελείωνε μια σχολή και είχε τη βεβαιότητα ότι θα προσληφθεί στο Δημόσιο, γιατί «έτσι
γινόταν». Ο άνθρωπος δεν είχε ιδέα ούτε για τη... δυναμική του χρέους ούτε για τίποτε άλλο.
Ακολουθούσε πιστά τους κανόνες και τις παραδόσεις μιας κοινωνίας και ενός πολιτικού συστήματος.
Αίφνης, ο εν λόγω άνθρωπος νιώθει ότι έχασε το έδαφος κάτω από τα πόδια του. Εχει κάνει τους
λογαριασμούς του και τα κουμάντα του με βάση την αρχική «σύμβαση» με το πολιτικό σύστημα.
Ηταν βέβαιος ότι θα έχει μια αξιοπρεπή σύνταξη, ότι θα μπορεί να πληρώνει τα φροντιστήρια των
παιδιών του και τα κοινόχρηστα, χωρίς να σκέφτεται πότε θα ανάψει το καλοριφέρ. Υπάρχουν
βεβαίως και οι εξαιρέσεις, όπως οι 50άρηδες συνταξιούχοι ΔΕΚΟ με μεγάλη σύνταξη που δουλεύουν
και σε μια «μαύρη» εργασία... Δεν είναι όμως η πλειοψηφία. Είναι λάθος να δαιμονοποιούμε αυτούς
τους ανθρώπους επειδή βρήκαν μια δουλειά - όπως έκανε και ο υπόλοιπος κόσμος.
Exercise 2. XLFG: https://signes.bordeaux.inria.fr/xlfg5/index.php
Tutorial1. Getting familiar with XLFG.
7. References
Δήμητρα Θεοφανοπούλου-Κοντού. 1989. Μετασχηματιστική Σύνταξη. Από την θεωρία στην πράξη.
Αθήνα: Εκδόσεις Καρδαμίτσα
Dalrymple, Mary. 2002. Syntax and Semantics 34: Lexical Functional Grammar. Academic Press
5
Download