Υπολογιστική Γλωσσολογία


Διδάσκοντες

Αναπλ. Καθ/τρια Μαρία Γρηγοριάδου (gregor@di.uoa.gr)

Χάρης Κορνιλάκης ()

Πηνελόπη Λεμπέση (lembepe@hotmail.com)

Η Παράδοση της εργασίας παίρνει παράταση μιας εβδομάδας μέχρι τις 25/2/2005

Τελικά Αποτελέσματα Μαθήματος

Ώρες Διδασκαλίας

Κάθε Τετάρτη 15:15-18:00, Αίθουσα Η', Τμήμα Πληροφορικής & Τηλ/νιών

Περιεχόμενο Μαθήματος

Εισαγωγή στην Υπολογιστική Γλωσσολογία
Εισαγωγή στη Μορφολογία (Θεωρητική & Υπολογιστική)
Κανονικές Εκφράσεις (Regular Expressions/RE)
Αυτόματα Πεπερασμένων Καταστάσεων (Finite State Automata/FSA)
Φωνολογικοί Κανόνες & Finite State Transducers
Εισαγωγή στη perl
Γλωσσολογία Σωμάτων Κειμένων (Corpus Linguistics)
N-grams
Aναγνώριση Γραμματικής Κατηγορίας (POS Tagging)
Υπολογιστική Λεξικογραφία
Μηχανική Μετάφραση
Parsing & Γραμματικές ανεξάρτητες από τα συμφραζόμενα
Ενοποιητικές Γραμματικές
Σημασιολογία Λέξεων (Lexical Semantics)
Σημασιολογικό Λεξικό Wordnet
'Αρση Σημασιολογικής Αμφισημίας (Word Sense Disambiguation) και Ανάκτηση Πληροφορίας

Διαδικαστικά Μαθήματος

Η βαθμολογία του μαθήματος θα υπολογιστεί ως εξής:
Τελική Βαθμολογία = Max(Βαθμού Εργασίας, Βαθμού Εξετάσεων)*0.6 + Min(Βαθμού Εργασίας, Βαθμού Εξετάσεων)*0.4

Προτεινόμενες Εργασίες Μαθήματος

Δηλώσεις Εργασιών

Σημειώσεις Μαθήματος

Οι σημειώσεις του μαθήματος είναι κομμάτια από το βιβλίο των Jurafsky & Martin (βλ. Βιβλιογραφία).
Οι σημειώσεις βρίσκονται στο φωτοτυπείο "Copy Factory", Γρ. Κουσίδου 87, Ζωγράφου. Στο φωτοτυπείο έχουν κρατήσει αντίγραφο ολόκληρου του βιβλίου. Στα πλαίσια του μαθήματος χρειάζονται μόνο οι σελίδες 21-90, 191-234, 287-446 (Κεφάλαια 2,3,6,8,9,10,11). Όποιος επιθυμεί μπορεί να πάρει όλο το βιβλίο βιβλιοδετημένο (35 ευρώ) ή να πάρει κάποια συγκεκριμένα επιπλέον κεφάλαια που τον ενδιαφέρουν (Πίνακας περιεχομένων βιβλίου).
Σημείωση: Απο το φωτοτυπείο ζητήσαν οποιος θέλει να πάει να πάρει τις σημειώσεις να τους κάνει πρώτα ένα τηλέφωνο στα 210 7782394 ή 210 7717730, ώστε να προλάβουν να τις ετοιμάσουν.

Διαλέξεις

6-10-04: Εισαγωγή στην Υπολογιστική Γλωσσολογία και Ιστορική Ανασκόπηση.
Διαφάνειες 1 Διαφάνειες 2

13-10-04: Εισαγωγή στη Θεωρητική & Υπολογιστική Μορφολογία
Διαφάνειες

20-10-04: Κανονικές Εκφράσεις και Αυτόματα Πεπερασμένων Καταστάσεων
Διαφάνειες

03-11-04: Μορφολογικό Parsing και Transducers Πεπερασμένων Καταστάσεων
Διαφάνειες
Εισαγωγή στο σημασιολογικό λεξικό WordNet και στο ερευνητικό πρόγραμμα BalkaNet
Διαφάνειες

10-11-04: Γλωσσολογία Σωμάτων Κειμένου
Διαφάνειες

24-11-04: N-grams και Aναγνώριση Γραμματικής Κατηγορίας (POS Tagging)
Διαφάνειες

01-12-04: Υπολογιστική Λεξικογραφία
Διαφάνειες

08-12-04: Parsing & Γραμματικές ανεξάρτητες από τα συμφραζόμενα
Διαφάνειες

15-12-04: Σημασιολογία και λογική 1ης τάξης
Διαφάνειες

22-12-04: Ενοποίηση, Ενοποιητικές και Πιθανοτικές Γραμματικές
Διαφάνειες

12-01-05: Μηχανική Μετάφραση
Διαφάνειες

Βιβλιογραφία και Σύνδεσμοι

Jurafsky, Daniel and Martin, James H. Speech and Language Processing. Prentice-Hall. 2000.

Manning, Christopher D. and Hinrich Schutze. Foundations of Statistical Natural Language Processing. MIT Press. 2000.

James Allen. Natural Language Understanding. Benjamin Cummings. 1987.

Roland Hausser. Foundations of Computational Linguistics. Man-Machine Communication in Natural Language. Springer-Verlang. 1999.

Εισαγωγικό βιβλίο Perl.

Δωρεάν Έκδοση της Perl

Natural Language Toolkit: Εργαλεία για επεξεργασία φυσικής γλώσσας

Εργαλεία υπολογιστικής γλωσσολογίας (χρειάζεται password)