Υπολογιστικό μορφολογικό και συντακτικό λεξικό της Νέας Ελληνικής
Τίτλος
Υπολογιστικό μορφολογικό και συντακτικό λεξικό της Νέας Ελληνικής
Φορέας
Ινστιτούτο Επεξεργασίας Λόγου / Ε.Κ."Αθηνά"
Εναλλακτικός Τίτλος
English : Computational morphological and syntactic lexicon of Modern Greek
Περιγραφή
Greek : ο υπολογιστικό Μορφολογικό και συντακτικό Λεξικό της Νέας Ελληνικής που αναπτύχθηκε από το ΙΕΛ/Ε.Κ. "Αθηνά" στο πλαίσιο του προγράμματος LE-PAROLE, προορίζεται να χρησιμοποιηθεί σε εφαρμογές Γλωσσικής Τεχνολογίας. Περιλαμβάνει 20.149 λήμματα κωδικοποιημένα σε μορφολογικό και συντακτικό επίπεδο, σύμφωνα με το μοντέλο PAROLE, που βασίζεται στα διεθνή γλωσσολογικά πρότυπα. Με το ίδιο μοντέλο έχουν αναπτυχθεί λεξικά για 11 ακόμη ευρωπαϊκές γλώσσες (Αγγλικά, Γαλλικά, Γερμανικά, Δανικά, Ισπανικά, Ιταλικά, Καταλανικά, Ολλανδικά, Πορτογαλικά, Σουηδικά, Φινλανδικά). Τα λεξικά δεδομένα είναι διαθέσιμα σε μορφή SGML, όπως ορίζεται από ένα κοινό DTD για όλες τις γλώσσες. Περιεχόμενα λεξικού Για την επιλογή των 20.000 λημμάτων που περιλαμβάνονται στο λεξικό ακολουθήθηκε μια υβριδική διαδικασία: στατιστική επεξεργασία ενός Σώματος Κειμένων 9.000.000 λέξεων περίπου, με στόχο τον εντοπισμό των συχνότερων λημμάτων, επεξεργασία του καταλόγου των συχνότερων λημμάτων με βάση γλωσσολογικά κριτήρια. Πιο συγκεκριμένα, το λεξικό περιλαμβάνει: 20.149 μορφολογικές μονάδες, και 25.092 συντακτικές μονάδες. Στο μορφολογικό επίπεδο, τα λήμματα φέρουν πληροφορίες λημματολογίου (π.χ. σύνδεση με άλλα λήμματα, ορθογραφικές εκδοχές, κτλ.) και πληροφορίες μορφολογίας (γραμματική κατηγορία και υποκατηγορία, κλιτικό παράδειγμα, θέματα). Στο επόμενο επίπεδο, κωδικοποιείται, με τη μορφή συντακτικών μονάδων, η συντακτική συμπεριφορά του λήμματος: κωδικοποιούνται, δηλαδή, τα συμπληρώματα με τα οποία συντάσσεται ένα λήμμα, καθώς και τα χαρακτηριστικά που απαιτούνται για τον χαρακτηρισμό και την αναγνώριση των συμπληρωμάτων αυτών (π.χ. αν πρόκειται για υποκείμενο - ουσιαστικό σε πτώση ονομαστική, κτλ.).
English : The Computational morphological and syntactic lexicon of Modern Greek, which has been developed by ILSP / R.C. "Athena" in the framework of the LE-PAROLE project, can be used in Human Language Technology applications. It consists of 20,149 lemmas containing morphological and syntactic information, according to the PAROLE model, which has been based on international linguistic standards. This project caters for the compilation of lexicons for 12 European languages (Catalan, Danish, Dutch, English, Finnish, French, German, Greek, Italian, Portuguese, Spanish, Swedish). The lexicons are in SGML format, following a common DTD for all languages. Lexicon contents The selection of the 20,000 lemmas has been based on a hybrid approach: statistical processing of a corpus of ca. 9,000,000 words in order to identify the most frequent lemmas, processing of the list of the most frequent lemmas according to linguistic criteria. More specifically, the lexicon includes 20,149 morphological units, and 25,092 syntactic units. At the morphological level, lemmas encode information with regard to their relation with other lemmas, spelling variations, etc., as well as information concerning their grammatical category (Part of Speech), and their inflection (inflectional paradigm, stems). At the next level, syntactic units are used to encode the syntactic behaviour of a lemma: i.e. the complements a lemma selects, as well as the features required for the characterisation and identification of these complements (e.g. whether it is a subject - noun in nominative case, etc.)
Θέματα
Γλωσσολογία, Υπολογιστική γλωσσολογία, Γλωσσικοί πόροι, Λεξικά, Λεξικογραφία, Λεξικολογία, Μορφολογία, Σύνταξη,
Τελευταία τροποποίηση
2021-03-20 22:35:50
Μέγεθος
20,149 λήμματα
Γλώσσα
Ελληνικά, Νέα (1453-)
Τύπος τεκμηρίων
Σύνολο Δεδομένων : βάσεις δεδομένων
Τύπος συλλογής
Ψηφιακή
Σχήμα μεταδεδομένων
ΔΕΝ ΔΙΑΘΕΤΕΙ ΣΧΗΜΑ ΜΕΤΑΔΕΔΟΜΕΝΩΝ
Δικαιώματα ιδιοκτησίας και κατοχής
Ο φορέας έχει πλήρη δικαιώματα στο συγκεκριμένο εργαλείο και τα δεδομένα του.
Δικαιώματα Creative Commons
Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή CC BY-NC-SA
Δικαιώματα πρόσβασης - αδειοδότησης
Ο χρήστης μπορεί να αποκτήσει πρόσβαση στο υλικό κατόπιν επικοινωνίας με το φορέα.
Τόπος | Συντεταγμένες |
---|---|
Ελλάδα | 39.63722, 22.42028 |
Περίοδος | Από | Έως |
---|---|---|
Νεότερη και σύγχρονη περίοδος | 19ος αι. μ.Χ. | 21ος αι. μ.Χ. |
Aνήκει/ είναι μέρος της : Προϊόντα - Γλωσσική Εκπαίδευση
Aνήκει/ είναι μέρος της : Προϊόντα - Γλωσσική Εκπαίδευση
URL ψηφιακής συλλογής
Είναι προσβάσιμη μέσω: http://www.ilsp.gr/el/services-products/langresources/item/31-morfologikolexiko