Υπολογιστικό λεξικό PAROLE

Τίτλος

Υπολογιστικό λεξικό PAROLE

Φορέας

Ινστιτούτο Επεξεργασίας Λόγου / Ε.Κ."Αθηνά"

Εναλλακτικός Τίτλος

English : PAROLE Greek Lexicon

Περιγραφή

Greek : Το Υπολογιστικό λεξικό PAROLE διατίθεται μέσω της ELRA, ενός μη κερδοσκοπικού που αποτελεί τον Ευρωπαϊκό Σύνδεσμο Γλωσσικών Πόρων. Το λεξικό αποτελείται από δύο επίπεδα: μορφολογικό και συντακτικό, και περιέχει τις συχνότερες λέξεις που εντοπίστηκαν σε ένα σώμα κειμένων 9.000.000 λέξεων, το οποίο κωδικοποιήθηκε σύμφωνα με το διεθνές πρότυπο PAROLE. Το μορφολογικό επίπεδο περιέχει 20.149 μορφολογικές μονάδες, από τις οποίες 12.042 ουσιαστικά (κοινά και κύρια), 3.014 ρήματα, 3.405 επίθετα, 106 αριθμητικά, 45 αντωνυμίες, 2 άρθρα, 1.396 επιρρήματα, 48 προθέσεις, 51 σύνδεσμοι, 21 επιφωνήματα και 19 μονάδες “μοναδικών” κατηγοριών. Το συντακτικό επίπεδο περιέχει 25.092 συντακτικές μονάδες, από τις οποίες 14.548 ουσιαστικά 5.397 ρήματα, 3.558 επίθετα, 1.410 επιρρήματα, 73 προθέσεις και 106 εριθμητικά. Το λεξικό δημιουργήθηκε με βάση τις ακόλουθες πηγές: το μονόγλωσσο μορφολογικό λεξικό του ΙΕΛ το σώμα κειμένων του ΙΕΛ.

English : The PAROLE Greek Lexicon is distributed through the European Language Resources Association (ELRA). It has two layers, morphological and syntactic and includes the most frequent words found in a 9 million word corpus, coded according to the PAROLE specifications. The Morphological layer contains a total of 20,149 Morphological units, of which 12,042 are nouns (common and proper), 3,014 verbs, 3,405 adjectives, 106 numerals, 45 pronouns, 2 articles, 1,396 adverbs, 48 adpositions, 51 conjunctions, 21 interjections, 19 "unique" categories. The Syntactic layer contains 25,092 Syntactic units, of which 14,548 are nouns, 5,397 verbs, 3,558 adjectives, 1,410 adverbs, 73 adpositions and 106 numerals. This lexicon was constructed based on the following resources: the ILSP Morphological Lexicon the ILSP Corpus.

Θέματα

Ελληνική γλώσσα, Γλωσσολογία, Σώματα κειμένων, Σωματοκειμενική γλωσσολογία,

Τελευταία τροποποίηση

2021-03-20 21:03:20

Μέγεθος

9000000 λέξεις

Γλώσσα

Ελληνικά, Νέα (1453-)

Τύπος τεκμηρίων

Σύνολο Δεδομένων : βάσεις δεδομένων

Τύπος συλλογής

Ψηφιακή

Σχήμα μεταδεδομένων

ΔΕΝ ΔΙΑΘΕΤΕΙ ΣΧΗΜΑ ΜΕΤΑΔΕΔΟΜΕΝΩΝ

Δικαιώματα ιδιοκτησίας και κατοχής

Ο φορέας έχει πλήρη δικαιώματα στο γραπτό υλικό του σώματος κειμένων.

Δικαιώματα πρόσβασης - αδειοδότησης

Ο χρήστης έχει δικαιώματα πρόσβασης μετά από πληρωμή συνδρομής.

Τόπος Συντεταγμένες
Ελλάδα 39.63722, 22.42028
Περίοδος Από Έως
Νεότερη και σύγχρονη περίοδος 19ος αι. μ.Χ. 21ος αι. μ.Χ.

Aνήκει/ είναι μέρος της : Προϊόντα - Γλωσσική Εκπαίδευση

Aνήκει/ είναι μέρος της : Προϊόντα - Γλωσσική Εκπαίδευση

URL ψηφιακής συλλογής

Είναι προσβάσιμη μέσω: http://catalogue.elra.info/en-us/repository/browse/ELRA-L0032/