Course Outline
Επισκόπηση πακέτων Python που σχετίζονται με το NLP
Εισαγωγή στο NLP (παραδείγματα στο Python φυσικά)
Απλή χειραγώγηση κειμένου Αναζήτηση κειμένου Μετρώντας Words Διαχωρισμός κειμένων σε λεξιλογική διασπορά Word
Επεξεργασία πολύπλοκων δομών Αναπαράσταση κειμένου σε λίστες
Λίστες ευρετηρίασηςΣυντοπίσειςBigramsΚατανομές ΣυχνοτήτωνΠροϋποθέσεις με WordsΣύγκριση Words (startswith, endswith, islower, isalpha, κ.λπ...)Κατανόηση φυσικής γλώσσας Word Αποσαφήνιση αίσθησηςΑντωνυμία Ανάλυση
Μηχανικές μεταφράσεις (στατιστικές, βασισμένες σε κανόνες, κυριολεκτικά, κ.λπ...)ΓυμνάσιαNLP στο Python σε παραδείγματα
Πρόσβαση σε σώματα κειμένων και λεξιλογικούς πόρους Κοινές πηγές για σώματα Κατανομές υπό όρους συχνότητα Μετρώντας Words ανά είδος Δημιουργία δικού σώματος Προφορά λεξικού Κουτί παπουτσιών και εργαλειοθήκη Λεξικά Αισθήσεις και συνώνυμα Ιεραρχίες Λεξιλογικές σχέσεις: Μερώνυμα, Ολώνυμα Σημασιολογική ομοιότηταΕπεξεργασία Εκτύπωσης Ακατέργαστου ΚειμένουΚατακόρυφα
Εξαγωγή τμημάτων χορδής
Access μεμονωμένους χαρακτήρες
Searchαντικατάσταση, διαχωρισμός, ένωση, ευρετηρίαση κ.λπ...Χρήση κανονικών εκφράσεωνΑνίχνευση μοτίβων λέξεωνΣτέλεχοςTokenizationΚανονικοποίηση κειμένουWord Τμηματοποίηση (ειδικά στα κινέζικα)Κατηγοριοποίηση και προσθήκη ετικετών σε σώματα με ετικέτα WordΜε ετικέτα TokensΣύνολο ετικετών μέρους του λόγουPython ΛεξικάWords για την αντιστοίχιση Ιδιοτήτων
Αυτόματη προσθήκη ετικετώνΠροσδιορισμός της Κατηγορίας ενός Word (Μορφολογικό, Συντακτικό, Σημασιολογικό)Ταξινόμηση κειμένου (Machine Learning) Εποπτευόμενη ταξινόμησηΤμηματοποίηση προτάσεωνΔιασταυρωμένη επικύρωσηΔέντρα απόφασηςΕξαγωγή πληροφοριών από το Text ChunkingΤσουγκρίζοντας
Ετικέτες εναντίον δέντρωνΑνάλυση Δομής Προτάσεων Ελεύθερη ΓραμματικήΑναλυτέςΔημιουργία γραμματικών χαρακτηριστικών βάσει χαρακτηριστικώνΕπεξεργασία δομών χαρακτηριστικών
Αναλύοντας τη σημασία των προτάσεων Σημασιολογία και ΛογικήΠροτασιακή ΛογικήΛογική πρώτης τάξηςΣημασιολογία Λόγου
Διαχείριση μορφών δεδομένων γλωσσικών δεδομένων (Λεξικό έναντι κειμένου)Μεταδεδομένα