Image

Τίτα Κυριακοπούλου

Η Τίτα Κυριακοπούλου είναι Διευθύντρια του Ινστιτούτου Gaspard Monge στο Πανεπιστήμιο Gustave Eiffel της Γαλλίας (2021), Καθηγήτρια στο ομώνυμο πανεπιστήμιο και μέλος του ερευνητικού εργαστηρίου Gaspard Monge (LIGM). Είναι Αναπληρώτρια Καθηγήτρια Υπολογιστικής Γλωσσολογίας στο Τμήμα Γαλλικής Γλώσσας και Φιλολογίας του Αριστοτελείου Πανεπιστημίου Θεσσαλονίκης.

Από το 2003 έχει λάβει μεταδιδακτορικό τίτλο υφηγεσίας  (Habilitation à diriger des recherches) από το Πανεπιστήμιο Marne-la-Vallée, με θέμα «Analyse automatique des textes écrits : le cas du grec moderne».

Τα ερευνητικά της ενδιαφέροντα αφορούν την επεξεργασία φυσικής γλώσσας, τους γλωσσικούς πόρους, την ανάπτυξη ηλεκτρονικών λεξικών και λεξικών-γραμματικών, την εξόρυξη πληροφορίας, τις ονοματικές οντότητες, την αυτόματη συντακτική ανάλυση φυσικής γλώσσας, τις γραμματικές εξάλειψης αμφισημιών, την ανάλυση σωμάτων κειμένων, την εξάλειψη λεξιλογικής αμφισημίας, την ορολογία και την αντιστοίχιση κειμένων.

Έχει λάβει Δίπλωμα Ευρεσιτεχνίας από κοινού με τους Martinez, C. (75%), Kyriacopoulou, T. (10%), Martineau, C., (10%), Schoen, A. (5%). (2022). United States Patent and Trademark Office (10%) – Noise-tolerant information extraction.

Έχει εκδώσει τα βιβλία:

  1. Τάντος, Α., Μαρκαντωνάτου, Σ., Αναστασιάδη-Συμεωνίδη, Ά., & Κυριακοπούλου, Π. (2015). Υπολογιστική γλωσσολογία [Προπτυχιακό εγχειρίδιο]. Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. https://hdl.handle.net/11419/2205 
  2. Kyriacopoulou, T. (2005). « L’analyse automatique des textes écrits : le cas du grec moderne », Δημοσίευση της μεταδιδακτορικής έρευνας HDR, Thessaloniki : University Studio Press.
Μετάφραση, Μηχανική Μετάφραση (ΜΑ), Επεξεργασία Φυσικής Γλώσσας (ΕΦΓ) Μηχανική Μάθηση... και μετά;

Μέχρι τις αρχές της δεκαετίας του 1990 η μετάφραση εξελίχθηκε και ενισχύθηκε σημαντικά με τα ψηφιακά εργαλεία, τις ορολογικές βάσεις δεδομένων (όπως η IATE) και φυσικά το διαδίκτυο. Στη συνέχεια η εμφάνιση των συστημάτων μεταφραστικών μνημών έφερε την επανάσταση στον τομέα αυτό και επαναπροσδιόρισε το ρόλο του μεταφραστή σε «επιμελητή», διευθυντή έργου, ειδικό επιτόπιας προσαρμογής και υπεύθυνο ποιότητας. Παράλληλα, οι μεταφραστικές μνήμες εμπλουτίζονται συνεχώς με πολύγλωσσα δεδομένα τα οποία μεταφράζονται ή/και επικυρώνονται από ειδικούς εξασφαλίζοντας έτσι την ποιότητά τους.

Σε ό,τι αφορά την ΕΦΓ - πεδίο που ασχολείται κυρίως με την κατανόηση, τη μετάφραση και την παραγωγή φυσικής γλώσσας και τη γλωσσολογία - οι ερευνητές ανέπτυξαν σύνθετα και ιδιαίτερα εξελιγμένα πρότυπα τα οποία συχνά ενσωματώνουν πολύπλοκα θεωρητικά μοντέλα. Στη συνέχεια έκαναν την εμφάνισή τους οι στατιστικές προσεγγίσεις, οι οποίες επωφελούνται από την αυξανόμενη διαθεσιμότητα δεδομένων. Ταυτόχρονα τα συστήματα αυτόματης μετάφρασης συνεχίζουν να εντυπωσιάζουν με τις επιδόσεις τους. Βέβαια, ενώ η επίλυση αμφισημιών συνεχίζει να αποτελεί σημαντική πρόκληση, προχωρούμε στην αυτόματη εξαγωγή πληροφοριών, όπως, για παράδειγμα, εκείνων από τις ονομαστικές οντότητες.

Παρόλα αυτά, δεδομένης της πληθώρας των διαθέσιμων -- και συχνά πολύγλωσσων -- δεδομένων διαφορετικών ειδών, όπως είναι τα ηλεκτρονικά μηνύματα, τα SMS, τα tweets, τα σχόλια στο Facebook, οι τηλεφωνικές κλήσεις, τα τεχνικά κείμενα κ.λπ., προκύπτει η ανάγκη για κάποιο στάδιο κανονικοποίησης προκειμένου να γίνει δυνατή η εφαρμογή ομοιόμορφης επεξεργασίας.

Κατά τη διάρκεια αυτής της παρουσίασης θα επιδιώξουμε να εξερευνήσουμε ένα τέτοιο στάδιο μέσω συγκεκριμένων παραδειγμάτων.

ΒΙΒΛΙΟΓΡΑΦΙΑ

  • Boughzala Y., Moscarola J. et Hervé M. (2014). Sphinx Quali: un nouvel outil d’analyses textuelles et sémantiques. In Proceedings des 12èmes Journées internationales d’analyse statistique des Données Textuelles (JADT 2014).
  • Devlin J., Chang M.W., Lee K. and Toutanova K. 2018. Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805
  • Abry P., Gournay L., Jaffard S., Leonarduzzi R., Martineau C., Martinez C., Kyriacopoulou T. and Wendt H. (2017), P-leader multifractal analysis for text type identification (en collaboration). In 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, New Orleans, United States, March 2017.
  • Ruoyu Z., Yanzeng Li, Yongliang Ma, Ming Zh. and Lei Zu. (2023). LLMAAA: Making Large Language Models as Active Annotators. In Findings of the Association for Computational Linguistics: EMNLP 2023, pp. 13088–13103. Association for Computational Linguistics.