Βελτίωση ποιότητας συνθετικής ομιλίας μέσω προσωδιακών χαρακτηριστικών

Περίληψη

Η διατριβή αυτή εξετάζει το πρόβλημα της βελτίωσης ποιότητας συνθετικής ομιλίας από απλά και ήδη εμπλουτισμένα κείμενα, όπως αυτά που παράγονται από μια Γεννήτρια Φυσικής Γλώσσας κατά τη Μετατροπή Κειμένου σε Ομιλία. Παρουσιάζεται η έρευνα για το μείζον πρόβλημα της έλλειψης γνώσης για την ανάδειξη, αναγνώριση και καταχώρηση προσωδιακών χαρακτηριστικών από εμπλουτισμένα κείμενα, την αναπαράσταση των γλωσσολογικών αυτών μετα-πληροφοριών με τη μορφή επισημειώσεων σε κείμενα και το φορμαλισμό των πληροφοριών για προσωδιακά χαρακτηριστικά ως προς την χρησιμότητα αυτών ως προς τη σύνθεση ομιλίας, καθώς και τη σχεδίαση μίας γενικής μεθοδολογίας και υλοποίηση ανοικτών και επεκτάσιμων εργαλείων και πόρων για την αυτόματη επισημείωση εγγράφων κειμένων απλών (plain text) και μερικώς ή πλήρως επισημειωμένων, είτε αυτά προϋπάρχουν είτε παράγονται από Γεννήτρια Φυσικής Γλώσσας.Ως αποτέλεσμα της έρευνας αυτής παρουσιάστηκαν ο καθορισμός και η κατάταξη των γλωσσολογικών εκείνων στοιχείων, πέρα των γρ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

Previous works show that Natural Language Generators may produce linguistically enriched text description that can lead to significantly improved quality of speech synthesis. There are cases, however, where either the generator modules produce pieces of non-analyzed, non-annotated plain text, or such modules are not available at all. Moreover, the language analysis is restricted by the usually limited domain coverage of the generator. For those cases the enriched input to the speech synthesizer needs to be produced from plain text in order to maintain speech quality. This work reports on a framework of several combined language resources and procedures (word/sentence identification, syntactic analysis, prosodic feature annotation) for text annotation/processing from plain text. Using that, the implementation of an automatic XML formatted output generation module produces enriched prosodic markup for English and Greek texts. Visiting the domain of visual documents and accessibility, vis ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/33341
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/33341
ND
33341
Εναλλακτικός τίτλος
Language analysis and prosodic feature annotation for high quality speech synthesis
Συγγραφέας
Σπηλιωτόπουλος, Δημήτριος (Πατρώνυμο: Εμμανουήλ)
Ημερομηνία
2009
Ίδρυμα
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών (ΕΚΠΑ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής και Τηλεπικοινωνιών
Εξεταστική επιτροπή
Κουρουπέτρογλου Γεώργιος
Θεοδωρίδης Σέργιος
Σπυρόπουλος Κωνσταντίνος
Φακωτάκης Νικόλαος
Καλουπτσίδης Νικόλαος
Γρηγοριάδου Μαρία
Καραμπογιάς Σεραφείμ
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Λέξεις-κλειδιά
Προσωδία; Προσβασιμότητα; Σύνθεση φωνής; Επικοινωνία ανθρώπου-υπολογιστή
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά
Άλλα στοιχεία
125 σ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)