Διάκριση ερευνητών του ΙΤΕ στον τομέα επεξεργασίας ήχου

Ανέπτυξαν σύστημα που βελτιώνει την αντίληψη λόγου σε θορυβώδη περιβάλλοντα

01·06·2013 06:24

Ερευνητές του Ιδρύματος Τεχνολογίας Έρευνας (ΙΤΕ) διακρίθηκαν για την ανάπτυξη ενός συστήματος επεξεργασίας ήχου που βελτιώνει την αντίληψη λόγου σε θορυβώδη περιβάλλοντα.

Σε πρόσφατη αξιολόγηση συστημάτων επεξεργασίας σημάτων φωνής σε θορυβώδη περιβάλλοντα, το σύστημα Spectral Shaping Dynamic Range Compression (SSRDC) διακρίθηκε και κατέλαβε την πρώτη θέση ανάμεσα σε είκοσι επτά άλλα συστήματα ιδίου σκοπού ενώ κρίθηκε άριστο για τις περισσότερες περιπτώσεις θορύβου που εξετάστηκε όπως ανακοινώθηκε σήμερα από το Ινστιτούτο Πληροφορικής του ΙΤΕ στο Ηράκλειο.

Σύμφωνα με το ΑΠΕ-ΜΠΕ, τα αποτελέσματα χρήσης του δείχνουν, ότι η κατανόηση λόγου μπορεί να αυξηθεί σημαντικά (πάνω από 35%), χωρίς να χρειαστεί να μεγαλώσει αντίστοιχα η ένταση της φωνής για να καλυφτεί ο περιβαλλοντικός θόρυβος. Τα επίσημα αποτελέσματα των αξιολογήσεων αναμένεται να ανακοινωθούν στο διεθνές συνέδριο Interspeech 2013, τον Αύγουστο του 2013, στη Λιόν της Γαλλίας.

Όπως αναφέρει το Ινστιτούτο Πληροφορικής του ΙΤΕ σύμφωνα με τον Παγκόσμιο Οργανισμό Υγείας, ο περιβαλλοντικός θόρυβος που υπάρχει καθημερινά τριγύρω μας υποβαθμίζει σημαντικά την ποιότητα της ζωής μας. Η ανθρώπινη φωνή συγκαταλέγεται στους θορυβοποιούς παράγοντες, όταν στην προσπάθειά της να «ακουστεί», να γίνει αντιληπτός ο λόγος, αυξάνει δραματικά την έντασή της. Τέτοια παραδείγματα είναι οι εκκωφαντικές ανακοινώσεις σε δημόσιους χώρους (σταθμοί τρένων, αεροδρόμια, κτλ.).

Ερευνητές του Ινστιτούτου Πληροφορικής του Ιδρύματος Τεχνολογίας και Έρευνας (ΙΤΕ), στο Ηράκλειο της Κρήτης, απέδειξαν, ότι αρκεί να γίνει κατάλληλη επεξεργασία του σήματος της φωνής, έτσι ώστε οι «ευάλωτες» στον θόρυβο περιοχές της να προστατευθούν ανάλογα.

Πιο συγκεκριμένα, προτείνουν πρωτοποριακές τεχνικές ανακατανομής της ενέργειας της φωνής στο χρόνο και στη συχνότητα: Στον χώρο του χρόνου, τα τμήματα της φωνής με τη χαμηλή ενέργεια ενισχύονται, ενώ τα αντίστοιχα με υψηλή ενέργεια αποδυναμώνονται. Έτσι, στις περισσότερες περιπτώσεις το επίπεδο του σήματος της φωνής είναι πάνω από το επίπεδο του θορύβου. Επιπλέον, μια δεύτερη ανακατανομή της ενέργειας του σήματος στο χώρο των συχνοτήτων εφαρμόζεται, η οποία μιμείται την τακτική που οι άνθρωποι χρησιμοποιούν ώστε να γίνονται καταληπτοί από τους συνομιλητές τους σε θορυβώδη περιβάλλοντα. Οι ιδέες αυτές υλοποιήθηκαν σε ένα σύστημα: το SSRDC (Spectral Shaping Dynamic Range Compression), χρησιμοποιώντας ηχογραφήσεις ομιλητών σε θορυβώδη περιβάλλοντα.

Το σύστημα αυτό, σύμφωνα με το ΙΤΕ, ήδη χρησιμοποιείται ερευνητικά και εξετάζεται η χρησιμότητά του σε ειδικές κατηγορίες πολιτών, όπως είναι οι περιπτώσεις ατόμων με προβλήματα ακοής. Το SSDRC αναμένεται να χρησιμοποιηθεί σε μια σειρά από τεχνολογίες (συστήματα πλοήγησης αυτοκινήτου -GPS-, τηλέφωνο, τηλεόραση, βιντεοπαιχνίδια), καθώς και σε δημόσιους χώρους (αεροδρόμια, σιδηροδρομικούς σταθμούς κλπ.).

Τέλος σύμφωνα με το ΙΤΕ η υλοποίηση του SSDRC έγινε κατά την εκτέλεση του ερευνητικού προγράμματος: «The Listening Talker», το οποίο χρηματοδοτήθηκε από την Ευρωπαϊκή Ένωση, κατά την τριετία 2010-2013, και στο οποίο συμμετείχαν ερευνητικοί οργανισμοί από την Ισπανία, την Αγγλία, τη Σουηδία και την Ελλάδα.