|
|
ArcAdiA >
Tipologia di Documenti >
T - Tesi di dottorato >
Please use this identifier to cite or link to this item:
http://hdl.handle.net/2307/501
|
| Title: | Audio Digital Signal Processing: techniques and applications |
| Authors: | Belardinelli, Carlo |
| Tutor: | Giunta, Gaetano |
| Issue Date: | 3-Apr-2009 |
| Publisher: | Università degli studi Roma Tre |
| Abstract: | Dottorato in Ingegneria dell'Elettronica Biomedica, dell'Elettromagnetismo e
delle Telecomunicazioni (XXI Ciclo)
Università di Roma3
Rome, Italy
Audio Digital Signal
Processing: techniques
and applications
Carlo Belardinelli
Tutor Professor Gaetano Giunta
Abstract
In questa tesi viene descritta la mia attività di ricerca durante il corso di dottorato in Elaborazione
Elettronica del Segnale Audio. Durante questi tre anni ho sviluppato il quadro di riferimento teorico
in questo ambito e realizzando poi diverse applicazioni pratiche che vengono riportate in dettaglio
nei capitoli seguenti dopo un'introduzione generale (Capitolo II). In particolare sono stati sviluppati
i concetti seguenti:
Nel terzo capitolo viene presentato un sistema di marchiatura digitale audio che permette
la valutazione della qualità di una trasmissione in sistemi di comunicazione di terza
generazione senza influire sul payload dei contenuti inviati né tantomeno peggiorare la
qualità dei contenuti musicali trasmessi, sviluppato durante il primo anno di corso presso
il dipartimento di Elettronica Applicata dell'Università di RomaTre: i risultati raggiunti
confermano l'efficacia del sistema che ne permette l'applicazione in sistemi di
comunicazione radio mobile di terza generazione (UMTS) e internet WIFI (IEEE 802.11).
In particolare un watermark fragile viene inserito tramite tecniche spread-spectrum nel
dominio DCT all'interno della regione delle frequenze medio-alte dei frame del segnale
musicale. Il principio base dell'idea consiste nell'ipotesi che poiché marchio e segnale
audio marchiato sono entrambi sottoposti alle stesse operazioni di codifica/decodifica e
viaggiano sullo stesso canale di trasmissione, il livello di degradazione del watermark
dopo la ricezione è supposto essere proporzionale al livello di deteriorazione subita dal
segnale audio stesso. In ricezione è infatti a disposizione la versione originale del
marchio (avente un payload trascurabile): una volta estratti i wateramrk ricevuti dai frame
del segnale audio, questi vengono mediati di modo da ottenere un'unica versione del
marchio ricostruito che puo' essere utilizzato come riferimento per il calcolo del QoS
(Quality of Service) della trasmissione.
Infatti, mentre l'uso del PEAQ (Perceptual Evaluation of Audio Quality, standard ITU
BS-1387) è stato utilizzato per provare l'effettiva completa trasparenza del marchio
all'udito umano, i risultati delle sperimentazioni testimoniano la sensibilità del sistema di
marchiatura fragile proposto nell'ottenere una stima blind della bontà della
comunicazione: l'errore quadratico medio del marchio (MSE), difatti, non solo si rivela
essere proporzionale al numero di errori introdotti dal canale, ma é strettamente
proporzionale all'errore quadratico medio del segnale audio rivevuto in cui é stato
inserito.
Nel periodo da visiting student presso il Signal Processing Lab della University of
Cambridge (UK), ho implementato e verificato le prestazioni di un Phase Vocoder
Probabilistico applicato alla ricostruzione dei campioni andati perduti all'interno di un file
musicale. Nel quarto capitolo viene illustrato come questa applicazione abbia prestazioni
incoraggianti per quel che riguarda la stima di informazioni musicali a contenuto
informativo residuo nullo tramite strumenti di calcolo probabilistico-bayesiani.
Dopo aver utilizzato il Phase Vocoder come modello generativo del segnale audio, viene
definita la versione stocastica dello spazio di stato. Il Phase Vocoder Probabilistico
permette l'applicazione di un filtraggio di Kalman e di uno smoothing secondo le
equazioni di Rauch-Tung-Striebel. L'algoritmo di Expectation Maximization permette la
derivazione di una procedura ricorsiva che permette infine di stimare iterativamente i
parametri del suddetto spazio di stato che meglio approssimano i campioni mancanti
tramite maximum likelihood.
Infine presso il Fraunhofer Institut di Magdeburg in Germania ho sviluppato le ricerche
sul tema "Interaction of Sound in Virtual Reality". In questo contesto:
o Ho sviluppato e testato la funzione audio della piattaforma grafica per realtà
virtuale, elaborata dal Virtual Development and Training Centre in seno
all'Istituto stesso, che permette in maniera agile di ottenere suoni 3D all'interno di
scenari virtuali (capitolo V).
La core function è implementata utilizzando l'API OpenAL in maniera da rendere
la realizzazione di contesti sonori virtuali, che si integrano con la rispettiva
rappresentazione visiva, intuitiva ma al tempo stesso completa per la creazione e
diffusione tridimensionale del segnale acustico. Per quanto riguarda il punto di
vista dell'usufruitore degli scenari virtuali, la spazializzazione del suono è
implementata in maniera efficace di modo tale che l'elaborazione sonora avviene
real-time anche con hardware non dedicato. L' Audio Core Function permette
innovativi usi del suono in rappresentazioni 3D che sono stati testati tramite
diversi scenari virtuali qui di seguito riportate.
o Ho ideato e implementato il workflow per un plugin che permetta di visualizzare
nello spazio virtuale (in particolare all'interno della Digital Factory) il campo
acustico, simulato in maniera fedele da efficienti strumenti di CAE appositi,
generato da macchinari industriali (capitolo VI).
Il livello di pressione sonora (SPL) viene calcolato in maniera fedele tramite
accurate simulazioni ed elaborati strumenti di calcolo ricorrendo al Boundary e
Finite Element Methods. I valori di SPL ottenuti al termine dell'analisi acustica
possono venire importati facilmente dalla piattaforma di Realtà Virtuale, poiché
vengono salvati in formato altamente editabile. In questo modo é possibilie
verificare in 3 dimensioni la conformità di progetti di nuovi siti industriali alle
norme sulle soglie di rumore in ambienti lavorativi e apportare eventuali
correzioni (applicando anche tecniche di Active Noise Control, ANC), prima che
la fabbrica sia concretamente realizzata.
L'attività di ricerca da me svolta durante il dottorato è stata oggetto di presentazioni in
conferenze internazionali (quali la IEEE European Signal Processing Conference 2006 a Firenze o
l'IEEE Workshop on Application of Signal Processing on Audio and Acoustics 2007 a New Paltz,
New York) e ha mostrato l'efficacia delle tecniche di DSP per quanto riguarda il segnale audio.
Nella società odierna in cui si sovraccaricano i sensi -e quindi anche e soprattutto l'udito- di
contenuti informativi, una migliore gestione del contenuto dell'informazione sonora può dunque
essere una chiave per un progresso che aiuti effettivamente a vivere meglio. ...more |
| URI: | http://hdl.handle.net/2307/501 |
| Appears in Collections: | Dipartimento di Elettronica applicata T - Tesi di dottorato
|
Files in This Item:
| File |
Description |
Size | Format |
| AudioDigitalSignalProcessing,techniquesandapplications.pdf | | 1.39 MB | Adobe PDF | | |
|
This item is protected by original copyright
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|