Spraakverstaanbaarheid
description
Transcript of Spraakverstaanbaarheid
VPT 2008 1
Spraakverstaanbaarheid(criteria, normalisatie, subjectieve en objectieve
verstaanbaarheidsmaten, toepassingen en voorspelkracht)
Herman J.M. Steeneken
(www.steeneken.com)
VPT 2008 2
• Kwaliteit van Spraakcommunicatie
• Spraakverstaanbaarheidmaten
• Evaluatiemethoden (subjectief-objectief)
• Voorspellingsmethoden
• Samenvatting
Overzicht
VPT 2008 3
Het communicatiekanaal
VPT 2008 4
Spreker (stem, moedertaal, vocale inspanning)
Transmissiepad (lawaai, akoestiek, vervorming)
Luisteraar (gehoor, moedertaal)
Het communicatiekanaal
VPT 2008 5
Spraakcommunicatiekwaliteit
Spraakwaliteit
Spraakverstaanbaarheid
Vocale inspanning
Objectieve voorspellingsmethoden
VPT 2008 6
Toepassing en criteria (ISO-9921)
Toepassing bij: verst. “vocal effort”
Gevaar en waarschuwing matig luid Persoon-tot-persoon (kritiek) redelijk luid Persoon-tot-persoon (algemeen) goed ontspannen Omroepinstallaties openbaar goed normaal Persoonlijke comm. systemen goed normaal
VPT 2008 7
Evaluatiemethoden
Subjectieve evaluatie• meerdere sprekers en luisteraars• specifieke testmethoden• representatief• resultaten soms niet reproduceerbaar
Objectieve evaluatie• voorspelling van verstaanbaarheid• diagnostisch• reproduceerbaar
VPT 2008 8
Subjectieve evaluatie
• Mean Opinion Scores (korte zinnen)beoordeling op (vijfpuntsschaal), zeer veel ppn.
• Speech Reception Thresholdslechts voorspelling bij 50% zinsverstaanbaarheid
• (Nonsens)woorden in (dragerzin)indirect, groot bereik, arbeidsintensief
VPT 2008 9
Objectieve evaluatiemethoden
• Speech Interference Level (SIL)beperkt tot directe communicatie in lawaai
• Speech Transmission Index (STI)geschikt voor alle soorten vervorming
• Speech Intelligibility Index (SII)geen niet-lineaire en temporele vervorming
VPT 2008 10
Relatie tussen subjectieve en objectieve verstaanbaarheidsmaten
VPT 2008 11
Kwalificatie Sent.% CVC % PB % STI LSA – LLN
nonsens bestaande dBwoorden woorden
Uitstekend 100 >81 > 98 >0.75 21
Goed 100 70-81 93-98 0.60-0.75 15 - 21
Redelijk 100 53-70 80-93 0.45-0.60 9 - 15
Matig 70-100 31-53 60-80 0.30-0.45 3 - 9
Slecht <70 <31 <60 < 0.30 <3
Relatie tussen subjectieve en objectieve verstaanbaarheidsmaten
VPT 2008 12
Demonstratie van vier kwalificaties
Uitstekend SNR = 11 dB
Goed SNR = 5 dB
Redelijk SNR = 1 dB
Matig SNR = - 4 dB
Toegevoegde ruis op basis van het gemiddeldespraakspectrum
VPT 2008 13
Toepassing Verst. SIL STI Vocale inspan.
Alarm Waarschuwing matig 9 0.45 Luid
Persoon-tot-persoon (kritisch) redelijk 9 0.50Luid
Persoon-tot-persoon (ontspan.) goed 15 0.60 Ontspan.
Omroepinstallatie openbaar redelijk 11 0.50 Normaal
Persoonlijke communicatie redelijk 11 0.50 Normaal
Criteria ISO-9921
VPT 2008 14
Voorspellingsmethoden
SIL, vocale inspanning, omgevingslawaai
STI, vocale inspanning, geslacht spreker,omgevingslawaai, bandbreedte-beperking,
maskering, nagalm, echo’s, niet-lineairiteit,(IEC 60268-16)
SII, vocale inspanning, omgevingslawaai,bandbreedte-beperking, maskering,(ANSI 305.2)
VPT 2008 15
Demonstratie van kwalificatie “Redelijk”
Redelijk SNR = 1 dB, (STI = 0,53)geen bandbreedte-beperking
Redelijk SNR = 3 dB, (STI = 0,53)bandbreedte 375 - 5600 Hz
Toegevoegde ruis op basis van het gemiddeldespraakspectrum
VPT 2008 16
Speech Transmission Index (STI)
Gewogen SNR levert voorspelling spraakkwaliteit
VPT 2008 17
Modulatieoverdracht (lijnfrequentie)
VPT 2008 18
Omhullende funktie en spectrum
VPT 2008 19
Omhullende funktie met nagalm en ruis
VPT 2008 20
Modulatieoverdracht (MTF)
De MTF wordt verkregen door de omhullende-spectra van het originele en ontvangen spraaksignaal te vergelijken
VPT 2008 21
Matrix voor zeven MTF’s
1 Hz
X
3 Hz
10 Hz10 Hz
VPT 2008 22
Modulatieoverdracht meten met testsignaal
VPT 2008 23
Berekening STI (Spraak Transmissie Index)
Voor elke octaafband wordt eerst de effectieve SNR bepaald
De gewogen octaaf-bijdrage levert de STI
VPT 2008 24
octave-band centre frequency (Hz)
frequ
ency
-wei
ghtin
g fa
ctor
0.0
0.1
0.2
0.3
0.4
0.5
125 250 500 1k 2k 4k 8k
nonsense syllables (Pavlovic et al. 1984, ANSI S3.5)PB-words (Steeneken et al. 1980, IEC 60268-16)initial consonants (Steeneken, 1992)vowels, (Steeneken, 1992)
Optimale frequentieweging
De bijdrage perfrequentieband hangtaf van het type spraak
VPT 2008 25
Redundante informatie is overbodig!
VPT 2008 26
octave-band centre frequency (Hz)
frequ
ency
-wei
ghtin
g fa
ctor
0.0
0.1
0.2
0.3
0.4
0.5
125 250 500 1k 2k 4k 8k
CVC words male speech female speech
Redundantie in het spraakspectrum
VPT 2008 27
Proefpersonen aan het werk
VPT 2008 28
Proefpersoon responsies
CVC woorden, dragerzin:
versta des overen nu fijs uithet woord zek eindenoteer lal punt
“Semi random” combinatievan:
17 beginmedeklinkers15 klinkers11 eindmedeklinkers
VPT 2008 29
Relatie tussen woordscores en STI
STI r
CV
C-w
ord
scor
e (%
)
1
2
3
4
5
6
78
9
10
11
12
13
14
15
16
17
18
0
20
40
60
80
100
0.0 0.2 0.4 0.6 0.8 1.0
male speech
Relatie STI/CVC-score voor mannelijke spraak en condities met ruis en bandbreedte-beperking
De verticale spreiding bedraagt s.d. 4.8%
VPT 2008 30
STI voor Cabine-omroepinstallatie
VPT 2008 31
Iso STI-contouren in collegezaal
VPT 2008 32
STI als funktie het omgevings-lawaainiveau
Twee condities (met en zondertoespreekinstallatie)
Verschil in lawaainiveau bijzelfde STI-waarde leverteffectieve versterking van detoespreekinstallatie
Effectieve versterking van PA-systeem
VPT 2008 33
STI gemeten met spraaksignalen
MTF via verschil vanomhullendespectra vanverzonden en ontvangenspraaksignalen
Toepasbaar bij ruis, nagalm en echo’s maarniet bij niet-lineairevervorming
VPT 2008 34
RASTI (room acoustical STI, 1980)
Screening-apparaat
2 Octaafbanden
Continu testsignaal
Verouderd (gebruik STIPA)!
VPT 2008 35
STIPA (STI Public Address, 2001)
Evaluatie voor Public Address
Omvat: akoestische omgeving, bandbreedtebeperking, oversturingsvervorming
Zeven octaafbanden (125 Hz en 250 Hz samen)
Complex omhullende (2 simultane modulatie- frequenties per band)
zie: IEC 60268-16
VPT 2008 36
Conclusies
Criteria voor vele toepassingen volgens ISO-9921
Subjectieve methoden: representatief, niet diagnostisch
Objectieve methoden: voorspellen, snel, diagnostisch