UniBanner

Stoll

ISO/MPEG Audio: Ein Standard für die Codierung von hochqalitativen Tonsignalen

G. Stoll, Institut für Rundfunk-Technik München

 

In Zukunft wird für eine frequenzökonomische digitale Übertragung von hochqualitativen Tonsignalen im Bereich des Hörfunks, Fernsehens und der Telekommunikation sowie für die Speicherung eine äußerst effektive Tonsignalcodierung sehr wichtig sein. Die Einbeziehung der fundamentalen Höreigenschaften, Insbesondere das Wissen über die zeitlichen und spektralen Verdeckungseigenschaften des Gehörs, spielen eine immer bedeutendere Rolle bei einer bltsparenden Codierung. Diese psychoakustischen Eigenschaften sind ein wesentlicher Bestandteil des derzeit bei ISO/IEC JTC1ISC2IWG1 1 MPEG (Moving Pictures Experts Group) im Stadium der Standardisierung befindlichen Toncodierverfahrens.

Dieser Standard erlaubt eine Codierung von Bewegtbild und Ton innerhalb einer Gesamtdatenrate von 1,5 MbltIs. Hauptanwendungen sind hierbei die Speicherung von Bild und Ton auf digitalen Speichermedien, wie z.B. CD, DAT und magnetischer Fest- bzw. Wechselplatte, sowie die vielen Anwendungen in der Telekommunikation und beim digitalen Rundfunk und Fernsehen. Der ISO-Standard für die Toncodierung beinhaltet ein generisches Codierverfahren mit Datenraten von 32 bis 192 kbit/s pro Monokanal, bestehend aus 3 verschiedenen Layern mit zunehmender Komplexität. Damit ist eine einfache Umcodierung des codierten Signale ohne eine ständige, qualitätsbeeinträchtigende Codierung und Decodierung zwischen den unterschiedlichen Anwendungen möglich.

MUSICAM, ein im wesentlichen von IRT, CCETT und Philips entwickeltes Codierverfahren, bildet hierbei die Basis des Toncodierungstandards, bestehend aus den Layern 1 und II. Eine Kombination von bestimmten Bestandteilen von MUSICAM und ASPEC (eine Gemeinschaftsentwicklung von AT&T, FhG, DTB und CNET) dient für die Entwicklung des Layers III, Die Unterschiede zwischen den Layern sind wie folgt:

Layer I: dieser Layer enthält die grundlegende Rlterung des digitalen Tonsignals in 32 Teilbänder, eine feste Unterteilung des Signals in einzelne Blöcke, ein psychoakustisches Modell, um die dynamische Bitzuweisung zu bestimmen, die Quantisierung der Teilbandsignale mittels Blockkompandierung und die Rahmenbiklung des codierten Datenstromes.

Layer II: Dieser Layer ermöglicht eine effizientere Codierung der dynamischen Bitzuweisung, der Skalenfaktoren und Abtastwerte der Teilbänder, wobei sich die Codierung im Gegensatz zum Layer I immer auf drei zeitlich zusammenhängende Böcke bezieht.

Layer III: in diesem Layer wird die Frequenzauflösung durch eine weitere Aufteilung der 32 Teil-bänder erhöht. Untersucht wird derzeit die Effektivität einer nichtlinearen Quantisierung in Kombination mit einer Huffmann-Codierung.