Eine kurze Exkursion von Thomas Römann ins Thema High Resolution Audio und die dafür benötigten Audioformate DSD und DXD. Hier finden Sie den Artikel als Youtube Video inkl. einem kleinen Einblick in die Merging Technologies Software.

 DSDlogo

Das digitale Audioformat DSD (Direct Stream Digital) wurde im Jahre 1999 von Sony / Philips entwickelt. Angewendet wird die DSD-Technologie im Wesentlichen bei der Super Audio CD (SACD), welche als Nachfolger der regulären Audio CD gelten und diese qualitativ bei weitem übertreffen sollte. Dazu wählte man eine 64 mal höhere Auflösung als bei der herkömmlichen CD. Zur Veranschaulichung: das ist ein doppelt so großer Sprung in der Auflösung als würde man beim Film von einem 640 x 480 px VGA Bildschirm auf einen Full-HD-Screen wechseln. Ein Riesenschritt also, der aber auch entsprechend viel mehr Speicher benötigt.

Um die vergleichsweise hohe Abtastrate mit damaligen Speichermedien zu realisieren, und weil das Format ursprünglich nur zur Archivierung / Digitalisierung von unbearbeiteten analogen SONY Masterbändern gedacht war, wurde ein 1-bit Datenstrom gewählt. Das hatte zur Folge, dass ein schwer bis gar nicht editierbares Format entstand.

Weitere Probleme waren, dass nur wenige Menschen Zugang zu SACD-Playern hatten und etwa zeitgleich das Zeitalter der “Mediums-freien Medien” begann, also die Verbreitung stark komprimierter MP3-Files – quasi das Gegenteil der DSD Qualität.

Obwohl ein großer Katalog hochwertiger Re-Masters und neuer Produktionen entstand, hatte die SACD, im Vergleich zur Audio CD ca. 20 Jahre zuvor, wenig Erfolg und DSD blieb ein Exot bei den Kunden. Da außerdem die Produktionskosten des neuen Mediums sehr hoch waren, wandten sich bald viele Hersteller und Medienschaffende von diesem Format ab. Das DSD nicht erfolgreich war, weil das Format gegenüber der herkömmlichen CD keinen Qualitätsvorteil brachte, ist nicht der Grund für den Misserfolg in dieser Zeit.

Warum kommt das Thema jetzt wieder auf?

1. Die Produktionswerkzeuge haben sich erheblich verbessert und sind weitaus günstiger geworden. Während früher vor allem SONY und Sadie für Ihre Arbeit mit DSD bekannt waren, wird heutzutage der allergrößte Teil der DSD-Produktionen mit Merging Technologies Equipment aufgenommen und produziert. Pyramix ist ab Version 10 in der Lage bis zu 64 Spuren DSD aufzunehmen, und zwar von DSD 64 bis DSD 256!

Pyramix MassCore (1)

Horus_Smaller      Hapi_Smaller

2. Die Wiedergabesysteme haben sich dramatisch verbessert und sind preiswerter geworden. Inzwischen gibt es hunderte DSD-fähiger DAC-Wandler. Merging Technologies hat in diesem Bereich ein neues Kapitel aufgeschlagen: beim NADAC Wandler steht durch die Anbindung an das High-End Audio Netzwerk RAVENNA – statt dem Anschluss über eine Multi-Purpose USB-Schnittstelle – eine sehr hohe Bandbreite und eine ultrastabile Clock (PTP2) zur Verfügung. Beides bedeutet hohe Zukunftssicherheit. Gleichzeitig basiert der NADAC auf den Merging-Pro-Geräten, sodass der Wandler exakt das abbildet, was der Tonmeister bei der Aufnahme gehört hat. So nah war man als Hörer noch nie am Original.

NADAC-FrontRight2-Transparent-Shadow_1200px   LOGO_Ravenna_QUER_RGB

3. Das Medium SACD blockiert nicht mehr die Vermarktung von hochauflösenden Aufnahmen. Die allermeisten DSD-Produktionen werden heute als Download angeboten.

4. DSD bietet nativen, unkomprimierten Surround-Soundbis DSD 256, also der 256-fachen Abtastrate der herkömmlichen CD.

5. DSD ist lukrativ. DSD-Aufnahmen werden oftmals von kleineren, hochspezialisierten Labels durchgeführt, die nicht über die gängigen Plattformen vertreiben, sondern in eigenen oder gemeinsamen High-End Download Shops ihre Produktionen anbieten. Während im üblichen Vermarktungsrahmen oft nur Cent-Bruchteile bei den Urhebern, Künstlern und Studios ankommen, sind bei DSD-Downloads bis zu 50% des Endpreises üblich. Viele Studios haben hier einen wichtigen und derzeit stark wachsenden Markt für sich entdeckt. Eine Sammlung mit Links zu verschiedenen DSD-Labels finden Sie hier.

Technischer Hintergrund

99,9% aller digitaler Musik die wir heute hören wurde auf zwei fundamentalen Prinzipien basierend aufgenommen: dem Nyquist-Theorem und der Fourier-Transformation. Joseph Fourier entdeckte bereits 1822 das Prinzip nach dem komplexe Schwingungen in eine Vielzahl einfacher Sinusfunktionen zerlegt werden können. Harry Nyquist beschrieb das Prinzip des „Samplings“, demzufolge die Frequenz einer Sinuswelle korrekt erfasst werden kann, wenn man Stichproben Ihrer Amplitude mindestens doppelt so schnell aufnimmt, wie die Frequenz der Sinuswelle beträgt.

Nimmt man diese beiden Theorien zusammen ergibt sich eine einfache Rechnung: Wenn wir ein komplexes Signal, z. B. Musik oder Sprache, doppelt so schnell abtasten, wie die höchste Frequenz, die wir noch erkennen wollen, können wir das gesamte komplexe Signal korrekt erkennen.

Wenn wir davon ausgehen, dass Menschen bis 20 kHz hören können, benötigen wir also eine Abtastrate von 40 kHz. Um zu verhindern, dass Frequenzen oberhalb der 20 kHz falsch interpretiert werden, benötigen wir noch spezielle Filter, sodass sich eine Abtastrate von 44 kHz ergibt um das gesamte menschliche Hörspektrum abzubilden.

Nach dieser Theorie funktioniert sowohl die CD als auch praktisch jedes andere digitale Audioformat. Gespeichert werden die Informationen für gewöhnlich im PCM Format (pulse code modulation) mit einer Wortbreite von 16 bit. Mit dieser Wortbreite kann eine Dynamik von 95 dB abgebildet werden. Gemessen an den 120 dB die das menschliche Ohr hören kann, ist das schon eine Menge, aber noch längst nicht die gesamte Dynamik. Zumal PCM im untersten Lautstärke-Bereich durch das sogenannte Quantisierungsrauschen große Schwächen hat und im Produktionsprozess in der digitalen Welt Dynamikreserven unumgänglich sind.

Fourier transformationWarum nun also DSD?

DSD steht für direct stream digital und arbeitet mit einer Abtastrate von 2,8 mHz. Das Signal wird also 32 mal so schnell abgetastet, wie es für das menschliche Ohr nötig wäre. Die neuen Formate DSD 64 und DSD 256 tasten sogar entsprechend noch schneller ab.

Warum das? Es geht bei DSD nur am Rande darum, höhere Frequenzen wiederzugeben. DSD ist durch spezielle Filter meist auf 50 kHz als höchste Wiedergabefrequenz begrenzt. Der Grund dafür ist, dass auch bei DSD ein Rauschen entsteht – wegen des 1-bit Stroms ist es hier sogar noch wesentlich schlimmer als bei PCM. Der Trick ist, dass es sich in den, bei DSD verfügbaren, ultra-hochfrequenten Bereich verschieben lässt und somit keine Rolle mehr spielt. Damit erreicht DSD eine Dynamik von 115 dB, also deutlich mehr als PCM 16 bit.

Als viel wichtiger aber werden von DSD-Fürsprechern die folgenden zwei Punkte gesehen. Analoges Audio digital darzustellen ist quasi die Quadratur des Kreises. Um wieder ein Beispiel aus der visuellen Welt zu bemühen: je mehr Pixel wir verwenden, je höher also die Auflösung ist, desto eher sehen wir auf dem Bildschirm einen Kreis. Das ist genau das, was DSD tut.

1. Clocking: Analoges Audio ist zeitkohärent, digitales Audio hingegen wertkohärent. Damit die Sample-Schnipsel, die wir aus dem analogen Audio nehmen, später wieder so korrekt in der Zeitachse zusammengeklebt werden, dass annähernd die gleiche analoge Information dabei entsteht, muss extrem präzise gearbeitet werden. Dabei sind die Pausen zwischen den einzelnen Sample-Schnipseln genauso wichtig wie die Schnipsel selbst.

Wie genau diese Timings eingehalten werden, hängt vom „Clocking“ ab. Die Ungenauigkeit des Clockings wird als Jitter bezeichnet. Jitter ist unvermeidlich, aber: wenn wir die Anzahl der Schnipsel dramatisch erhöhen, werden logischerweise die Lücken zwischen den Samples immer kleiner und Jitter damit immer weniger schädlich. Das Resultat ist eine deutlich verbesserte Transparenz und Körperlichkeit der Aufnahme, die DSD-Aufnahmen kennzeichnet.

2. Transienten: Zu den wichtigsten Informationen für unser Ohr gehören die Transienten, also die ersten Impulse eines Tons. Das Anstreichen eines Violinenbogens, der Aufschlag der Hand auf einem Perkussions-Instrument. Es ist zwar nicht zwangsläufig nötig, mehr als doppelt so schnell zu samplen um eine entsprechende Sinuswelle zu erfassen, aber das chaotische, extrem schnelle Verhalten von Transienten lässt sich nach objektiven Messungen mit DSD sehr viel realer abbilden, als mit PCM-Formaten.

Die Abbildung der Transienten in hohen DSD-Raten ist tatsächlich annähernd so gut wie analog, DSD wird daher manchmal als das “digitale Analog” bezeichnet.

transientewiedergabe

In der Anwendung

Die Vorteile von DSD liegen also auf der Hand, wie aber geht man mit DSD im Studio oder beim Liverecording um?

Da DSD ein Single-bitstream ist, kann er nicht wie PCM einfach digital geschnitten werden. Der Vorteil ist zwar, dass ein 2,8 mHz Signal nicht mehr Speicher und Bandbreite benötigt als ein PCM Signal mit nur 192 kHz. Leider lässt sich DSD im Gegenteil dazu aber eben nicht editieren. Typische Prozesse wie die Veränderung des Frequenzspektrums oder der Dynamik durch EQs oder Kompressoren sind schlicht nicht möglich.

Mittlerweile erlaubt es Merging’s Pyramix-Workstation in der DSD-Ebene konvertierungsfrei zu schneiden, zu verschieben und sogar zu faden. So ist es möglich, z. B. einen Klassikmitschnitt in Pyramix aufzunehmen, ihn zu editieren und das Master inkl. Tracklistings / Markern zu erstellen, ohne die DSD Ebene jemals zu verlassen. Um DSD aber wie “normales” PCM Audio zu editieren, wird ein “Stellvertreterformat” benötigt. Merging Technologies hat hierfür das Format DXD entwickelt. DSD Dateien werden in ein ultrahoch auflösendes PCM-Format übertragen, um praktisch verlustfrei bearbeitet werden zu können. Danach werden die gemachten Veränderungen auf Wunsch ebenfalls verlustfrei wieder in das ein DSD-File gerechnet, oder einfach als DXD verwendet.

DXD (digital extreme definition) wird inzwischen auch als eigenständiges Format benutzt, da es sogar eine noch bessere Dynamik bietet als DSD und weniger kritisch im Rauschverhalten ist. DXD verbindet damit die Auflösung von DSD mit der Editierbarkeit von PCM. Da es eine eine sehr hohe Datenrate aufweist (dreimal höher als DSD 64), wird DXD Audio als fertige Produktion aber dennoch oft im DSD-Format angeboten, da die Editierfähigkeit dann nicht mehr relevant ist.

DXD_Logo

Die Pyramix-Workstation ist in der Lage, eine Vielzahl von verschiedenen Formaten gleichzeitig in einem Projekt zu handeln, inklusive DSD und DXD, sowie auch verschiedene Kompressionsformate. Seit Version 10 enthalten viele Pyramix-Packs die Lizenz zum Abspielen und Bearbeiten von DSD und DXD bereits ab Werk, sodass die Option nicht mehr teuer dazu gekauft werden muss.

Mit einem entsprechend DSD-fähigen Wandler wie dem Horus oder HAPI lässt sich eine DXD Session öffnen, DSD (z. B. als DSDiff) importieren und bearbeiten. Merging ist dabei der einzige Hersteller der ein komplettes Paket – von der Aufnahme bis zum Album Authoring – anbietet und dabei den Einsatz bekannter Bearbeitungswerkzeuge und Plugins im Editing-Prozess erlaubt.

Da die benötigte Technologie inzwischen signifikant günstiger geworden ist, rechnen wir mit weiterem und sich weiter beschleunigendem Wachstum in diesem Markt.

Weitere Informationen und konkrete Erfahrungswerte geben wir gern telefonisch oder per Mail weiter und freuen uns auf Ihre Fragen!

Systemtechnik: +49 40 4711 348 20 | tr@digitalaudioservice.de