[TTfA] Die Bittiefe

TTfA Die Bittiefe

Im letzten Artikel für Tontechnik für Anfänger ging es um die Samplingrate. Die Samplerate ist sozusagen 50% eures ganzen digitalen Signals. ;)

Jetzt wenden wir uns den anderen 50% zu. Die vertikale Achse stellt die Lautstärke dar.

Wie ich bereits im ersten Artikel schonmal besprochen habe gibt es den einen oder andere “High Fidelity Nerd” der sagt, er spüre alle Frequenzen oberhalb 20kHz obwohl wir Menschen sie nicht wahrnehmen können und deshalb würde er bis 192kHz aufnehmen.

Technisch besser ist es jedoch die Bittiefe zu erhöhen. Sie speichert im digitalen System die Lautstärke.

Bittiefe: Früher und heute

Bei der Bittiefe gilt: Je mehr desto besser. (Grundsätzlich) Jedoch ist natürlich eine höhere Bittiefe direkt gekoppelt an grösseres Datenvolumen.

In der Tontechnik spricht man bei (aufgenommener) maximalen Lautstärke vom sogenannte Dynamikumfang. Die Differenz also zwischen lautestem und leisestem Anteil eines Signals. In der Regel ist der leiseste Anteil einer jeden Aufnahme das sogenannte Grundrauschen. (Im übrigen nicht zu verwechseln mit dem Digitalen Grundrauschen.) Sprich das Rauschen, dass ihr hört sobald ein Mikrofoneingang einfach nur angeschalten wurde jedoch noch niemand ins Mikro reinspricht. Sobald jemand anfängt zu sprechen erhält man ein Signal. Der Spitzenwert dessen gibt den Signalwert an. Die Differenz aus beiden ergeben den Dynamikumfang – oder in diesem Falle eben Signal-Rausch-Abstand (“SNR” habt ihr vielleicht schonmal irgendwo gelesen).

Früher hatte man gerademal die Möglichkeit mit winzigen 8 Bit pro Sample aufzunehmen. Wie man vielleicht noch aus der Mathematik weiss ergibt 2⁸ = 256. Heisst also digital gesehen, dass dieser eine Samplewert mit einem von 256 verschiedenen Werten gespeichert werden kann. Nicht besonders viel aus heutiger Sicht. CDs beispielsweise arbeiteten (ich sehe die CD als deprecated an) mit 16 Bit. Einem deutlich höheren Speicherumfang. Hier kann man 2¹⁶ = 65536 verschiedene Wert speichern.

Bittiefe: Warum sind 256 und 65536 überhaupt wichtig?

Im digitalen System haben wir eine technisch bedingte Eigenheit mit der wir schlicht leben müssen. Etwas das unter Begriffen Maximalpegel zu finden ist.

Während analog Systeme eine sogenannte Übersteuerungsreserve haben, bringt man im digitalen Bereich irgendwann den Kanal einfach zum überlaufen. Hier sind im Studiobereich Pegel von +4dBu oder -10dBV gebräuchlich. Digital gibt es einen maximalen Pegel: 0dBFS.

Vielleicht sollte ich vor lauter Fachsimpelei noch kurz die kryptischen Kürzel hinter dem Herrn Bel (oder eben Zehntel Bel) erklären. Die Tontechnik rechnet mit Bezugspegeln. Bel ist ein Verhältnismass. Gibt also an wie weit man gerade vom Bezugspunkt gerade entfernt ist. Diese Bezguspunkte wurden festgelegt. Beispielsweise legte man einen festen Bezugspegel von 1,228V fest. Herausgekommen ist +4dBu. (Das “kleine u” steht für die Spannung. Eigentlich “gross U”, ich weiss, schreibt man eben so.) Bei -10dBV liegt dieser Punkt bei 0,3162V.

Digital spricht man von Fullscale. Die Vollaussteuerung in einem digitalen System beträgt eben, der volle Kanal, 0dB. Das ist wiederum technisch bedingt. Anders als bei analogen Geräten gibt es eben keine Möglichkeit ein Signal passieren zu lassen, dass bereits übersteuert ist.

Analog verzerrt sich so ein Signal linear. Heisst also es bleibt eigentlich noch erhalten. Klingt nur ein wenig anders. (Vielleicht ist euch der Begriff Sättigung) schonmal über den Weg gelaufen…ungefähr das.) Digital wird das Signal einfach “abgeschnitten”. Stellt euch vor ihr lauft unter einer zu niedrigen Tür hindurch, oben an der Tür sind sägen angebracht die alles was übersteht absägen, damit alles trotzdem noch unter der Tür durchpasst. (Was für ein brutales Beispiel.)

Da (digital) oberer und unterer Punkt fest sind ist nur das entscheidend was sich dazwischen abspielt. Unterteilt man einen Zentimeter Länge in 10 Teile haben darauf 10 Punkte Platz. Wird selber Zentimeter in 100 Teile unterteilt haben 100 Punkte Platz. Die Auflösung wird also feiner.
1 Zentimeter ist der Platz den man frei hat um das Signal auszusteuern. 256 Einheiten sind kleiner als 65536 Einheiten. Leuchtet ein oder?

Bittiefe: Mögliche Dynamik

Ein weiterer Punkt ist die Aussteuerung. Im Prinzip kann man sich vorstellen als würde man ein Umsetzung hin zu diesem digitalen System basteln müssen, da ja alles aussen rum. Sich sozusagen frei skaliert wie es grade will. Digital ist man fest. (0 bis 1 Zentimeter)

Man kann nun ausrechnen (oder hier ablesen)wieviel Dynamik möglich ist.

16 Bit: 96,3 dB
20 Bit: 120,4 dB
24 Bit: 144,5 dB

Unter Profis ist man sich relativ einig, dass 24 Bit. Enorm rauschfrei klingen. Man kann sagen, dass umso mehr Bit man nimmt, man dadurch gleichzeitig auch das rauschen vermindert. (Umsetzung…man kann sich vielleicht sowas wie einen Flaschenhals vorstellen.)

Bittiefe: Fazit

Schlussendlich gilt es nun ein Fazit zu ziehen. Rein medizinisch sagt man sich wir hören nur bis 20kHz. Macht es also Sinn höhere Samplingraten zu fahren? Eigentlich nicht, es sein denn man “spürt” sie oder will sogenanntes HD-Audio erzeugen. Macht es Sinn höhere Bittiefen zu nehmen? Ja, unbedingt. Eine höhere Bittiefe vermindert gleichzeitig das Rauschen. Welche Bitrate sollte ich also nehmen? “Die höchstmögliche.” Ich würde zu 24 Bit raten. Alles andere (32 Bit oder Floatpoint 32 Bit) führen in den meisten Software Programmen zu Fehlern und Problemen. Die 24 Bit Formate sind weiter verbreitet.

Wie ich bereits sagte, eignet sich das Thema dazu weiter ausgebaut zu werden. Das nächste mal könnte man etwa nochmal auf’s Quantisierungsrauschen und das Dithering eingehen.

Viel Spass beim rumfrickeln – rauschfrei natürlich!

[z.de]

Papa is a rolling Kiesel

[TTfA] Die Bittiefe

Bittiefe: Früher und heute

Bittiefe: Warum sind 256 und 65536 überhaupt wichtig?

Bittiefe: Mögliche Dynamik

Bittiefe: Fazit