Grundlagen der digitalen Musikproduktion Bits und Sampleraten mit Matthias Oestreich #78

17. August 2010

Das dritte Summer Special in diesem Jahr handelt von den Grundlagen der digitalen Musikproduktion, insbesondere Bits und Sampleraten. Also einem Thema, dem sich jeder mal widmen sollte, falls er/sie das nicht schon lange getan hat. Und auch ein Thema, über das eine Menge unqualifizierter Meinungen in Foren preisgegeben werden, mit denen heute aufgeräumt wird.

Mein besonderer Dank geht heute an Matthias Oestreich, der diese Folge so wundervoll und kurzfristig aufgezeichnet hat. Viel Spass nun mit Bits und Sampleraten in der digitalen Musikproduktion.

Grundlagen der digitalen Musikproduktion – Bits und Sampleraten (Summer Special) #78

Der delamar Sommer geht weiter mit einem Special zum Thema „Was steckt hinter den Begriffen Bits und Samplerate und wie kann ich diese richtig einsetzen?“ In rund 25 Minuten erhältst Du hier eingehende Informationen rund um die technischen Begrifflichkeiten und deren Funktion. Am Ende wirst du herausfinden, wie Deine Aufnahmen besser werden können.

Wenn es um digitale Musikproduktionen fallen immer wieder die Begriffe Samplerate und Bit-Tiefe. Jedoch nicht jeder weiss, was dahinter steht, welche Folgen Veränderungen dieser Werte mit sich bringt und wie mit diesen Größen letztendlich umzugehen ist.

Damit Du dir ein Bild davon machen kannst, was dich in diesem Podcast für Musiker und Produzenten erwartet, kommt hier eine Übersicht der einzelnen Punkte.

Bits und Sampleraten – Grundlagen der digitalen Musikproduktion

  • Was zeigt mir mein Audioeditor
  • Was ist eine Samplerate
  • Welche Samplerate ist notwendig für eine naturgetreue Abbildung
  • Was ist eine Bitrate
  • Wofür steht eine Bitrate
  • Was sind Grenzen von Bitarten
  • Wie kann ich die Faktoren Bitrate und Samplerate gewinnbringend einsetzen

Du siehst, in diesem Podcast bekommst du einen vollkommenen Einblick in die Grundlagen deiner digitalen Audiotechnik und verstehst du Zusammenhänge, so dass du sie vorteilhaft einsetzen kannst.

 

Hinweis zum delamar Podcast für Musiker und Produzenten

Während des Monats August fallen die Live-Aufzeichnungen mit delamari aus. Stattdessen gibt es jeden Dienstag ab 18 Uhr einen neuen vorproduzierten Podcast zu einem besonderen Thema, das eingehend besprochen wird. In der heutigen Woche haben wir uns ein Mixing Tutorial vorgenommen, in der kommenden Woche geht es um das Thema Mikrofonierung. Weitere Summer Specials im delamar Podcast umfassen die Themen Songwriting, Grundlagen der digitalen Musikproduktion und Raumakustik.

Es bleibt ein heisser Sommer!

Viel Spass jetzt beim Hören von Folge #78 mit den wichtigsten Grundlagen der digitalen Musikproduktion von Matthias Oestreich!

P.S.: Matthias freut sich über ein kleines Dankeschön in den Kommentaren und einen Besuch bei seinem Podcast „Die Gitarrenstimmer“.

Antworten

Die Email-Adresse wird nicht veröffentlicht.Benötigte Felder sind mit * markiert

22 Kommentare

bei “Grundlagen der digitalen Musikproduktion Bits und Sampleraten mit Matthias Oestreich #78

  1. Carlos Aug 17, 2010

    Vielen Dank für diese wundervolle Folge! Sehr gut erklärt, bin begeistert!

  2. René Aug 17, 2010

    wirklich super informationen und auch super erklärt.. aber beim nächsten mal bitte langsamer reden… mir jetzt noch ganz schwindlich =)

  3. Matthias Oestreich Aug 18, 2010

    Hallo René,
    vielen Dank für das Lob und auch für den Hinweis langsamer zu sprechen! Du hast vollkommen recht, ich werde mich das nächste mal dran halten. Ist mir selbst beim Aufnehmen und abhören nicht so aufgefallen. Anscheinend die typische Blindheit gegenüber der eigenen Produktion.
    Nochmal vielen Dank und viele Grüße!
    Matthias

  4. Saitenlage Aug 18, 2010

    Sehr schönes Special, gut erklärt Messju. Du wirkst mitunter wirklich etwas gehetzt (ohne den Gitarrenwalter hast du doch Zeit -> Insider ;)).

  5. taikonaut Aug 18, 2010

    Oh ja, nicht so viel Kaffee mit Zucker vorweg trinken… und auch mal zwischendurch Luft holen. Aber ansonsten sehr informativ. ;)

  6. Christoph Aug 18, 2010

    WOW, richtig guter Job ;) *daumenhoch*

  7. Jakob Siegler Aug 18, 2010

    Sehr reichhaltige Folge! Vielen Dank! War erstaunt, wie schnell die Folge vorbei war. Brauchst also nächstes mal nicht ganz so schnell reden ;-)

    Zum Thema Samplerate: Das ist ja ein wahrlich schwierig nachvollziehbare Rechnung. Aber durchaus gut erklärt.
    Soweit ich weiß, sind die zusätzlichen Frequenzbänder (oberhalb und unterhalb der Hörschwelle) innerhalb der Digitalen Datei als Arbeitsbereich der Highpass und Lowpass-Filter von ADDA-Wandlern gedacht, damit das hörbare Signal möglichst linear bleibt. Zusammen mit der 74minuten-Audio-CD, die ja das genannte klassische Stück beinhalten konnte, schien das dann die optimale Lösung zu sein.
    Übrigens hat auch nur Aufgrund der 74min-Länge die CD einen Durchmesser von ca. 12 cm. Ursprünglich sollte sie kleiner werden. Aber als dann der Standard von 12 cm durch war, mussten alle japanischen Vertreter der damals nagelneuen Compact Disk größere Hemdtaschen haben, sodass sie die CD während ihrer Werbepräsentationen nur aus der Hemdtasche ziehen mussten. Dies sorgte kurze Zeit später für die Änderung des Standards für Hemdgrößen in ganz Japan. Kein Witz.

    Wie gesagt, cooler Podcast. Thx.

  8. Matthias Oestreich Aug 18, 2010

    @Jakob Siegler Wow, dank dir für die Anmerkungen! Warum steht das nicht in der Wikipedia? Könntest du das nachtragen?

    Ansonsten danke ich euch allen für das wunderbare Feedback!

    Und in Sachen Schnellsprechen gelobe ich Besserung! :-)

  9. Jackman Aug 19, 2010

    Erst mal ein dickes Lob an alle Delamar-Mitwirkenden.
    Eure Seite ist sehr sehr informativ und hilfreich.
    Auch diese Folge lässt mich jetzt nicht mehr ganz so im Dunkeln stehen in Bezug auf Bit’s und Sampleraten.
    Aber solch ein spezielles Thema, wäre vielleicht eher etwas für ein Video-Tutorial. Um dieses visuell zu unterstützen.

  10. Roland Aug 19, 2010

    vielen Dank für die spitzenmässige Folge !!!
    Bitte mehr davon ;-)

  11. Florian Aug 20, 2010

    Ein kleiner Gedankenanstoß zum Thema Samplerate:

    Die Ohren des Normalmenschens din 21,5cm ausseinander.
    Verglichen mit der Schallgeschwindigkeit sind das etwa 625µs die der Schall braucht um von einem Ohr zum anderen zu kommen (wenn man davon ausgeht, dass sich die Schallquelle in einer Linie mit den Ohren befindet).

    Weiterhin: das Gehirn bestimmt die Richtung aus der ein Geräusch kommt (unter anderem) durch die zeitliche Verzögerung von Onsets (Group Delays). Ich behaupte jetzt einfach mal, dass das Gehirn ziemlich kleine Laufzeitunterschiede feststellen kann.

    So … wenn wir jetzt aber ’nur‘ 44.1kHz nutzen haben wir eine zeitliche Auflösung von etwa 22ms. Das ist etwa 35x gröber als die 625µs die das Gehirn (nach meiner Behauptung) verarbeiten kann.

    Nutzen wir zumindest 96kHz (-> ~10µs Auflösung) ist das unter den 625µs.

    Daraus folgt, dass wir mit einer höheren Samplerate eine feinere Lokalisation bekommen.

    Oder liege ich hier falsch?
    Florian

    PS: Das ganze trifft natürlich nur auf Aufnahmen zu in denen wirklich Laufzeitunterschiede mit aufgenommen werden (MS zb) oder Verfahren wie Ambisonics. Nicht jedoch auf die Standard (links,rechts,vorne,hinten-lauter)-Pan-Pots die überall verbaut werden.

  12. Markus Fiedler Aug 22, 2010

    Hi Florian,
    Dir ist ein Einheitenfehler unterlaufen. Und zwar ziemlich genau in der gleichen Höhe, wie den Wissenschaftlern, die ja sooooooooo viel Eisen in Spinat gefunden haben ;-).

    Wenn Du 44100 Samples pro Sekunde nimmst, vergehen zwischen zwei Samples 22,7µs (Mikro nicht Milli-sekunden). Nochmal: Es sind 22,7 Mikrosekunden nicht Millisekunden!
    Daher ist das Zeitfenster um Faktor Tausend kleiner als Du angenommen hattest.
    Daher bist Du auch mit 44.1 kHz was die Stereophonie anbelangt deutlich im grünen Bereich.

    Ich denke mal nicht, dass da der Unterschied von ca. Faktor 2 zu einer 96kHz Aufnahme bzw. zu einer vergleichbaren 88.2kHz Aufnahme etwas bringt.

    Prinzipiell hast Du aber recht, dass die spatiale Empfindlichkeit in unserem Gehirn deutlich größer ausgeprägt ist, als beispielsweise das Timingempfinden (Stichwort Latenz), denn letzteres liegt wirklich im ms-Bereich.

    Übrigens wird für die Aufmerksamkeitsregelung und die Verschaltung mit anderen Sinnen in unserem Gehirn der Colliculus-Superior benutzt (vorderer Mittelhinhügel).
    Wer das nachlesen will, kann mal bei mir auf der Homepage nachsehen:

    http://www.fiedler-audio.de/markus-fiedler/sensory-maps.html

    Viele Grüße, Markus

  13. Robert Aug 22, 2010

    Zum Thema Samplerate:

    Ich glaube nicht, das man 48kHz aus Gründen der Tierfreundlichkeit verwendet ;-) , sondern vielmehr um ein noch transparenteres und detailreicheres Bild in den oberen Frequenzen zu bekommen.

    Was passiert nämlich wenn man ein Sinuston von 22kHz mit 44kHz aufnimmt – man bekommt – im besten Fall – eine Rechteckkurve mit deren Amplitude so groß ist wie die der Sinuskurve im Scheitelpunkt. Und im schlimmsten Fall garnichts (weil man immer dann den Singnalzustand abfragt, wenn der Sinuston gerade einen Nulldurchgang hat). Das und die Oberwellen, die durch die Rechteckschwingung entstehen verursachen Probleme.

    Außerdem: Man bekommt eine Zeitverzögerung, die verhältnismäßig immer schlimmer wird je höher die aufzunehmende Frequenz ist. Am Beispiel 22kHz ist es schlimmstenfalls die Zeit vom Nulldurchgang bis zum ersten Scheitelpunkt des Sinussignals. Das sind dann T/4 mit T=1/22000Hz=45ns und somit T/4=11,25ns

    @Florian: Guter Gedanke – an das Stereobild hab ich bisher überhaupt nicht gedacht.

    Aus praktischer Erfahrung kann ich das auch bestätigen – versucht mal eine vernünftig klingende Beckenaufnahme (Schlagzeug) mit 44.1kHz hinzubekommen. Ohne Komprimierung mag da nichts komisch erscheinen, jedoch mit zunehmender Dynamikbearbeitung stößt man schnell an die physikalischen Grenzen und die Aufnahme klingt zwar „fett“ und ausgewogen aber irgendwie unnatürlich. Es fehlt die gewisse Feinzeichnung im oberen Frequenzband – man könnte auch Transparenz und Detailreichtum sagen. Deswegen nehme ich generell mit mindestens 48kHz auf – besser noch mit 96kHz. Allerdings sollte man dann schon eine richtig gute CPU verbaut haben, denn die Belastung ist enorm wenn man eine komplette Band in einem Zug (ohne Zwischenmixe) realtime mixen und mastern möchte.

    Je schneller man abtastet, desto naturgetreuer lassen sich insbesondere hohe Frequenzen abbilden und der Signal-Rausch-Abstand verbessert sich – zu „Rauschen“ zählen in diesem Fall auch die Artefakte der Digitalisierung (Oberwellen).

    Güße, Robert.

  14. Matthias Oestreich Aug 22, 2010

    Hallo Robert,
    dank dir für deinen Einwand!
    Ich habe das Beispiel mit den Tieren absichtlich so gewählt, um darzustellen, dass die Welt tatsächlich viel komplexer ist und andere Lebensformen sich diese Komplexe auch zu Nutze machen können. Für Menschen ist jedenfalls nachweislich jedes Schallereignis höher als 20 KHz , eigentlich schon wesentlich darunter, nicht wahrnehmbar. Jetzt frage ich dich, welchen Mehrwert es hat, wenn etwas besser aufgezeichnet wird und dadurch auch klarer abgebildet werden kann, wenn man es jedoch gar nicht wahrnimmt, sprich nicht hören kann. Im Podcast bin ich insofern darauf eingegangen, als dass ich erwähnte, dass psychoakustische Argumente dafür sprechen könnten. Meines Wissens gibt es darüber aber keine wissenschaftlichen Erkenntnisse. Die einzige Erkenntnis aus dem Gebiet Psychoakustik, von der ich bis jetzt tatsächlich gelesen habe, ist die Einwirkung von Lautstärke. Nämliche diese, dass man seine Aufmerksamkeit akustischer Signale entziehen kann, so lange diese wohl unter 60 dB liegen. Spätestens ab einem Schalldruck von 70 dB, also vielleicht nicht komischer Weise dann, wenn ein Mensch schreit, nicht mehr. Vielleicht hat deshalb auch der Kinobesuch ein emotional intensiveres Erleben des Films zur Folge, denn in der Regel ist die Lautstärke der Akustik im Film über 70 dB. Aber zurück zu höheren Frequenzen und höheren Abtastraten. Wie im Podcast erwähnt können keine höheren Frequenzen als 22.050 KHz von der CD abgebildet werden. Der Mensch hört höchstens bis 20 KHz, insofern ist schon mehr als genug abbildbar. Nun wieder die Frage an dich, egal ob Abbildung oder Laufzeit, welchen Mehrwert hätte dies, wenn man es nicht wahrnehmen kann? Ich persönlich habe auch in eigenen Tests keine Verbesserung zwischen 44,1 und 48 KHz wahrnehmen können.
    Gruß Matthias

  15. Markus Fiedler Aug 22, 2010

    Hi Robert,
    Du kannst Nanosekunden nun wirklich vernachlässigen. ;-)

    Im übrigen ist auch bei Dir die Einheit falsch. Nach Milli kommt Mikro und dann erst Nano, Piko, Femto, Atto… . Jeweils um den Quotienten 1000 kleiner.
    Du hast in Deinem Beispiel also nicht 45ns sondern 45µs.

    Die 48kHz kamen ursprünglich zu stande, da man bei professionellen digitalen Aufnahmen in den 80ern auch noch Möglichkeiten zur Geschwindigkeitskontrolle und Tonhöhenkorrektur von 10% haben wollte, ohne in den „hörbaren“ Bereich unter 20 kHz vorzustoßen und das Klangbild negativ zu beeinflussen. Daher die 48k.

    Rechteckwellen enstehen weder bei AD- noch bei DA-Wandlung.
    Es ist so, dass bei beiden Wandlungen steilflankige Filter alle Signale oberhalb von 20k abschneiden (eingangsseitig wird so das Aliasing verhindert, Ausgangsseitig die Rechteckwellen).
    Wenn Du eine Rechteckwelle mit 20k hast, dann liegen deren Obertöne bei 3x20k = 60k, 5x20k = 100kHz und so weiter.
    Daher wirst Du nur den Grundton, nämlich 20k nach der Wandlung hören.

    Zum Thema Aufnahmeformate:
    Es ist zu empfehlen, für 44.1kHz CD-Format immer in 44.1kHz oder in deren Vielfachen zu arbeiten (z.B. 88.2kHz).

    Selbstverständlich bringen höhere Abtastraten auch luftigere und schöner aufgenommene Höhen. Ohne Frage. Das liegt aber nicht primär an einer Phasenverschiebung und damit zusammenhängende spatiale Probleme (Stereobild), sondern wie Du schon ganz richtig gesagt hast, an dem Problem, dass man einige Sinustöne beim Samplen nicht in Phase sondern auch zufällig bei den Nulldurchgängen erwischen kann und dann gar nichts hört.
    Demnach werden Töne um 20k bei einer 44.1k-Aufnahme gedämpft und mit geringerem Pegel aufgenommen.

    Hochfrequenz-Abtastraten ab 88.2kHz aufwärts bringen am Ende nur etwas, wenn man das Endprodukt auch in diesem Format belässt.
    In 88.2 oder 96kHz aufnehmen und dann auf 44.1 kHz herunterechnen ist vollkommen unnötig. Dann hätte man auch gleich in 44.1 kHz aufzeichnen können, weil sich die Endprodukte nicht unterscheiden. Jeder, der was anderes behauptet ist Esoteriker.

    Wenn Du in 48kHz aufnimmst, solltest Du Deine Aufnahmen ergo entweder als Video-DVD anbieten oder als hochqualitatives 48kHz MP3, ansonsten verlierst Du bei der abschließenden Abtastratenänderung mehr an Klangqualität, als Du mit der höheren Samplerate gewinnst.

    Wer mehr über Samplingraten lesen will, kann hier nachgucken:
    http://www.fiedler-audio.de/markus-fiedler/sampling.html

    Viele Grüße, Markus

  16. Robert Aug 23, 2010

    Hallo Matthias, Hallo Markus,

    interessante Neuigkeiten – bin doch gleich mal ins Studio gefahren um ein paar Tests zu machen, denn wie ich schon geschrieben habe, aus meiner Erfahrung heraus klingt eine 96kHz-Aufnahme (bearbeitet, nicht das Rohmaterial) bei weitem detailreicher und transparenter als z.B. eine 44kHz.

    Der Test: Projekteinstellungen Projekt 1: 96kHz bei 24Bit. Mittels Rauschgenerator weißes Rauschen erzeugt, wiedergegeben und per Mikrofon aufgenommen. Dabei habe ich ein paar Dynamikschwankungen eingebaut, damit später die Dynamikeffekte auch was zu tun haben. Die Datei per Mixdown auf 44kHz runtergerechnet und in ein zweites Projekt – mit 44kHz bei 24Bit eingefügt. Jetzt habe ich also 2 Projekte mit unterschiedlichen Samplingraten und musikalisch identischem Inhalt. Zur Kontrolle habe ich von beiden Projekten ein Mixdown mit 44kHz und 16Bit (also CD-Qualität) erstellt und in einem weiteren Projekt miteinander Verglichen (bei einer Spur die Phase gedreht) – Resultat keinerlei Abweichungen (wär ja auch ein Wunder). Als nächsten Schritt hab ich im Projekt 96kHz ein paar Dynamikeffekte in den Kanalzug gegeben (Kompressoren, Maximiser, Transienten-Effekte und Limiter verschiedenster Hersteller) und einen erneuten Mixdown mit 44kHz (natürlich immer wav-Dateien) gemacht. Jetzt die Effekte kopiert und im 44kHz-Projekt eingesetzt, erneuter Mixdown mit 44kHz. @Markus: Nach deiner Theorie sollte das keinen Unterschied machen, da alles bis auf die Samplerate gleich ist. Allerdings ist dem nicht so. Die Differenz der beiden Dateien zeigt das, was ich erwartete – Rauschen mit gleichmäßigem, aber starkem Abfall im Frequenzgang (je geringer die Frequenz, desto kleiner die Unterschiede der beiden Dateien). Wenn man die Dateien mit dem Gehör vergleicht, hört man bei der 44kHz Variante einen eher kalten, kratzig-klirrenden Sound im vergleich zu der 96kHz-Datei.

    Nun stellt sich für mich die Frage: Was mach ich falsch, denn wie gesagt – das Problem mit dem unschönen Sound habe ich bei allen Mixes mit geringer Samplingrate.

    achso … sorry, natürlich ist 1*10^-6 immernoch µ und nich nano …

    Robert

  17. Markus Fiedler Aug 23, 2010

    Hi Robert,
    wenn Du zwei Dateien vergleichst, dann bitte 88.2 mit 44.1 kHz und 96 mit 48kHz.

    Du wirst immer eine Differenz bekommen, wenn Du eine 96kHz Datei von einer 44.1 kHz Datei abziehst unabhängig davon, ob es tatsächlich einen Unterschied gibt.

    Dein Test muss folgender Maßen aussehen, damit er einigermaßen wissenschaftlichen Ansprüchen genügt:

    Ein beliebiges Projekt bei 88.2 kHz erstellen (inkl. Plugins und pipapo). Dann dieses Projekt in ein 44.1 kHz Projekt umwandeln.

    Dann einmal Mixdown (Projekt A) bei 88.2 kHz in eine Wave Datei. Dann Mixdown des zweiten Projektes (Projekt B) bei 44.1 kHz in eine Wave Datei.

    Dann kannst Du die Waves vergleichen:
    Ergebnisse:
    Fall 1 (Projekt A downsampling auf 44.1) – (Projekt B bei 44.1 nativ) = keine Differenz

    Fall 2 (Projekt B upsampling auf 88.2) – (Projekt A bei 88.2 nativ) = Differenz mit steigendem Frequenzanteil oberhalb von ca. 10 kHz.

    Deine Diskussion des Ganzen sollte dann folgerichtig ergeben, dass es wohl Sinn macht, mit hoher Abtastrate aufzunehmen, aber nur dann, wenn man das Material auch bei hoher Abtastrate abspielt.
    (für genaue Vergleiche bitte Dithering/ Pre /Postfilter etc. pp abschalten.)

    An anderer Stelle hört man immer wieder, dass es Sequenzerprogramme gibt, die Schwierigkeiten haben bei 32 bit, 32 bit floating Point oder bei 24 bit oder so eine gleichbleibende Qualität bei unterschiedlichen Plugins zu garantieren (siehe 64bit- und 32bit-Plugins unter Logic auf dem Mac).

    Bei solchen Schwierigkeiten kann ich nur sagen, wechsel auf ein anderes Programm, beispielsweise Cubase, Sonar oder das sehr preisgünstige Reaper. Die haben damit keine Probleme.

    Wer Reaper nicht kennt kann hier nachsehen:
    https://www.delamar.de/musiksoftware/reaper-preiswerte-musikproduktion-3183/

    Viele Grüße, Markus

  18. h3lmet Sep 2, 2010

    …ein großartiger und sehr informativer Podcast! Komplizierte Sachverhalte werden von euch knackig und einfach erlklärt!….Die Summerspecials waren durchweg ansprechend und ich habe sie auch Freunden weiterempfohlen, die normalerweise auf nützliche Wissensinputs wie Tutorials oder Videos bzw. Podcasts verzichten.

    Die Bit-Fragen waren und sind gut veranschaulicht! Doch dieses Thema ist überbewertet – vor allem hohe Raten ( 192khz-96bit etc.)

    Ich selbst habe die Erfahrung gemacht, dass – wie von euch emfohlen – 48 khz/24bit Sinn macht. Der Klang ist subjektiv aber wirklich nicht von 16 bit 44,1 zu unterscheiden!
    Letzendlcih landet ja alles auf CD bzw. Digital Release mit der 16/44 er Auflösung. Deshalb denke ich es macht gar nichts die nächsten zehn Jahre auf dieser Bitrate zu produzieren / auzunehmen / zu mastern!

    beste Grüße
    h3lmet von Trackord Records

  19. karl dunkmaier Jul 2, 2011

    echt super, sehr kurzweilig und sinnvoll erklärt, gute sprache, perfekt!

  20. karl dunkmaier Jul 2, 2011

    langsamer sprechen halte ich für einen fehler! wenn man konzentriert zuhört, versteht man sehr viel schneller als du zu sprechen in der lage bist. langsamer zu sprechen könnte es für viele sehr langatmig machen, was der konzentrationsfähigkeit sicherlich nicht zuträglich wäre. ich fands in der hinsicht perfekt!

  21. Legendaer.

© delamar.FM