zur Startseite

Druckausgabe von https://privat.albicker.org
Iveco Daily 4x4, Hunde und multithematisches Blog

Sound-Optimierung für meinen Linux-Media-PC

veröffentlicht am 19.11.2022 mit 1325 Worten - Lesezeit: 7 Minute(n) in * MEDIEN * PROGRAMME *

Inhaltsverzeichnis

 

Vor etwas über einem Jahr hab ich den Neuaufbau meines Media-PCs beschrieben. In diesem Artikel soll es um einige Optimierungen gehen, die den Sound betreffen.

Ausgangssituation

Mein HiFi-Receiver stammt noch aus den 90er-Jahren und verfügt ausschließlich über analoge Eingänge. Die Wandlung der Audio-Signale aus dem Media-PC in Analogsignale zur Weiterverstärkung an die Lautsprecherboxen führte immer wieder zu Brummeinstreuungen und unnötigem Rauschen. Also habe ich den PC um einen kleinen Verstärker ergänzt, der sowohl Bluetooth- als auch Toslink-Eingänge anbietet.

Mediacenter 2022
... der Trend zur Miniaturisierung und Konvergenz geht weiter ...

Technisch klingt das Audio-Signal jetzt sauber im Sinne von störfrei. Aber trotzdem war ich mit dem, was ich da zu hören bekam, keineswegs zufrieden. Um Sprache (insbesondere in einem Umfeld mit Nebengeräuschen (vor Ort-Aufnahmen in Dokus oder auch Spielfilme) gut verstehen zu können, mußte ich die Lautstärke mehr als nötig aufdrehen. Das verstärkte natürlich auch die “Dröhnstellen”, die vorher die Sprache maskiert hatten. Und seit ich vor einiger Zeit meinen alten Teppichboden durch einen pflegeleichten Paneelen-Boden ersetzt hatte, wurde das gefühlt unerträglich.

Disclaimer: Ich habe keine “goldenen Ohren”. Absolute HiFi-Freaks werden vielleicht milde lächeln über meine Vorgehensweise. Mir geht es primär darum, eine alltagstaugliche ordentliche Wiedergabequalität zu erzielen, sodaß sich für mich Musik ausgewogen und Sprache gut verständlich anhört.

Was ist da los mit dem Sound?

Wie ich schon in der Beschreibung des Media-PC gezeigt hatte, läuft auf der Maschine ein Debian-Linux als Betriebssystem. Als Soundsystem wird Pulseaudio verwendet. Eine kurze Recherche zeigt mir, daß es hierfür ein Zusatz-Programm Pulse-Effects gibt, das zahlreiche Möglichkeiten der Klangbeeinflussung bietet, weit über die beiden Regler für Höhen und Bässe an meinem Verstärker.

=Bildbeschreibung=

Nun kann man da allerhand “verbiegen”, da ich aber nicht “verschlimmbessern” wollte, habe ich mir zunächst überlegt, wie ich da zu seiner sinnvollen Analyse kommen könnte, bevor ich überhaupt den ersten Regler bewege. Es mußte also ein Verfahren her, das halbwegs Ähnlichkeit mit dem hat, was man als “Messung” bezeichnen könnte (das ist im Audio-Bereich immer etwas schwierig).

Testsignal

Mittels dem Programm “Audacity” erzeuge ich mir ein 2 1/2 Minuten langes Testsignal bestehend aus “Rosa Rauschen”.

Rosa Rauschen in Audacity erzeugen

Das Spektrum des erzeugten Signals sieht so aus:

Spektrum Rosa Rauschen als Referenz

In der doppelt logarithmischen Skalierung (y-Achse in dB, Frequenzachse ebenfalls logarithmisch) des Frequenzgangs zeigt sich ein linearer Verlauf, der mit 10dB pro Frequenz-Dekade (-Verzehnfachung) abfällt. Und auf diese beiden Eigenschaften kommt es hier an:

Erste Messung

Wie kann ich jetzt den “Sound” auf meinem Sofa messen?

Ich verfüge nicht über eine Meßausrüstung, wie sie in Audiolaboren zur Anwendung kommt. Also spiele ich das in Audacity generierte Testsignal im Audioplayer auf dem Media-PC ab. Als Mikrofon nutze ich einen portablen Audio-Recorder (Tascam DR-40), den ich auf einem kleinen Fotostativ auf mein Sofa stelle, etwa auf Ohrhöhe.

Tascam DR-40 Audiorecorder

Damit nehme ich das Rauschsignal für einen längeren Zeitraum auf, speichere das Ergebnis als .wav-File und lade das wiederum in Audacity.

Der erste Versuch zeigte dieses Ergebnis:

Spektralmessung als Ausgangsbasis

Als Referenz habe ich wiederum die Bezugslinie von 10dB Abfall/Dekade eingezeichnet.

Daraus ergibt sich:

Die starke Absenkung unterhalb 40Hz ergibt sich durch die eingeschaltete Rumpelsperre im Tascam und ist also beabsichtigt.

Insgesamt bin ich überrascht, wie deutlich sich das “Messergebnis” mit meiner subjektiven Wahrnehmung deckt. Und so kann das jetzt erstmal als Basis dienen, um mittels Equalizer da ein wenig Ausgleich zu schaffen …

Korrektur mittels PulseEffects

Erster Versuch

Im Equalizer habe ich zunächst 3 der Regler auf genau die Frequenzen der Überhöhungen bei 100, 320 und 420Hz gelegt, deren Güte etwas erhöht und negative Verstärkungen eingegeben. Im Ergebnis sind die Überhöhungen sehr gut angeglichen an die Solllinie, jedoch beiderseits jeweils starke “Löcher” entstanden.

Spektrum nach erster grober Korrektur

Das Spektrum um die Sprachfrequenzen herum zeigt ebenso nicht mehr die ausgeprägte Absenkung, sondern zeigt Abweichungen symmetrisch um die Solllinie.

Das müßte eigentlich noch besser gehen - ein erster Hörtest zeigt jedenfalls schon deutlich wahrnehmbare Verbesserungen bzgl. Dröhnen und Sprachverständlichkeit.

Etwas Finetuning

Im Bereich der Dröhnfrequenzen sind in diesem zweiten Schritt die Güten der Regler bei 320 und 420Hz deutlich erhöht - dadurch konzentriert sich die Absenkung mehr auf die Spitze der Überhöhung. Zusätzlich ist der Pegel bei genau 200Hz zurückgenommen.

Spektrum nach weiterer genauerer Korrektur

Ebenso ist der Verlauf im Sprachfrequenzbereich durch leichtes Nachjustieren der dortigen Regler nun ausgeglichener.
An diesem Plot stört mich nun die ausgeprägte Senke um 280Hz am Stärksten …

So bleibt’s jetzt erstmal

Eine schmale (hohe Güte) Anhebung bei 280 und 580Hz sowie etwas mehr Pegel um 1400Hz führt zu diesem Plot - und nach ein bißchen Probehören belasse ich es erstmal damit:

Spektrum nach finaler Korrektur

Abschließende Einstellungen des Pulseeffect-Equalizers

Die 30 Kanäle des Equalizers sind für die obigen Korrekturen folgendermaßen eingestellt:

Pulseeffects Einstellungen niedrige Frequenzen

Über jedem Regler lassen sich über das Zahnradsymbol die genaue Frequenz und die Güte wählen.

Pulseeffects Einstellungen mittlere Frequenzen

Der Betrag der Anhebung bzw. Absenkung wird über den Regler selbst eingestellt.

Pulseeffects Einstellungen hohe Frequenzen

Und nun ist es noch interessant, wie denn nun der eigentliche Frequenzgang dieses Effekt-Moduls aussieht … ohne die sonstigen Einflüsse durch Resonanzen, Echos etc., die im Raum auftreten.

Pulseeffects Ausgang

Dieser Plot ist direkt auf dem Media-PC aufgenommen - am Monitorausgang für den angeschlossenen Verstärker im Pulseaudio-Lautstärkeregler. Und hier kann man schön die oben angesprochenen Absenkungen v. a. bei 100, 200, 320 und 420 Hz sowie die Präsenzanhebung ab 1500Hz sehen.

Nachbemerkungen

Einstellungen in Audacity für die Spektralplots

Theorie

Ich stelle die Hintergründe, die hier für das Verständnis wichtig sind, sehr stark vereinfacht dar - Fachleute mögen mir das nachsehen. Eine ausführliche Darstellung findet sich z. B. bei Wikipedia.

Basis sind die folgenden Überlegungen:

  1. eine unendlich lange Sinus-Schwingung mit konstanter Frequenz zeigt in der idealen Spektralanalyse genau eine senkrechte Linie bei eben dieser Frequenz.
  2. ein “unendlich kurzer Knacks” dagegen zeigt in der Spektralanalyse ein unendlich breites Spektrum (eine waagerechte Linie).
  3. Das hier verwendete Rauschen ist nun ein bunter Mix aus Sinusfragmenten unterschiedlichster Grundfrequenzen, “Knacksern”, beliebigen anderen Signalformen - Rauschen ist eben ein “Zufallssignal” - und hat daher ein breitbandiges Spektrum (und deshalb ist es geeignet für solche Untersuchungen).
  4. Ein zeitlich andauerndes Signal wird in der Regel in Blöcken verarbeitet. Da Blocklängen in der Praxis endlich sind, kommt es zum sogenannten Leck-Effekt, wenn die Blocklänge nicht gerade ein natürlichzahliges Vielfaches der Periode des Signals ist (Preisfrage: was ist die Periode des hier verwendeten “chaotischen” Rauschsignals?).
    Folge: Das errechnete Frequenzspektrum wird zu breit, es ist bildlich gesprochen „verschmiert“.
  5. Um diesen Effekt zu reduzieren, werden die Blöcke bei der rechnerischen Verarbeitung “verrundet”, also am Anfang quasi “eingeblendet” und am Ende “ausgeblendet”. Das kann auf unterschiedliche Weise geschehen, repräsentiert durch sog. “Fensterfunktionen”.

Und diese Funktionen können in Audacity gewählt werden:

konkrete Einstellungen

Alle Spektralanalysen wurden mit folgenden Einstellungen in Audacity vorgenommen:

Audacity Einstellungen des Diagramms der Frequenzanalyse

Damit sind die Bilder untereinander bzgl. der spektralen Auflösung direkt vergleichbar.

Breitbandiges Signal/verschmiertes Spektrum?

Man mag sich jetzt fragen, weshalb bei einem sowieso beliebig breitbandigen Spektrum das “Verschmieren” bei der Frequenzanalyse überhaupt eine Rolle spielt. Das ist einfach: Wir wollen im hier vorliegenden Fall ja ermitteln, an welchen Stellen des Spektrums es zu Auslöschungen oder Überhöhungen kommt. Der Leck-Effekt hat hier eben Einfluss auf die Auflösung der Darstellung, bei ungünstiger Einstellung können schmalbandige Ausreißer im Übertragungsfrequenzgang verloren gehen.

Tiefbass-Bereich

Unterhalb 50Hz unterscheiden sich die obigen Frequenzanalysen tlw. sehr deutlich. Ursache ist hier, daß tlw. unterschiedliche Einstellungen sowohl im Tascam als auch in PulseEffects vorlagen, an beiden Stellen habe ich tlw. mit 40Hz-Hochpaß gearbeitet und diesen für die hier gezeigten Messungen nicht immer abgeschaltet. Sorry.

Einordnung dieses Verfahrens

Mir ist klar, daß es sich hier um eine “quick-and-dirty”-Variante der Klangverbesserung handelt. Dies v. a. deshalb, weil ich hier nur den Frequenzgang als Maß herangezogen habe, andere Aspekte des Klangs wie Laufzeitverzögerungen und Echo/Hall aber keineswegs berücksichtigt habe.
Um diese Eigenschaften jedoch zu verändern würde es nötig werden, den Raum als solches zu verändern: schallschluckendes Material einerseits und ggf. Veränderung der Plazierung von Lautsprechern und Abhörposition andererseits. Zumindest Letzteres kommt hier jedoch nicht in Frage, deshalb habe ich diese Aspekte erstmal ausgeklammert.

 


weitere Artikel