Skocz do zawartości

Kompresja wielokanałowegej ścieżki dźwiękowej filmu (DD, DTS)


Adalbert

Rekomendowane odpowiedzi

Ostatnio zacząłem bawić się w "ripowanie" swoich płyt DVD. Zazwyczaj przepuszczam ścieżkę dźwiękową filmów bez rekompresji, ale czasami przydałoby się zmniejszyć trochę jej przepływność, stąd moje pytania dotyczące kompresji.

Z własnych obserwacji i doświadczeń widzę, że chyba najsensowniej kodować do AAC. No i czy najlepiej robić to enkoderem Nero AAC (ostatnia wersja, chyba 1.5.4.0 z 18 lutego 2010 roku), czy może wykorzystać darmowy odpowiednik LAME, czyli FAAC? Wybierać tryb docelowej jakości (-q), czy raczej docelowej przepływności (-br / -cbr)? Wymuszać profil (-lc / -he / -hev2), czy raczej zostawić domyślnie?

W przypadku downmixu (przejścia z 5.1 na 2.0 czyli "stereo") w MeGUI mam możliwość wyboru trybu: Stereo / Dolby Pro Logic / Dolby Pro Logic II. Który wybrać?

Wybór dekodera (NicAudio / FFAudioSource / DirectShow) wpływa w jakikolwiek sposób na jakość pliku wynikowego?

 

Będę wdzięczny za każdą odpowiedź.

Odnośnik do komentarza
Udostępnij na innych stronach

Za dużo pytań naraz... tak na szybko:

- enkoder nero, im nowszy tym lepszy

- wybieraj "q" (jakość), wtedy nie musisz myśleć jaki dobrać bitrate... chyba że właśnie celujesz w bitrate (żeby zmieścić się w jakiejś tam wielkości) wtedy nie wybieraj "q"

- jeśli nie chcesz przechowywać dźwięku 5.1 (tak by było najlepiej), to używaj trybu DPLII - jako stereo brzmi "trochę bardziej przestrzennie" niż zwykłe stereo, a jednocześnie przy pomocy odpowiedniego dekodera da się z tego odzyskać 5.1 (a nie udawane 5.1, jak ze zwykłego stereo)

Odnośnik do komentarza
Udostępnij na innych stronach

Aż tak mi się nie śpieszy, więc można też wolniej acz obszerniej napisać, ale i tak thx za info, zawsze można na Ciebie liczyć. :)

 

Wracając do tematu, rozumiem, że nie opłaca się bawić w alternatywy dla enkodera Nero?

Czy odtwarzacze radzące sobie z AAC ze stałą przepływnością, nie powinny mieć problemów ze zmienną przepływnością (wymuszaną przez -q)? Chodzi mi o uniwersalność. No i jak nisko według Ciebie warto z celowaną jakością zchodzić: -q 0.3? Czy nie przekraczać tej granicy, w której włącza się tryb SBR i wybrać -q 0.35?

Jeżeli w swoim odtwarzaczu BluRay mam różne tryby DPLII, w tym jeden nazwany Movies, to jest to właśnie wykorzystanie "odpowiedniego dekodera" o którym pisałeś?

Odnośnik do komentarza
Udostępnij na innych stronach

A widzisz jakieś alternatywy? LAME ma gorszą jakość i koduje tylko stereo, FLAC jest bezstratny ale wtedy dźwięk będzie zajmował więcej niż skompresowany obraz, więc bez sensu...

 

Co do jakości się nie wypowiadam - skompresuj sobie coś na próbę (nawet 5 minut) i sam oceń czy jakość jest adekwatna do potrzeb czy też oczekiwań...

 

I tak, o taki właśnie dekoder chodzi. Jeśli masz dźwięk DPLII, to został on specjalnie przystosowany do pracy z takim dekoderem i uzyskasz "prawie oryginalne 5.1"... jeśli zaś zrobisz po prostu stereo, to ten dekoder zrobi "udawane 5.1" jak z pierwszego z brzegu stereo...

Odnośnik do komentarza
Udostępnij na innych stronach

No alternatywą mógłby być FAAC o którym wspomniałem w pierwszym poście (choć z zasłyszanych i przeczytanych wcześniej informacji generuje "gorsze" pliki, dlatego chciałem się upewnić).

 

Dobrze rozumuję, że użyty dekoder nie ma znaczenia?

 

No i właśnie teraz kompresuję 25minutowy fragment i patrzę co i jak.

 

EDIT

W MeGUI mam jeszcze opcję do wybrania Apply DynamicRage Compression i Normalize Peaks to i tu możliwość wpisania wartości (od 0 do 100 ze skokiem 1), domyślnie ta druga jest zaznaczona i ustawiona na 100. Co te opcje tak na prawdę robią? Zostawić je domyślnie, czy w(y)łączyć?

Edytowane przez Adalbert
Odnośnik do komentarza
Udostępnij na innych stronach

Aaa... nie, nero ma lepszą jakość niż faac...

 

Dekoder ma znaczenie, ale nie jest to coś, czym powinieneś się na tym etapie martwić...

 

Pierwsza opcja zmniejsza rozpiętość głośności między najcichszym a najgłośniejszym fragmentem (przydatne na kiepskich głośnikach, w nocy - że jak huknie to nie "aż tak głośno" albo jeśli słychać jakiś szum otoczenia zagłuszający najcichsze fragmenty)... to jest coś, co spokojnie można nakładać już w czasie odtwarzania... chyba że zależy nam na tym, a wiemy, że urządzenie na którym będziemy odtwarzać nie ma takiej możliwości (np. przenośny odtwarzacz)... ta druga wyszukuje najgłośniejsze fragmenty (np. głośny wystrzał) i "przycisza je" tak, żeby nie były zbyt głośne względem najbliższego otoczenia tego fragmentu (ponownie, żeby nie było efektu "ustawiłem sobie głośność odpowiednio do cichego fragmentu, żeby coś słyszeć, a nagle coś gruchnęło na pełen regulator").

 

Ocenę zasadności stosowania każdego z tych rozwiązań pozostawiam samemu zainteresowanemu.

 

Generalnie im lepszy masz sprzęt/odtwarzacz, tym mniej takich efektów chcesz nakładać już w czasie kompresji - nałożysz je sobie już w czasie odtwarzania w razie potrzeby. Bo raz nałożonego efektu nie da się potem cofnąć bez ponownej rekompresji.

Odnośnik do komentarza
Udostępnij na innych stronach

Przeprowadziłem testy.

Z oryginalnego dźwięku AC-3 o stałej przepływności 384 Kb/s kodowałem bez zmiany ilości kanałów (5.1), bez resamplingu (48kHz) i bez dodatkowych opcji (kompresora i normalizacji) za pomocą Nero AAC codec 1.5.4.0 z przełącznikiem -q zmienianym od 0.3 do 0.46 ze skokiem 0.01. Podane przepływności średnie i maksymalne w nawiasach wg MediaInfo.

-q 0.30 199 Kb/s (272 Kb/s)

-q 0.31 258 Kb/s (331 Kb/s)

-q 0.32 230 Kb/s (289 Kb/s)

-q 0.33 237 Kb/s (300 Kb/s)

-q 0.34 232 Kb/s (300 Kb/s)

-q 0.35 238 Kb/s (309 Kb/s)

-q 0.36 257 Kb/s (337 Kb/s)

-q 0.37 265 Kb/s (351 Kb/s)

-q 0.38 353 Kb/s (439 Kb/s)

-q 0.39 353 Kb/s (454 Kb/s)

-q 0.40 303 Kb/s (381 Kb/s)

-q 0.41 313 Kb/s (395 Kb/s)

-q 0.42 343 Kb/s (434 Kb/s)

-q 0.43 353 Kb/s (446 Kb/s)

-q 0.44 361 Kb/s (459 Kb/s)

-q 0.45 353 Kb/s (442 Kb/s)

-q 0.46 353 Kb/s (451 Kb/s)

Co ciekawego można zauważyć, to fakt nieliniowego wzrostu przepływności, takie same wartości średnie (353kbps) uzyskałem dla -q 0.38, 0.39, 0.43, 0.45, 0.46.

Dodatkowo ustawienie tego przełącznika na niewiele większą wartość, może skutkować obniżeniem bitrate'u.

Warto zaznaczyć, że domyślnie profil he włączył się tylko dla -q 0.3, reszta była kodowana lc.

Skąd wynika ta nieliniowość nie wiem, może sensownie jest ustawiać tylko wielokrotności 0.05? Na własne potrzeby uznałem, że nie ma sensu, by maksymalna przepływność przekraczała to co mamy w źródle, ustawiam więc -q na 0.4 (kompresja rzędu 79%), albo 0.35 (62%), choć zacząłem się zastanawiać, czy gra jest warta świeczki przy takiej przepływności pliku źródłowego, bo zysk w MB w porównaniu do wielkości całego pliku wynikowego z filmem nie jest oszałamiający... Na razie testowałem skompresowane pliki pobieżnie na słuchawkach, nie dosłyszałem dużej degradacji dźwięku, ale jeszcze sprawdzę na jakimś kinie domowym.

 

KHRoN, jeszcze raz wielkie dzięki za pomoc.

Odnośnik do komentarza
Udostępnij na innych stronach

Dołącz do dyskusji

Możesz dodać zawartość już teraz a zarejestrować się później. Jeśli posiadasz już konto, zaloguj się aby dodać zawartość za jego pomocą.

Gość
Dodaj odpowiedź do tematu...

×   Wklejono zawartość z formatowaniem.   Usuń formatowanie

  Dozwolonych jest tylko 75 emoji.

×   Odnośnik został automatycznie osadzony.   Przywróć wyświetlanie jako odnośnik

×   Przywrócono poprzednią zawartość.   Wyczyść edytor

×   Nie możesz bezpośrednio wkleić grafiki. Dodaj lub załącz grafiki z adresu URL.

×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Zarejestruj się aby mieć większy dostęp do zasobów forum. Przeczytaj regulamin Warunki użytkowania i warunki prywatności związane z plikami cookie Polityka prywatności