Skocz do zawartości

Mp3 Czy Wma?


ryto

Rekomendowane odpowiedzi

bardzo możliwe (śmiem twierdzić że tak)... ale nie mam możności by to sprawdzić... :)

 

BTW >> TO << jest całkiem ciekawe... po dorodze piszą tam parę żeczy o FhG...

Moim zdaniem żadne dane techniczne nigdy nie będą w stanie oddać tego jak dobrze dany kodek jest w stanie zakodować dźwięk..

Szczerze mówiąc wiele kodeków "brzmi dobrze". Artefakty niejednokrotnie wymagają dużego skupienia i wytrenowania uszu - "na surowo" człowiek nie zawsze jest w stanie wiedzieć czemu się przysłuchiwać. W dodatku nie każdy materiał w takim samym stopniu "podatny" na kompresowanie. Dobym źródłem do testów jest np. strona:

http://ff123.net/samples.html

czy też

http://lame.sourceforge.net/gpsycho/quality.html

Znajdziesz tam dźwięki sprawiające problemy wielu współczesnym kodekom.

 

Przeczytalam ten temat powoli i dokladnie i nic nie rozumiem i wcale mnie to nie dziwi. Mam odtwarzacz 128MB. Mam uzywac wma 96kbps czy mp3(Lame)128kbps?

Gdybyś miała wybierać między mp3@128kbps a wma@128kbps sprawa byłaby prosta - mp3. Natomiast w tym przypadku musisz sama sprawdzić czy jesteś w stanie słuchać zniekształceń wma@96kbps.

Odnośnik do komentarza
Udostępnij na innych stronach

no... z tego wszystkiego wykonałem sam sobie kilka testów ABX (aby zapewnić odpowiednie warunki dla mp3PRO do którego nie mam wtyczki do fb2k, cały już materiał dekodowałem do .wav za pomocą Audition 1.5): mp3 vs mp3pro (podobny i różny bitrate), mp3 HQ vs mp3 LQ, mp3@FhG vs mp3@LAME (identyczny bitrate), mp3@FhG vs mp3@BladeEnc (identyczny bitrate)... wyniki wynosiły 10/10, a pole "chance u had been guessing" pokazywało taką malutką liczbę... ;)

... jak się już wyłapie różnicę A-B to nie jest wielką filozofią wskazać A-X czy A-Y z precyzją oscylującą około 100% ... ;] :] (gożej jak tej różnicy nie słychać... ale nawet na moich słuchawkach słychać ;) )

 

co do materiału - pościągam sobie trochę i sam popróbuję... tak BTW to nie wiem czy zauważyłeś... ale daliśmy linka do tej samej strony ;) ;)

 

i jeszcze BTW2: nie wiem czy ty też... ale ja słyszę różnicę między materiałem z lowpassem 16/18/20kHz (ABX :] )

 

(... logów nie wysyłam bo nie ma sensu... nie mają żadnego podpisu cyfrowego więc równie dobrze mogę napisać miałem XX/YY... zaproponuj gościom od testów żeby wlepiali do loga dodatkową linijkę z CRC/podpisem cyfrowym żeby można było sprawnie sprawdzić czy log jest autentyczny czy nie... może już taka opcja istnieje... ale foobar2000 jej niema ;) )

Odnośnik do komentarza
Udostępnij na innych stronach

no... z tego wszystkiego wykonałem sam sobie kilka testów ABX (aby zapewnić odpowiednie warunki dla mp3PRO do którego nie mam wtyczki do fb2k, cały już materiał dekodowałem do .wav za pomocą Audition 1.5): mp3 vs mp3pro (podobny i różny bitrate), mp3 HQ vs mp3 LQ, mp3@FhG vs mp3@LAME (identyczny bitrate), mp3@FhG vs mp3@BladeEnc (identyczny bitrate)... wyniki wynosiły 10/10, a pole "chance u had been guessing" pokazywało taką malutką liczbę... ;)

... jak się już wyłapie różnicę A-B to nie jest wielką filozofią wskazać A-X czy A-Y z precyzją oscylującą około 100% ... ;] :] (gożej jak tej różnicy nie słychać... ale nawet na moich słuchawkach słychać ;) )

Raczej chodzi o testy mp3 vs oryginał..

 

tak BTW to nie wiem czy zauważyłeś... ale daliśmy linka do tej samej strony ;) ;)

Jednak troszkę innej ;)

 

i jeszcze BTW2: nie wiem czy ty też... ale ja słyszę różnicę między materiałem z lowpassem 16/18/20kHz (ABX :] )

Słyszę dźwięki ok 19 kHz, ale ciężko jest mi wykonać test ABX dla materiału z lowapassem 18 kHz - jest to dla mnie praktycznie niemożliwe; najwyższe częstotliwości giną mi w tle..

 

(... logów nie wysyłam bo nie ma sensu... nie mają żadnego podpisu cyfrowego więc równie dobrze mogę napisać miałem XX/YY... zaproponuj gościom od testów żeby wlepiali do loga dodatkową linijkę z CRC/podpisem cyfrowym żeby można było sprawnie sprawdzić czy log jest autentyczny czy nie... może już taka opcja istnieje... ale foobar2000 jej niema ;) )

Ciekawy pomysł, ale praktycznie taki algorytm wyznaczania sum kontrolnych tez można byłoby napisać analizując nawet kod maszynowy programu do ich wyznaczania ;)

Problemem nie jest tutaj brak zaufania - chodzi mi tutaj głównie o to, abyś sam przekonał się, że dostępne enkodery mp3 nie są takie same i czasem nie warto iść na skróty...

Krótkie podsumowanie: zaufaj presetom :)

Odnośnik do komentarza
Udostępnij na innych stronach

Raczej chodzi o testy mp3 vs oryginał..

 

...? taki też robiłem ale to żadna filozofia mieć wtedy 200% skuteczności :P

;)

... spróbuję z genuine vs .mp3@VBR-100/256/320... bo takiego testu ABX jeszcze chyba nie próbowałem...

... tylko kiedy znaleźć na to wszystko czas? :]

 

 

najwyższe częstotliwości giną mi w tle..

 

ja też nie mam jakichś nieziemskich słuchawek (te "duże nauszne" mam Philipsy za 60zło :P;) )... a moich MDR-EX51 nie chce mi się do kompa podłanczać...

BTW muszę się wybrać na jakieś badania słuchu... ponoć kiedyś słyszałem kamerton nastrojony na 22kHz i muszę to sprawdzić... lol :)

 

 

taki algorytm wyznaczania sum kontrolnych tez można byłoby napisać analizując nawet kod maszynowy programu do ich wyznaczania ;)

 

wiem... ale i tak mało kto to zrobi - jednym się nie będzie chciało, inni nie będą wiedzieli jak a reszta nie będzie miała takiej potrzeby ;)

 

 

dostępne enkodery mp3 nie są takie same i czasem nie warto iść na skróty...

Krótkie podsumowanie: zaufaj presetom ;)

 

nigdy! ja wiem lepiej ;)

(joke ;) )

... skoro tak nalegasz to i spróbuję --alt-standard ... choć opcja --vbr-old -q 0 -X 0 kusi i długo trwa ;)

... dlatego wolę FhG... odnoszę wrażenie że lepiej brzmi i nie ma tylu opcji do przestawiania (ach te presety ;) )...

Odnośnik do komentarza
Udostępnij na innych stronach

...? taki też robiłem ale to żadna filozofia mieć wtedy 200% skuteczności :P

;)

... spróbuję z genuine vs .mp3@VBR-100/256/320... bo takiego testu ABX jeszcze chyba nie próbowałem...

... tylko kiedy znaleźć na to wszystko czas? :]

Mówisz poważnie? :) W takim razie powinieneś być w stanie określić, który z kodeków produkuje większe zniekształcenia... zdziwiłbym się, gdyby był to LAME...

Tak btw - VBR w FhG jest bardzo niedopracowany - przynajmniej był do niedawna (nie sądze, aby coś się zmieniło).

 

ja też nie mam jakichś nieziemskich słuchawek (te "duże nauszne" mam Philipsy za 60zło :P;) )... a moich MDR-EX51 nie chce mi się do kompa podłanczać...

BTW muszę się wybrać na jakieś badania słuchu... ponoć kiedyś słyszałem kamerton nastrojony na 22kHz i muszę to sprawdzić... lol :)

Mogę jedynie pogratulować i pozazdrościć uszu..

 

wiem... ale i tak mało kto to zrobi - jednym się nie będzie chciało, inni nie będą wiedzieli jak a reszta nie będzie miała takiej potrzeby ;)

To fakt, że prawdpopodobiństwo takiego zdarzenia jest niewielkie... Ale wyobraź sobie, że wszyscy zaczną polegać na wspomnianej sumie kontrolnej (która musiałaby też uwzgledniać badane pliki). Dowolna osoba, która posłużyłaby się wygenenerowaną sumą mogłaby sporo namieszać...

 

choć opcja --vbr-old -q 0 -X 0 kusi i długo trwa ;)

... dlatego wolę FhG... odnoszę wrażenie że lepiej brzmi i nie ma tylu opcji do przestawiania (ach te presety ;) )...

Cóż mogę powiedzieć - nie ma sensu dodawać żadnych dodatkowych parametrów. q0 ma wbrew pozorom negatywny wpływ na jakość (przetestowane), --vbr-old jest zdaje się domyślne, a -X już nie pamiętam do czego służył :)... w każdym razie jeszcze raz - wystarczą same presety = brak opcji do przestawiania. Kompresja trwa nieco dłużej - to jest jedyna wada.. LAME 4 ma za zadanie ją usunąć :)

 

BTW to ta sama strona... odnośnik do tej którą podałeś jest na stronie podanej przezemnie... to część tej samej strony... ;]

Ten sam serwer, ten sam temat, ale strona inna :lol:

Odnośnik do komentarza
Udostępnij na innych stronach

który z kodeków produkuje większe zniekształcenia... zdziwiłbym się, gdyby był to LAME...

coz... lame zupelnie inaczej rozwiazuje "problem" wysokich czestotliowosci - dodaje ich wiecej do dzwieku... przez to moze znieksztalcenia sa nieznacznie wieksze (moze - takich konkretnie testow jeszcze nie robilem)...

FhG za to dodaje malo (ale SA i do tego sa lepiej wybrane niz w lame'ie...) czestotliwosci >16kHz... ALE dzieki temu niemal nie ma znieksztalcen nawet przy malym bitrate'cie... ale z pewnym zubozeniem wyzszych rejestrow...

oczywiscie sa to roznice niewielkie i subiektywne (jakkolwiek wplywajace na odbior panoramy utworu)... ale:

 

dla przykladu dudy ze stronki quality (tak, sam ja wskazalem, to czesc stronki o gpsycho tylko inny plik .html ! ;) ) lepiej wypadaja na lame'ie bo zostawia wiecej gornych harmonicznych... za to FhG (biorac pod uwage bitrate <160... wlasciwie 128... nie wiem dlaczego na nich testy kaza mi robic o_O' ) ma zauwazalnie czystsze brzmienie... ale dudy brzmia czysto i "nie-do-konca-pelnie" (ale glupie slowo :P )... dla konkretnie 128kbps...

 

Dowolna osoba, która posłużyłaby się wygenenerowaną sumą mogłaby sporo namieszać...

ale nie o to mi chodzilo... niescisle sie wyrazilem... ;) chodzilo mi o to ze w samym pliku .txt z WYNIKIEM (ten co sie kaze zapisac po ukonczeniu testu) powinna byc dodatkowa linijka... taka w stylu: "AB34x6ssY765aZERt4" (... bylaby to prosta suma kontrolna, ktora daloby sie podrobic w czymkolwiek...) ale jakby ktos nie wiedzial to bylaby to pewna forma zabezpieczenia przy publikacji logow... bo zawsze sobie mozna samemu takiego loga napisac w notatniku ;) bylby tez prosty programik pokazujacy CRC-OK albo CRC-Error

 

insza inszosc ze powie ktos: "skoro zabezpieczenie slabe, to po co wogole? jak robic to odrazu powazne i pewne..."... ale coz ;)

 

nie ma sensu dodawać żadnych dodatkowych parametrów

hmm... z -q 0 i tak o wiele dluzej kompresja trwa... a gozej brzmiec nie moze, optymalizacja nikomu jeszcze nie zaszkodzila bo z zasady jest to proces BEZSTRATNY ;) ... no ale mozna z tego zrezygnowac...

a -X jest wlasnie od tego, w jaki sposub LAME wykrywa znieksztalcenia dzwieku powstale w wyniku kwantyzacji... -X 0 jest najbardziej wypasione bo kryteria sa najostrzejsze... ;)

Odnośnik do komentarza
Udostępnij na innych stronach

coz... lame zupelnie inaczej rozwiazuje "problem" wysokich czestotliowosci - dodaje ich wiecej do dzwieku... przez to moze znieksztalcenia sa nieznacznie wieksze (moze - takich konkretnie testow jeszcze nie robilem)...

FhG za to dodaje malo (ale SA i do tego sa lepiej wybrane niz w lame'ie...) czestotliwosci >16kHz... ALE dzieki temu niemal nie ma znieksztalcen nawet przy malym bitrate'cie... ale z pewnym zubozeniem wyzszych rejestrow...

oczywiscie sa to roznice niewielkie i subiektywne (jakkolwiek wplywajace na odbior panoramy utworu)... ale:

W tym problem - nie dyskutujemy o różnicach subiektywnych - o takich rozmawiają tzw. "audiofile" i "dowodzą", że mp3 nie daje się słuchać.

Poza tym hipoteza nie jest słuszna - ustawienia lowpassu są zdefiniowane w LAME - koder automatycznie dobiera te parametry przy danym ustawieniu jakości/bitrate'u w ten sposób, aby dla człowieka niesłyszącego powyżej odcięcia filtru dolnoprzepustowego dźwięk był możliwie nieodróżnialny od oryginału (oczywiście osiągane jest to z różnym powodzeniem). Jeżeli LAME zostawia więcej wysokich częstotliwości to na pewno jest w tym jakaś filozofia uwarunkowana przez model psychoakustyczny tego kodera (zapewne znacznie lepszy niż ten użyty w FhG). Wszystko oczywiście po to, aby w jedynie obiektywnym teście (= ślepym) różnice były możliwie niesłyszalne.

Dlatego też czekam na testy ABX i komentarze..

 

dla przykladu dudy ze stronki quality (tak, sam ja wskazalem, to czesc stronki o gpsycho tylko inny plik .html ! ;) ) lepiej wypadaja na lame'ie bo zostawia wiecej gornych harmonicznych... za to FhG (biorac pod uwage bitrate <160... wlasciwie 128... nie wiem dlaczego na nich testy kaza mi robic o_O' ) ma zauwazalnie czystsze brzmienie... ale dudy brzmia czysto i "nie-do-konca-pelnie" (ale glupie slowo :P )... dla konkretnie 128kbps...

W którym miejscu dokładnie? Niestety nie potrafię znaleźć różnicy między oryginałem a LAME (3.96.1 --alt-preset cbr 128) a kodekiem Fraunhofera (128 kbps, 44100 Hz, Stereo, lowpass 15804, allow M/S, allow IS - czyli ustawienia standardowe z Adobe Audition 1.5) - wszystkie brzmią dla mnie identycznie, albo nie wiem czemu się przysłuchiwać - może jakieś wskazówki?.... Czy możesz także zamieścić swój test ABX LAME vs oryginał i Fraunhofer vs oryginał?

 

ale nie o to mi chodzilo... niescisle sie wyrazilem... ;) chodzilo mi o to ze w samym pliku .txt z WYNIKIEM (ten co sie kaze zapisac po ukonczeniu testu) powinna byc dodatkowa linijka... taka w stylu: "AB34x6ssY765aZERt4" (... bylaby to prosta suma kontrolna, ktora daloby sie podrobic w czymkolwiek...) ale jakby ktos nie wiedzial to bylaby to pewna forma zabezpieczenia przy publikacji logow... bo zawsze sobie mozna samemu takiego loga napisac w notatniku ;) bylby tez prosty programik pokazujacy CRC-OK albo CRC-Error

Dokładnie w ten sposób zrozumiałem to, o czym napisałeś wcześniej. Coś jest nie tak? :blink:

 

insza inszosc ze powie ktos: "skoro zabezpieczenie slabe, to po co wogole? jak robic to odrazu powazne i pewne..."... ale coz ;)

Nie sądze, aby zabezpieczenie tego typu mogłoby być w jakikolwiek sposób pewne..

 

hmm... z -q 0 i tak o wiele dluzej kompresja trwa... a gozej brzmiec nie moze, optymalizacja nikomu jeszcze nie zaszkodzila bo z zasady jest to proces BEZSTRATNY ;) ... no ale mozna z tego zrezygnowac...

a -X jest wlasnie od tego, w jaki sposub LAME wykrywa znieksztalcenia dzwieku powstale w wyniku kwantyzacji... -X 0 jest najbardziej wypasione bo kryteria sa najostrzejsze... ;)

Co rozumiesz przez pojęcie "proces stratny" w odniesieniu do qX? q0 nie jest ustawianiem standardowym z lepszą bezstratną kompresją! Wystarczy przejrzeć ustawienia Vx w kodzie LAME. Jak już wspomniałem - zostało wykazane, że q0 ma negatywny wpływ na jakość. Jego używanie nie ma najmniejszego sensu - poza tym kompresja, jak sam zauważyłeś, trwa dłużej. Po co dodawać -X? Czy jesteś w stanie w teście ABX odróżnić preset standardowy od oryginału? Jeżeli tak - czy zmiana parametru X zmienia ten stan rzeczy?

Czy zdajesz sobie sprawę jak długo testowane były presety z LAME 3.90.3? Gdyby jakiś parametr był przydatny na pewno byłby uaktywniany automatycznie wraz z presetem.

Odnośnik do komentarza
Udostępnij na innych stronach

tak tak... chodzi właśnie o inny model psychoakustyczny... LAME ma defacto lepszy niż "standardowy" dekoder... ale ten z FhG też nie jest zły... to zależy o jakiej konkretnie próbce mówimy (tu się muszę zgodzić - w rzeczy samej czasem LAME brzmi lepiej niż FhG... vide dudy...)

a różnice są... no cóż... nie wdawajmy się w dyskusję jak bardzo są zauważalne, ale są...

 

co prawda zaczął mi się nowy semestr... a dotego zalegam z pewnym tłumaczeniem, ale postaram się przygotować taki test i w wolnej chwili zamieścić tu te pliki... (czytaj: nie wiem kiedy, ale będą ;) )

tak BTW oryginał vs 128kbps to nie sztuka... schody zaczynają się przy 192... a to i tak zależy od muzyki... ;)

(jednak nawet 320 - w pewnych przypadkach - można rozpoznać z niemal 100% skutecznością - chodzi o znaną na pamięć, słuchaną z CD-Audio muzykę bogatą w wysokie rejestry... ;) )

 

wskazówki?... hmm... niewiem, mógłbym próbować na żywo... ale na forum? :]

może tak: odpal w auditionie plik .wav, odpal "spectral view", zaznacz częstotliwości tak 16-20kHz, "edit->copy to new" i przysłuchaj się... jak niczego nie słyszysz (jak 5 z 6 osób które NIEŚWIADOMIE brały udział w teście, znaczy: "słyszysz to?... taki pisk czy coś... co nie słyszysz?" ;) -- test na dobrych głośnikach Creative'a )... to możesz wybrać dowolny koder... czyli LAME ;)

... jeżeli słyszysz to spróbuj wyłapać to uchem na dobrych słuchawkach (górne rejestry, ponoć z uwagi na budowę ucha, słychać nieco "u góry"... nie wiem jak to wytłumaczyć ale w zasadzie to działa :] )

 

potem po wielu przesłuchach pliku .wav posłuchaj plików .mp3 w wysokiej jakości (!) ale z lowpassem na 16kHz... porównaj czy i czego NIE słyszysz

teraz czas na prawdziwy test ABX dudy .wav vs dudy .mp3 :)

 

... nie wiem czy coś pomogłem :)

 

 

co do -q 0... "optymalizacja tablic huffmana" kojaży mi się ze zmniejszaniem objętości plików .jpg BEZ ZMIANY ich jakości (na przykład Photoshop tak umie)... pliki .mp3 pakowane są metodą huffmana... bezstratną... czasem może być to upakowanie większe, czasem mniejsze... ale i tak każde jest w 100% bezstratne... po prostu zależy to ile czasu chcemy poświęcić na kompresję/dekompresję...

... to co mówisz tłumaczyłem sobie tak, że niektóre dekodery mają po prostu problem z szybkim dekompresowaniem "lepiej" upakowanych plików... a kodu nie widziałem...

 

testów dotyczących -X 0 także nie robiłem... uznałem że opis jest najbardziej obiecujący (przeczytaj ;) ) :) ...

Odnośnik do komentarza
Udostępnij na innych stronach

tak tak... chodzi właśnie o inny model psychoakustyczny... LAME ma defacto lepszy niż "standardowy" dekoder... ale ten z FhG też nie jest zły... to zależy o jakiej konkretnie próbce mówimy (tu się muszę zgodzić - w rzeczy samej czasem LAME brzmi lepiej niż FhG... vide dudy...)

a różnice są... no cóż... nie wdawajmy się w dyskusję jak bardzo są zauważalne, ale są...

 

co prawda zaczął mi się nowy semestr... a dotego zalegam z pewnym tłumaczeniem, ale postaram się przygotować taki test i w wolnej chwili zamieścić tu te pliki... (czytaj: nie wiem kiedy, ale będą ;) )

tak BTW oryginał vs 128kbps to nie sztuka... schody zaczynają się przy 192... a to i tak zależy od muzyki... ;)

(jednak nawet 320 - w pewnych przypadkach - można rozpoznać z niemal 100% skutecznością - chodzi o znaną na pamięć, słuchaną z CD-Audio muzykę bogatą w wysokie rejestry... ;) )

Ktoś tu chyba ma bogatą wyobraźnię ;)

 

wskazówki?... hmm... niewiem, mógłbym próbować na żywo... ale na forum? :]

może tak: odpal w auditionie plik .wav, odpal "spectral view", zaznacz częstotliwości tak 16-20kHz, "edit->copy to new" i przysłuchaj się... jak niczego nie słyszysz (jak 5 z 6 osób które NIEŚWIADOMIE brały udział w teście, znaczy: "słyszysz to?... taki pisk czy coś... co nie słyszysz?" ;) -- test na dobrych głośnikach Creative'a )... to możesz wybrać dowolny koder... czyli LAME ;)

... jeżeli słyszysz to spróbuj wyłapać to uchem na dobrych słuchawkach (górne rejestry, ponoć z uwagi na budowę ucha, słychać nieco "u góry"... nie wiem jak to wytłumaczyć ale w zasadzie to działa :] )

Zrobiłem wszystko wg tego, o czym mi napisałeś. Sorry wielkie, ale wysokich częstotliwości w pipes.wv (o ten plik chodzi?) praktycznie w ogóle nie ma (są wyjątkowo ciche). Jest tylko jeden dropout w okolicach 5 sekundy, ktory słyszę całkiem wyraźnie. Nie stanowi on na pewno treści muzycznej, która "wykłada" dany enkoder - nie o to przecież chodzi. W każdym razie - wyższe dźwięki są maskowane przez całość - różnica wynosi ok 60 dB! Nawet jeżeli posiadasz jakiś nieziemski słuch - jakim cudem jesteś w stanie usłyszeć tak zagłuszane dźwięki?

Oczywiście - zawsze można zwiększyć głośność w ten sposób, żeby wspomniane dźwięki (>16 kHz) stały się słyszalne; ale wyobraź sobie jak głośno będą wówczas "wydzierały" się częstotliwości < 16 kHz...

 

Tak btw - przecież nie o kodowanie wysokich częstotliwości chodzi w tym samplu.

 

potem po wielu przesłuchach pliku .wav posłuchaj plików .mp3 w wysokiej jakości (!) ale z lowpassem na 16kHz... porównaj czy i czego NIE słyszysz

teraz czas na prawdziwy test ABX dudy .wav vs dudy .mp3 :)

Nie rozumiem po co mam kodować plik do wysokiej jakości, skoro nie mogę odróżnić CBR 128 kbps od oryginału (z wyjątkiem tego "skoku" ok 5 sekund).

Z niecierpliwością czekam na rezultaty testu..

 

co do -q 0... "optymalizacja tablic huffmana" kojaży mi się ze zmniejszaniem objętości plików .jpg BEZ ZMIANY ich jakości (na przykład Photoshop tak umie)... pliki .mp3 pakowane są metodą huffmana... bezstratną... czasem może być to upakowanie większe, czasem mniejsze... ale i tak każde jest w 100% bezstratne... po prostu zależy to ile czasu chcemy poświęcić na kompresję/dekompresję...

... to co mówisz tłumaczyłem sobie tak, że niektóre dekodery mają po prostu problem z szybkim dekompresowaniem "lepiej" upakowanych plików... a kodu nie widziałem...

Dekodery nie mają żadnych problemów. Problem leży w samym q0. Jak już wspomniałem - to nie jest czysta bezstratna kompresja w porównaniu do ustawienia standardowego! Ile razy mam się jeszcze powtórzyć? Zmieniany (przy q0) jest jeszcze jeden parametr (nie wiem jak to wygląda w najnowszych wersjach testowych - alpha), który ma wpływ na dźwięk. Parametr q nie zmienia wyłącznie techniki kompresji bezstratnej.

 

testów dotyczących -X 0 także nie robiłem... uznałem że opis jest najbardziej obiecujący (przeczytaj ;) ) :) ...

I to jest błąd... Powtórzę się raz jeszcze: jeżeli włączenie tego parametru miałoby dać jakąś korzyść - na pewno już dawno ktoś by się o to zatroszczył. Wobec tego - albo parametr wpływa na dźwięk negatywnie albo jego włączenie nie daje jakiejkolwiek słyszalnej poprawy i np. tylko zwiększa bitrate.

Odnośnik do komentarza
Udostępnij na innych stronach

nie wiem o co chodzi z tą wyobraźnią więc uznam to za komplement, THX ;)

 

Nie stanowi on na pewno treści muzycznej, która "wykłada" dany enkoder - nie o to przecież chodzi. W każdym razie - wyższe dźwięki są maskowane przez całość - różnica wynosi ok 60 dB! Nawet jeżeli posiadasz jakiś nieziemski słuch - jakim cudem jesteś w stanie usłyszeć tak zagłuszane dźwięki?

 

niby tak... ale paradoksalnie słychać... zwłaszcza na głośnikach mających płaskie pasmo przenoszenia w wysokich rejestrach - Cambrige Sound Works (na tych testuję) lub jakieś trójdrożne - byleby miały gwizdki :)

pozatym ludzki słuch ma znaczną dynamikę/rozpiętość poziomów słyszalnych dźwięków (nie wiem jakie jest fachowe określenie na to)...

... co więcej słyszalność różnych częstotliwości jest różna... chodzi o krzywe słyszalności na bazie których przygotowywano pierwsze modele psychoakustyczne słuchu... na przykład>> TOTO << nie zawsze 60dB, 60dB równe... generalnie jest tak, że gdyby poziomy te były równe (znaczy niskie i wysokie rejestry, bez kilkudziesięciu dB różnicy... to powstałoby coś jak różowy bodajże szum - gdzie wszystkie r ejestry mają TEN SAM poziom głośności... nie jest to przyjemne... z całego spektrum słychać TYLKO PISKI)...

biały szum jest równomierny dla WSZYSTKICH częstotliwości (a i tak nie jest to na histogramie prosta tylko krzywa wykładnicza), a brązowy szum to taki, gdzie przeważają niskie częstotliwości (nie słychać wysokich - poziom dla 16kHz = -92dB )...

 

pozatym niekoniecznie pewne dźwięki muszą być słyszalne aby miały wpływ na odczucie dźwięku... a wpływają pomimo że są "niesłyszalne"...

 

 

oczywiśnie nie "podrasowuję" dźwięku w momencie testowego odsłuchu - w sterownikach dźwiękówki "effects->none" i dwupunktowy equalizer na "flat" (Creative

SB Live! 5.1 i Audigy "1" + moduł zewnętrzny)

 

 

a to z wysokimi częstotliwościami i słyszalnoiścią mimo takiej różnicy muszę potwierdzić... bo... kurde, to głupie :) ale przyznaję wyższość FhG (ale starego, z CoolEdita! :) nie miałem akurat Auditiona 1.5 na kompie u kolegi który miał głośniki lepsze niż moje więc szkoda takiej okazji puścić ;) ) tak więc...

 

FhG z CoolEdita 192 vs .wav - 16/16 , wyraźnie słychać braki w wysokich częstotliwościach (po tym poznałem... kolega miał większe trudności... 10/16)

 

za to LAME 3.96.1, również 192... i tu ja miałem problemy :/ najpierw pierwszy test pominę, w drugim miałem bodajże 11/16 ... kiepsko kiepsko :P jak dłużej posłucham to lepiej będę to wyłapywał...

 

 

teraz jestem ciekaw jak wypadnie FhG z A1.5 i mogę z czystym sercem czekać na LAME'a 4 ;)

 

BTW testy 128kbps daruję sobie... generalnie jak dotąd mam 16/16... więc szkoda czasu :)

 

 

EDIT:

OKi, pomińmy parametr -q 0 ... powiedzmy że udowodniłem sam sobie że "standard" LAME'a mnie satysfakcjonuje (THX za pomoc przez przymuszenie ;):) ) więc na razie będę tak wszystko kompresował (co będzie wygodne bo i Foobar2000 i EAC robią mi to "w locie" ;) )

 

co do -X 0 to on i tak chyba jest standardowo ustawiony... za to pozostałe - czyli od 1 do 9 są do testowania ;)

... ale nie mam gdzie tego sprawdzić, looknę czy po "--verbose" będzie takie info na listingu czy nie...

Odnośnik do komentarza
Udostępnij na innych stronach

niby tak... ale paradoksalnie słychać... zwłaszcza na głośnikach mających płaskie pasmo przenoszenia w wysokich rejestrach - Cambrige Sound Works (na tych testuję) lub jakieś trójdrożne - byleby miały gwizdki :)

pozatym ludzki słuch ma znaczną dynamikę/rozpiętość poziomów słyszalnych dźwięków (nie wiem jakie jest fachowe określenie na to)...

... co więcej słyszalność różnych częstotliwości jest różna... chodzi o krzywe słyszalności na bazie których przygotowywano pierwsze modele psychoakustyczne słuchu... na przykład>> TOTO << nie zawsze 60dB, 60dB równe... generalnie jest tak, że gdyby poziomy te były równe (znaczy niskie i wysokie rejestry, bez kilkudziesięciu dB różnicy... to powstałoby coś jak różowy bodajże szum - gdzie wszystkie r ejestry mają TEN SAM poziom głośności... nie jest to przyjemne... z całego spektrum słychać TYLKO PISKI)...

biały szum jest równomierny dla WSZYSTKICH częstotliwości (a i tak nie jest to na histogramie prosta tylko krzywa wykładnicza), a brązowy szum to taki, gdzie przeważają niskie częstotliwości (nie słychać wysokich - poziom dla 16kHz = -92dB )...

Wykres, który przedstawiłeś mówi o ile dB należy zwiększyć głośność na danej częstotliwości, aby dźwięk był słyszany z jednakową głośnością. Wobec tego sprawa ma się "jeszcze gorzej" niż przedstawiłem ją ja ;) (dzięki za przypomnienie - zupełnie o tym zapomniałem ;)). Nie jest prawdą, że gdyby poziomy te były równe to słyszelibyśmy tylko barwne szumy - dźwięki, które do nas docierają mają przecież różne częstotliwości i całe pasmo nie jest wypełnione. Przynajmniej nie powinno być - nowa muzyka, kompresowana na śmierć i maksymalnie wypychana niezjadliwą treścią - zaczyna coraz bardziej przypominać szum <_<. Poza tym nawet, gdyby całe pasmo było "zapchane" to nawet mimo róznic w głośności na pewnych częstotliwościach nadal słyszelibyśmy szum - tylko w nieco innych proporcjach.

 

pozatym niekoniecznie pewne dźwięki muszą być słyszalne aby miały wpływ na odczucie dźwięku... a wpływają pomimo że są "niesłyszalne"...

Ale też muszą być na pewnym poziomie głośności. Oczywiście wówczas także jest możliwość wykonania testu ABX.

 

a to z wysokimi częstotliwościami i słyszalnoiścią mimo takiej różnicy muszę potwierdzić... bo... kurde, to głupie :) ale przyznaję wyższość FhG (ale starego, z CoolEdita! :) nie miałem akurat Auditiona 1.5 na kompie u kolegi który miał głośniki lepsze niż moje więc szkoda takiej okazji puścić ;) ) tak więc...

 

FhG z CoolEdita 192 vs .wav - 16/16 , wyraźnie słychać braki w wysokich częstotliwościach (po tym poznałem... kolega miał większe trudności... 10/16)

 

za to LAME 3.96.1, również 192... i tu ja miałem problemy :/ najpierw pierwszy test pominę, w drugim miałem bodajże 11/16 ... kiepsko kiepsko :P jak dłużej posłucham to lepiej będę to wyłapywał...

Trochę nie rozumiem. Najpierw napisałeś, że przyznajesz wyższość FhG, a potem zaprezentowałeś wyniki z testu: "FhG z CoolEdita 192 vs .wav - 16/16" :blink:

Swoją drogą - ciekawe rezultaty...

11/16 to trochę mało reprezentatywny wynik... Czy możesz przy okazji podawać wartości prawdopodobieństwa jakie wyświetlał foobar?

 

(THX za pomoc przez przymuszenie ;)

Nie ma sprawy; mam nadizeję, że przyniesie to efekty i za jakiś czas Ty będziesz nawracał ludzi ;)

Odnośnik do komentarza
Udostępnij na innych stronach

  • 2 tygodnie później...
Gość ~KHRoN~

Sorki, ale mam 2 minuty :]

 

Z tym "wykresem głośności" to zamotałem, wiem... jeszcze o tym napiszę ;]

 

 

a z tym FhG vs WAV to było tak, że nie wyłapuję różnic na podstawie słyszalnych zniekształceń (bo FhG de facto takowych nie ma) tylko na bazie braku wyższych częstotliwości :]

 

 

I OKi, będę spisywał i podawał tu i wynik i prawdopodobieństwo.

 

 

Tak BTW to krucjata LAME@standard trwa, licznik nawróconych=5 (plus ja ;) ) ;)

Odnośnik do komentarza
Udostępnij na innych stronach

chciałem tylko dodać, że nowe testy wykazały że krzywe ISO z lat '60 dla ATH okazały się kompletnie błędne dla wyższych rejestrów (>10kHz, te dźwięki są znacznie LEPIEJ słyszalne niż wynika to z poprzednich testów) i stąd od którejśtam wersji LAME ma przełącznik "--athtype 2" opary na nowych testach -- to chyba najważniejszy powód mojej przesiadki na LAME'a... ;)

 

--preset standard używa właśnie "ATH type 2" :]

 

 

BTW w książce do neurobiologii znalazłem cały rozdział dotyczący "neuronalnego mechanizmu słuchu" i "anatomii narządów słuchowych" (dobre żeczy tam piszą o tych niesłyszalnych-słyszalnych wysokich dźwiękach...), a w pracowni neurofizjologii mam szczegółowy atlas mózgu (żebym wiedział o co na następnych badaniach rezonansem pytać ;) ) :) zapisałem się też na kurs bioakustyki (w sumie to zwykła akustyka + akustyka mowy + akustyka śpiewu ptaków na ostatnim wykładzie :] )... lol :)

 

... "szkoda" że nasza pracownia bada IGL będące elementem układu widzenia... a nie czegoś związanego ze słuchem ;]

 

... za jakiś czas zgłoszę się do projektu LAME jako ekspert ;) ;) ;)

Odnośnik do komentarza
Udostępnij na innych stronach

  • 2 tygodnie później...

hmm... po tych wszystkich bojach z LAME'em kupiłem sobie playerka z 256MB (nie... nie iRiver tylko Creative MuVo TX FM... iRiver ma jak dla mnie cenę zaporową :P ) i chciałem sprawdzić jak sprawuje się format WMA w praktyce...

 

... hmm...

 

biorąc pod uwagę NISKI poziom masteringu płyt CD-Audio które mam/słucham/mam do nich dostęp (głównie metal, rock, chóralna, new age i takie tam, z jazzem o wiele lepiej :) ) stwierdzić muszę że:

 

WMA@128 sprawuje się świetnie w 99% przypadków... wiem że to dziwne ale prawdziwe :]

dość szerokie pasmo przenoszenia, niemal brak zniekształceń dźwięku, doskonały model psychoakustyczny...

 

... do playerów polecam WMA@128 :]

Odnośnik do komentarza
Udostępnij na innych stronach

Dołącz do dyskusji

Możesz dodać zawartość już teraz a zarejestrować się później. Jeśli posiadasz już konto, zaloguj się aby dodać zawartość za jego pomocą.

Gość
Dodaj odpowiedź do tematu...

×   Wklejono zawartość z formatowaniem.   Usuń formatowanie

  Dozwolonych jest tylko 75 emoji.

×   Odnośnik został automatycznie osadzony.   Przywróć wyświetlanie jako odnośnik

×   Przywrócono poprzednią zawartość.   Wyczyść edytor

×   Nie możesz bezpośrednio wkleić grafiki. Dodaj lub załącz grafiki z adresu URL.

×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Zarejestruj się aby mieć większy dostęp do zasobów forum. Przeczytaj regulamin Warunki użytkowania i warunki prywatności związane z plikami cookie Polityka prywatności