Što je dubina zvučnog kodiranja? Definicija, formula

Audio kodiranje odnosi se na metode pohrane i prijenosa audio podataka. Sljedeći članak opisuje kako ta kodiranja funkcioniraju.

sadržaj

Kako pronaći dubinu kodiranja zvuka
Što je dubina zvučnog kodiranja?
Brzina uzorkovanja
Dubina bita
Ne komprimirani zvuk
Komprimirani zvuk
Bez gubitaka
Gubitak kompresije
Drugi oblici kompresije

Imajte na umu da je to prilično složena tema - "Dubina zvučnog kodiranja". Definicija ovog koncepta također će se dati u našem članku. Koncepti predstavljeni u ovom članku namijenjeni su samo općem pregledu. Neka nam otkriti koncepte dubine kodiranja zvuka. Neki od tih referentnih podataka mogu biti korisni za razumijevanje funkcioniranja API-ja i načina oblikovanja i obrade zvuka u vašim aplikacijama.

Kako pronaći dubinu kodiranja zvuka

Audio format ne odgovara audio kodiranju. Na primjer, popularni format datoteke, kao što je WAV, određuje format zaglavlja audio datoteke, ali nije samo kodiranje zvuka. WAV audio datoteke često, ali ne uvijek koriste linearno PCM kodiranje.

Zauzvrat, FLAC je i format datoteke i kodiranje, što ponekad dovodi do neke konfuzije. Unutar Speac API FLAC, dubina audio kodiranja je jedino kodiranje koje zahtijeva da audio podaci uključuju zaglavlje. Sva ostala kodiranja ukazuju na tihi audio podaci. Kada se govorimo o FLAC u govornom API-ju, uvijek se odnose na kodek. Kada se govorimo o FLAC formatu, koristit ćemo format ".FLAC". dubina zvučnog kodiranja je

Ne morate odrediti kodiranje i brzinu uzorkovanja za WAV ili FLAC datoteke. Ako je ovaj parametar izostavljen, Cloud API automatski određuje brzinu kodiranja i uzorkovanja za WAV ili FLAC datoteke na temelju zaglavlja datoteke. Ako navedete vrijednost kodiranja ili uzorku koja ne odgovara vrijednosti u zaglavlju datoteke, API za oblak će vratiti pogrešku.

Što je dubina zvučnog kodiranja?

Audio se sastoji od oscilograma koji se sastoje od interpolacije valova različitih frekvencija i amplituda. Za prikaz tih valnih oblika u digitalnom okruženju, signali moraju biti odbijeni brzinom koja može predstavljati najviše zvukove frekvencije koje želite reproducirati. Također je potrebno da pohranjuju dovoljnu dubinu bitova kako bi prikazali ispravnu amplitudu (glasnost i mekoću) oscilograma prema uzorku zvuka.

Sposobnost uređaja za obradu zvuka da se stvori frekvencija poznata je kao frekvencijski odziv, a sposobnost stvaranja odgovarajuće glasnoće i mekoće poznata je kao dinamički raspon. Zajedno, ti pojmovi često se nazivaju vjernost audio uređaja. Dubina šifriranja zvuka je sredstvo kojim možete obnoviti zvuk koristeći ova dva osnovna načela, kao i mogućnost učinkovite pohrane i prijenosa takvih podataka.

Brzina uzorkovanja

Zvuk postoji kao analogni valni oblik. Digitalni zvučni segment aproksimira ovaj analogni val i uzima svoju amplitudu s dovoljno velikom brzinom da simulira prirodne frekvencije vala. Frekvencija uzorkovanja digitalnog audio signala određuje broj uzoraka snimljenih iz izvornog audio materijala (u sekundi). Visoka brzina uzorkovanja povećava sposobnost digitalnog zvuka da točno predstavlja visoke frekvencije. dubina kodiranja zvuka je 8 bita

Kao posljedica Nyquist-Shannonovog teorema, obično je potrebno pokušati barem dva puta učestalost bilo kojeg zvučnog vala koji se mora digitalno snimiti. Na primjer, da predstavljaju zvuk u rasponu ljudskog sluha (20-20000 Hz), digitalni audio format bi trebao prikazati najmanje 40.000 puta u sekundi (što je i razlog da je zvuk CD-a koristi za uzorkovanje frekvencije 44100 Hz).

Dubina bita

Dubina kodiranja zvuka je učinak na dinamički raspon dotičnog uzorka zvuka. Veća dubina bita omogućuje preciznije amplitude. Ako imate puno glasnih i tihih zvukova u istom zvukovnom uzorku, trebat će vam više bita za pravilno slanje tih zvukova.

Veće dubine bita također smanjuju omjer signala i šuma u audio uzorcima. Ako je dubina audio kodiranja 16 bita, glazbeni zvuk CD-a se prenosi pomoću ovih vrijednosti. Neke metode kompresije mogu nadoknaditi manje dubine bita, ali obično su gubici. DVD Audio koristi 24 bita dubine, dok je u većini telefona dubina audio kodiranja 8 bita.

Ne komprimirani zvuk

Većina digitalne obrade zvuka koristi ove dvije metode (frekvencija uzorkovanja i dubina bita) za jednostavnu pohranu audio podataka. Jedna od najpopularnijih digitalnih tehnologija zvuka (popularizirana pomoću CD-a) poznata je kao modulacija pulsnog koda (ili PCM). Audio se odabire u zadanim intervalima, a amplituda uzorka vala u ovom trenutku pohranjena je kao digitalna vrijednost pomoću dubine bita uzorka.

Linearni PCM (što znači da je amplituda odgovor je linearna homogena uzorak) je standard koji se koristi u CD i kodirani LINEAR16 govora API. Oba kodiranje stvara nekomprimirani byte stream odgovara izravno audio podataka, a oba sadrže 16 bit standardne dubine. Linearni PCM koristi frekvenciju uzorkovanja od 44100 Hz CD-ROM-a koja je pogodna za reflow glazbe. Međutim, brzina uzorkovanja od 16.000 Hz je prikladnija za prepoznavanje govora.

Linear PCM (LINEAR16) je primjer nekomprimiranog zvuka, jer se digitalni podaci pohranjuju na sličan način. Tijekom čitanja tok jednog kanala bajtova, kodirane pomoću Linear PCM, možete izračunati svakih 16 bita (2 bajta) za različite vrijednosti amplitude signala. Skoro svi uređaji mogu biti manipulirane takvi digitalnih podataka izvorno - može se rezati Linear PCM audio datoteke s uređivanje teksta, ali nekomprimirani zvuk - nije najučinkovitiji način transporta ili pohranjivanja digitalnog zvuka. Iz tog razloga, većina audiozapisa koristi metode digitalne kompresije.

Komprimirani zvuk

Audio podaci, poput svih podataka, često su komprimirani, što olakšava njihovu pohranu i transport. Kompresija kod audio kodiranja može se pojaviti bez gubitka ili gubitka. Kompresija bez gubitaka može se dekomprimirati kako bi se digitalni podaci vratili u izvorni oblik. Kompresija nužno uklanja neke informacije tijekom dekompresijskog postupka i parametrira se tako da pokazuje stupanj tolerancije tehnici kompresije za brisanje podataka. proširiti koncepte dubine kodiranja zvuka

bez gubitaka

Bez gubitka, digitalni audio se komprimira, koristeći složene permutacije pohranjenih podataka, što ne dovodi do pogoršanja kvalitete izvornog digitalnog uzorka. S kompresija bez gubitaka, kada se podaci raspakiraju u izvorni digitalni oblik, podaci neće biti izgubljeni.

Dakle, zašto metode sažimanja bez gubitaka ponekad imaju parametre optimizacije? Ovi parametri često obrađuju veličinu datoteke za vrijeme dekompresije. Na primjer, FLAC koristi parametar nivoa kompresije od 0 (najbrži) do 8 (najmanji veličina datoteke). Viša kompresija FLAC neće izgubiti nikakve informacije u usporedbi s nižom razinom kompresije. Umjesto toga, algoritam kompresije jednostavno će morati potrošiti više računalnih snaga pri izgradnji ili dekonstrukciji originalnog digitalnog zvuka.

API govora podržava dva kodiranja bez gubitaka: FLAC i LINEAR16. Tehnički, LINEAR16 nije "kompresija bez gubitka", jer se kompresija ne koristi prvenstveno. Ako vam je važna veličina datoteke ili prijenos podataka, odaberite FLAC kao opciju kodiranja zvuka.

Gubitak kompresije

Komprimiranje audio podataka uklanja ili smanjuje neke vrste informacija pri izradi komprimiranih podataka. API govora podržava nekoliko oblika gubitka, iako ih treba izbjegavati jer gubitak podataka može utjecati na točnost prepoznavanja. dubina kodiranja zvuka

Popularni MP3 kodek primjer je metode gubitka kodiranja. Sve metode MP3 kompresija uklanjanje buke izvan normalnog audio osobe i reguliraju razinu kompresije podešavanjem efektivne stope podaci kodek MP3 ili broj bitova u sekundi za pohranu datuma zvuka.

Na primjer, stereo CD koji koristi linearni PCM od 16 bita ima efektivnu brzinu prijenosa. Formula za dubinu zvučnog kodiranja:

441000 * 2 kanala * 16 bita = 1411200 bita u sekundi (bps) = 1411 Kbps

Na primjer, MP3 kompresija uklanja takve digitalnih podataka putem brzina prijenosa podataka, kao što su 320 kbit / s, 128 kbit / s ili 96 kbit / s, što dovodi do pogoršanja kvalitete zvuka. MP3 također podržava varijabilne brzine prijenosa, što može dodatno komprimirati zvuk. Obje metode gube informacije i mogu utjecati na kvalitetu. Sa sigurnošću možemo reći da većina ljudi može odrediti razliku između kodirane MP3 glazbe 96 kbit / s ili 128 kbps. dubina kodiranja definicije zvuka

Drugi oblici kompresije

MULAW je 8-bitno PCM kodiranje gdje je amplituda uzorkovanja logaritamski modulirana, a ne linearna. Kao rezultat toga, uLaw smanjuje efektivnu dinamički raspon komprimiranog zvuka. Iako uLaw uvedena posebno za optimizaciju kodiranje govora za razliku od ostalih vrsta audio, 16-bitni LINEAR16 (nekomprimirani PCM) je još uvijek daleko superiorniji na 8-bitni komprimirani zvuk uLaw.

AMR i AMR_WB moduliraju kodirane audio kasete uvođenjem varijabilne brzine prijenosa u izvorni audio uzorak. Kako pronaći dubinu kodiranja zvuka

Iako API govora podržava nekoliko oblika gubitka, trebali biste ih izbjeći ako imate kontrolu nad izvornim zvukom. Iako je uklanjanje takvih podataka od strane sažimanje uz gubitak ne može imati zamjetan utjecaj na zvuk čujan za ljudsko uho, gubitak tih podataka sustav za prepoznavanje govora može značajno degradirati točnost.

Dijelite na društvenim mrežama:

Povezan