File multimediali: risoluzione, tipologie, estensioni ed altro ancora

In questo articolo vedremo come si crea, modifica e legge un file multimediale e quali sono le estensioni più diffuse.

Oggi più che mai, grazie alla diffusione quasi capillare di internet e degli Smartphone, siamo in grado di registrare, manipolare e riprodurre praticamente tutto, dai file audio ai file video. Sono lontani i tempi in cui le suonerie dei cellulari erano solo midi polifonici e i video 3GP in bassa risoluzione, grazie alla potenza dei moderni processori mobile, possiamo lavorare in Full HD, 2K e 4K.

Per capire meglio facciamo qualche esempio: cerchiamo un film da acquistare su iTunes e vediamo nel dettaglio quali sono le informazioni a nostra disposizione.

Nella schermata di iTunes ho aperto uno dei film che recentemente sono stati pubblicati nel negozio virtuale di Apple, in questo caso il film Arrival distribuito in qualità HD ed SD. Queste due sigle hanno un significato ben preciso e riportano:

HD = High Definition (Alta Definizione)
SD = Standard Definition (Definizione Standard)

L’alta definizione come standard, è ufficialmente composto da filmati che possono avere due diciture e risoluzioni diversi: l’HD il cui bollino o sigla definisce la risoluzione 1280x720p e il FULLHD con una risoluzione di 1920x1080p (Full HD ovvero piena alta definizione). Scendiamo più nel dettaglio e prendiamo in esame la prima dicitura HD. Ho scritto che la risoluzione è di 1280x720p, ciò vuol dire che un filmato in HD avrà 1280 pixel in orizzontale e 720 pixel in verticale e l’immagine è progressiva, ovvero piena. Riporto sotto un esempio per chiarire meglio le differenze tra un’immagine progressiva ed una interlacciata.

Vi chiederete perché mai un’immagine debba essere interlacciata visto che visivamente, ha un effetto a mo’ di tenda veneziana; senza dilungarmi troppo vi dico brevemente che l’interlacciato viene usato spesso nelle trasmissioni televisive per risparmiare sulla banda che l’emittente ha a disposizione. Chi guarda la TV infatti, non si accorge che l’immagine è interlacciata grazie al fatto che, i moderni televisori sono dotati di processori in grado di ricostruire le immagini mancanti tramite il deinterlacciamento e darci così la sensazione che non ci siano differenze tra un file interlacciato ed uno progressivo.

Torniamo nuovamente al nostro film su iTunes. Grazie al fatto che la definizione HD e FHD sono uno standard, sappiamo un altro elemento che può fare la differenza, ovvero i fotogrammi al secondo. I registi di Hollywood, per dare un effetto cinematico alle loro riprese, sono soliti registrare a 23.976 fotogrammi al secondo o più comunemente definiti fps (i 23.976 fps vengono chiamati anche Cinematic frames o 24p). I fotogrammi rappresentano le immagini che la cinepresa è in grado di registrare in un secondo e determinano la velocità con la quale gli oggetti o le persone si muovono sullo schermo. Più è alto il numero di fotogrammi e più saranno veloci le immagini, al contrario minori sono i fotogrammi e più i movimenti appariranno scattosi. In Europa ad esempio, le trasmissioni TV vengono registrate e trasmesse rispettivamente a 25 e 50 fps mentre negli Stati Uniti si utilizzano i 23.976. Diventa perciò importante capire queste informazioni all’interno di un file video perché potremmo riscontare problematiche varie nel momento in cui andremo a riprodurre uno di questi file che il nostro lettore da salotto non è in grado di leggere. Più avanti nella guida vedremo come modificare il numero di fotogrammi di un file per renderlo compatibile con il lettore che da noi utilizzato.

Parliamo ora di un altro aspetto molto importante quando si parla di contenuti in alta definizione: il DRM e l’HDCP. Il DRM (Digital Rights Management) è un sistema di protezione che, nel caso di film, la società cinematografica applica ai suoi prodotti per evitare le copie non autorizzate e la riproduzione con apparecchiature non certificate. Qui entra in gioco l’HDCP (High-Bandwith Digital Content Protection), sviluppato da Intel per i Blu-Ray Disk in alta definizione. È richiesta la compatibilità tra il lettore che andrà a riprodurre il disco o file ed il Televisore/Schermo a cui si collegherà tramite cavo HDMI (High Definition Multimedia Interface).


Come potete vedere, esistono varie versioni del protocollo HDCP di cui l’ultimo è il 2.2 sviluppato appositamente per la visione di contenuti in 4K a 60 fps. I cavi HDMI di ultima generazione compatibili con la versione 2.2 sono anche retro compatibili con le precedenti, perciò non sarà necessario l’acquisto di un cavo per ogni generazione ma assicuratevi che la qualità dello stesso sia alta e preferibilmente con i contatti placcati d’oro per migliorare la trasmissione del segnale (l’oro infatti è un metallo altamente conduttivo). Potrete trovare degli ottimi affari su Amazon con i cavi di loro produzione e sarete in grado di scegliere l’esatto metraggio che vi serve.

Veniamo ora ad un argomento che merita la medesima attenzione: le estensioni. Tutti sappiamo cambiare il nome di un file ma pochi conoscono bene le estensioni; elementi che nel settore audio e video sono di primaria importanza. L’estensione indica infatti il tipo di file (video, audio, testo, immagini) e consente al sistema operativo di sapere qual è l’applicazione in grado di aprire e modificare un filespecifico

Nella schermata d’esempio propongo quattro diverse estensioni: .mkv, .mp4, .aac ed. srt.
L’MKV nasce nel 2002 come progetto open source con lo scopo di offrire una soluzione più efficace ed evoluta rispetto al container principalmente usato fino ad allora: l’MP4. Per container s’intende, facendo un esempio, la scatola all’interno della quale metteremo i nostri file audio e video. Sarà quindi solamente un contenitore di file.

L’MKV in sintesi è in grado di compiere tutto ciò che l’MP4 offre, ma permette di andare ben oltre aumentando le possibilità, come ad esempio l’inserimento di più tracce audio e video, sottotitoli con i relativi font (o caratteri) e la capacità di essere utilizzato anche per il 3D. E’ de facto lo standard open source per le fonti in alta definizione maggiormente diffuso online tra forum ed utenti, al contrario l’MP4 viene utilizzato da tutti i produttori di contenuti come le Major Cinematografiche, studi fotografici e altri.

Come funziona il processo di creazione di un file ad esempio .mkv o .aac?

Per poter creare correttamente un file digitale audio e video, dobbiamo prima di tutto partire da una sorgente ovvero un file di origine che poi verrà compresso (rielaborato) per essere riprodotto sul nostro computer o smartphone. Il processo di conversione può essere fatto per far leggere il nostro file ad un lettore che altrimenti non potrebbe riprodurlo. Esistono dei programmi appositi che ci permettono di trasformare i file in diversi formati, noi ne analizzeremo uno gratuito: HandBrake.

La compressione avviene grazie ad un algoritmo (h.263h.264h.265) che il nostro computer elaborerà per la trasformazione del file. Come è stato detto prima, un film è formato da una parte video ed una audio che, dopo aver sottoposto a compressione, produrrà un file .mkv come nell’esempio. L’algoritmo si occuperà, in base a dei parametri impostati da noi, di ridurre o conservare la qualità originaria del nostro file e proprio in virtù di questa scelta, significherà avere come output un file di grandi o di piccole dimensioni. L’algoritmo più recente che troviamo oggi sul mercato è l’h.265, in grado di comprimere un file di alta qualità occupando all’incirca la metà dello spazio che avrebbe occupato un file compresso con l’h.264, tuttavia dato che è molto recente, per poterlo riprodurre e comprimere sarà necessario disporre di una CPU molto recente e una scheda video altrettanto potente. (Con gli ultimi processori Intel Skylake, Kaby Lake e Apollo Lake il processore è dotato di una scheda video in grado di convertire e riprodurre velocemente proprio questo tipo di file. Parliamo in gergo di hardware acceleration o tradotto, accelerazione hardware).

L’algoritmo, come altre cose, è soggetto al pagamento di royalties per poter essere usato. Perciò sono nate delle alternative open source chiamate rispettivamente x.263x.264x.265 le quali riescono in alcuni frangenti ad essere di gran lunga migliori rispetto alle controparti a pagamento. Usando i programmi come HandBrake verrà adottato direttamente lo stand open source. In ogni caso per l’utente finale che vuole godersi i suoi file nei lettori come PS4, Xbox One o PC, non cambia niente.

Parliamo ora di tracce audio. Nel file d’esempio possiedo un file .aac che nel caso del nostro film, consisterà nel doppiaggio in italiano, l’AAC è una versione più evoluta dell’MP3 che si usava e si usa tutt’ora, per la registrazione delle canzoni. Se acquistiamo una canzone dal Google Play Music o da Amazon Music, al 100% il file che otterremo sarà un MP3, mentre invece acquistando una canzone da iTunes otterremo un M4A (un MP4 solo audio, è sempre convertito in AAC). Non tutti i file musicali però sono uguali, infatti anche tra MP3 o AAC ci sono delle differenze: analizziamole brevemente.

La cosa più importante a cui possiamo fare riferimento quando parliamo di audio è, ovviamente, la sua qualità, espressa in bit rate al secondo. Il bit rate è un algoritmo che mette in relazione la qualità con la compressione. E’ un rapporto proporzionale: maggiore è la compressione e minore sarà la qualità finale e lo spazio occupato. Maggiore è il bit rate e più elevata sarà la qualità del file che stiamo ascoltando ma allo stesso tempo, più spazio occuperà sul disco del nostro computer; questa regola vale per tutto ciò che è audio e video perché il bit rate indica quante informazioni al secondo vengono trasportate, quindi più informazioni abbiamo e migliore sarà l’ascolto. Esistono infatti due tipologie di file: lossless (WAV, FLAC, ALAC) e lossy (AAC, MP3 ecc.); la prima indica tutti quei file che non hanno subito perdita di qualità (lossless = senza perdita) e corrispondono alla nostra sorgente, mentre la seconda indica un file che ha subito dei tagli (lossy) e quindi essendo stato compresso, non avrà mai la stessa qualità del precedente. Molte persone a volte fanno lo sbaglio di riconvertire un file lossy in un altro lossy, ad esempio da un MP3 a 128 kbit/s ad un MP3 da 90 kbit/s, oppure ancora da MP3 a 128 kbit/s a MP3 a 320 kbit/s. L’errore sta proprio nel fatto che stiamo manipolando un file che ha già subito una perdita di qualità e non potrà mai recuperare le informazioni perse a causa della compressione, a maggior ragione se proviamo a salvarlo con un bit rate superiore.

Per qualsiasi lavoro di compressione bisogna partire dal file sorgente. Quindi se noi possediamo il CD musicale di Celine Dion e vogliamo avere gli MP3 a 128 kbit/s, dobbiamo partire dalla fonte più alta (CD) per ottenere la fonte lossy. Se per caso cambiamo idea e vogliamo un file di qualità migliore, dobbiamo sempre partire dal CD e convertire le tracce a 320 kbit/s ad esempio, mai il contrario.

Quindi che differenza c’è tra MP3 ed AAC?

Bene, la differenza sta nel fatto che l’AAC riesce a parità di bit rate, a conservare maggiore qualità rispetto all’MP3 grazie ad un migliore algoritmo. Durante il processo di conversione di una canzone in MP3, il brano musicale viene suddiviso in chunks o frammenti ai quali vengono rimosse tutte quelle frequenze non percettibili da nostro udito (quindi diciamo superflue).

Nell’immagine ho messo a confronto la stessa canzone estratta dal CD in FLAC e convertita sempre dal CD in AAC (a 320 kbit/s). In alto si trova il file in FLAC (ricordiamo non compresso), mentre in basso si trova l’AAC. Come potete vedere, il file AAC ha delle parti più colorate che segnano la mancanza di informazioni dovute alla compressione, mentre il file originale risulta molto più uniforme; perciò la differenza per chi ha un udito molto sensibile, è davvero notevole. Tenete presente che la stessa canzone in FLAC occupa 44 MB circa mentre in AAC ne occupa 4,5 MB…la differenza di spazio è abissale.

Un altro aspetto importante da tenere presente nei file audio è il modo in cui il bit rate viene calcolato, perché esistono 3 diversi metodi:
CBR;
ABR;
VBR;

CBR significa (Constant Bit rate) cioè bit rate costante e in soldoni, indica che la nostra canzone avrà per tutta la sua durata, lo stesso bit rate che abbiamo impostato all’inizio (es. 128 – 196 – 256 – 320). Impostando un bit rate costante, otterremo un file di dimensioni minori e sarà più leggero da riprodurre, specie per tutti quei lettori molto datati, però sacrificheremo una buona parte della qualità del nostro file.
ABR significa (Average Bit Rate) ed indica un bit rate che in media non scenderà mai al di sotto dei valori che abbiamo impostato, ma potrà aumentare quando necessario. Quest’impostazione avrà il vantaggio di permettere alla canzone, di avere un’acustica migliore nelle parti più complesse del brano risparmiando bit rate per i silenzi o i passaggi con poca dinamica.
VBR significa (Variable Bit Rate) e indica un bit rate variabile ovvero che si modificherà automaticamente, in aumento o in diminuzione a seconda della dinamica della canzone, permettendo in questo modo di ottenere un file di dimensioni maggiori ma con qualità più elevata. Il VBR è secondo me, da preferire rispetto agli altri due perché dà come output un file migliore qualitativamente.

Vediamo infine le estensioni per i file dei sottotitoli che nell’esempio vengono indicati da .srt. Esistono una molteplicità di file di sottotitoli, i più diffusi sono gli SRT, i VOBSUB per i DVD e i SUP per i Blu-ray.

Un file di sottotitoli appare più o meno così:

Abbiamo un numero di riga, un tempo di inizio, uno di fine e un campo testuale dove vengono trascritte le battute recitate dall’attore/attrice o dal conduttore/conduttrice. Quando si realizzano i sottotitoli bisogna prestare particolare attenzione perché il testo deve sempre coincidere con il tempo che ha l’attore per recitare la propria battuta. Esistono dei software come quello in figura, che permettono di realizzare, modificare e salvare i sottotitoli in diversi formati e, come per l’audio, bisogna assicurarsi che il lettore sia in grado di leggere il file senza errori. Molto spesso infatti, quando ci sono lettere accentate come in italiano (è, ò, à, ù, è) la visualizzazione può subire delle distorsioni, se il lettore non è in grado di interpretare correttamente lo standard ISO della lingua. Quando scaricate o realizzate un file di sottotitoli e avete problemi nella visualizzazione, basterà cambiare lo standard in cui è stato salvato per risolvere senza troppe difficoltà, solitamente si passa da Unicode UTF-8 a Windows 1252 (e viceversa).

Riconoscimenti (Credits)
Audio Icon made by Freepick from www.flaticon.com
Right arrow Icon made by Lyolya from www.flaticon.com
Italian flag Icon made by Freepik from www.flaticon.com
Movie Icon made by Madebyoliver from www.flaticon.com
MKV Icon made by Freepick from www.flaticon.com
Wikipedia

Eravate al corrente di queste informazioni? Lasciateci un commento e fateci sapere le vostre impressioni.

COMMENTS

DISQUS: 0