Sommaire et contenu :
Le son échantillonné et les multiples formats, un casse-tête pour choisir le meilleur format audio.
Depuis des années il est difficile de s’y retrouver et de faire le tri dans les formats que ce soit pour du streaming, de la production ou pour de l’écoute musicale. Nous allons tenter de présenter les choses le plus simplement possible et avec concision.
De quoi parlons nous ?
Les formats de fichier audio et leur numérisation
Un format de fichier audio est un format de données utilisé pour stocker des sons comme la musique ou la voix sous forme numérique. Il existe des formats destinés à la production et d’autres formats destinés plutôt à la diffusion.
Le codec est un dispositif matériel ou logiciel qui permet de mettre en œuvre l’encodage ou le décodage d’un flux de données numérique. La norme décrit un procédé pour définir un format conteneur ou un format de compression. Un format audio est une sorte de conteneur dans lequel sera stocké la musique dématérialisée.
Quant au format conteneur il dépend de la norme établie. Il peut embarquer des flux audio, des flux vidéos, des données techniques, des méta-données (titres, auteurs, illustrations, durées, genres musicaux, BPM , du timecode, les poids des fichiers, fréquence d’échantillonnage, débit…).
Mais attention au moment du choix car les formats conteneurs ne sont pas compatibles avec tous les formats de compression.
Échantillonnage du son :
Pour pouvoir représenter un son sur un ordinateur, il faut arriver à le convertir en valeurs numériques. Il s’agit donc de relever des échantillons de son à des intervalles de temps précis. On appelle cette action l’échantillonnage ou la numérisation du son.
Un son numérisé est défini par sa fréquence d’échantillonnage (nombre d’échantillons par seconde) et sa résolution (la qualité de son encodage). Plus le nombre de bits est élevé et plus la précision du codage est importante.
Pour connaître la qualité numérique d’un enregistrement, il faut connaître donc deux valeurs : la fréquence d’échantillonnage et le nombre de bits. Une fréquence trop faible coupera les sons aigus, un codage sur trop peu de bits diminuera la qualité de l’enregistrement.
Les formats numériques audio sont très nombreux et de qualités très variables. Chaque format à ses avantages et ses inconvénients (poids des fichiers, popularité, performance, reconnaissance professionnelle, pertes d’informations ou de qualité…).
Le taux d’échantillonnage est le nombre de mesures qui sont faites à chaque seconde pour enregistrer le son en numérique.
Des standards se sont dégagés au fil du temps: 32 kHz, 44.1 Khz (multiples et sous-multiples, 11 kHz, 22 kHz, 88.2 kHz), 48 kHz (multiples 96 kHz, 192 kHz, 384 kHz).
Taux d’échantillonnage : | Qualité sonore : usage |
---|---|
48 kHz (48000 Hz ) | Enregistrements numériques, multi-pistes professionnels, enregistrements publics |
44,1 kHz (44100 Hz) | Les CD audio |
32 kHz (32000 Hz) | Utilisation par radios FM en numérique |
22 kHz (22000 Hz) | Utilisation qualité radios par défaut |
8 kHz (8000 Hz) | La téléphonie, smartphones |
Le choix du taux d'échantillonnage va directement influencer la qualité de l'enregistrement. En outre, plus ce taux est élevé, plus l'enregistrement est fin et précis. C'est directement lié à la capacité d'enregistrer les sons aigus.
Tout dépendra de l’usage que l’on souhaite faire du fichier audio utilisé et du budget dont on dispose. Les coûts ou contraintes techniques induites selon les types de fichiers audio téléchargés, ne sont pas identiques selon les formats audio choisis.
La compression d’un fichier audio réduit la taille du fichier et le temps de chargement pour le streaming, le téléchargement de ces fichiers et le stockage.
C’est par exemple le cas entre un format destiné au grand public pour un usage dans le cercle familial ou privé (fichier compressé de type mp3 pour une simple écoute en nomade avec peu d’exigences acoustiques).
Alors qu’un autre format bien plus « pointu » (non compressé pour ne rien perdre en qualité de type AIFF ou WAV) sera plutôt destiné à des professionnels (artistes, DJ, ingénieurs du son, Les DJs français…).
Certaines personnes ne prennent en compte que les performances de compression lors du choix d’un format compressé, mais il existe de nombreuses autres fonctionnalités importantes:
- la vitesse d’encodage, le taux de compression, la gestion des erreurs, le type de marquage, les supports logiciels ou matériels, les systèmes d’exploitation des PC pris en charge, les licences (open source ou non, formats libres de droits ou pas)…
On utilise plusieurs types de compression des données afin de réduire la taille des fichiers numériques
Compression ne rime pas forcément avec performance
Les fichiers numérisés peuvent subir plusieurs types de compression de leurs données ce qui permet notamment de réduire considérablement leur taille.
Le principe du « lossless » (compression sans perte) permet un traitement des fichiers sans pratiquement rien perdre. Alors qu’une compression aux formats « lossy » permet un traitement des fichiers mais avec une perte de qualité sonore conséquente.
Les formats audio sont répartis en 3 catégories :
⇒ Les formats audio non-compressés (WAV, AIFF). L’AIFF est un conteneur PCM brut signé Apple alors que le WAV est soutenu par Microsoft. Le format WAV est encore très utilisé dans les milieux artistiques (format le plus populaire) mais il a l’inconvénient de prendre beaucoup d’espace sur un disque dur ou autre.
Le WAV est donc un format ancien, très lourd, restrictif et peu pratique car il ne gère pas les métadonnées contrairement au format AIFF.
⇒ Les formats audio compressés sans perte (FLAC, ALAC, Shorten, APE). Le FLAC a été adoubé par l’industrie musicale comme un moyen rentable pour distribuer la musique de qualité CD qui ne souffre pas des défauts du MP3. Le FLAC a un concurrent qui est le streaming. Actuellement, le streaming propose des débits de 320 kbps avec une qualité qui se rapproche peu à peu de celle du CD.
Mais le FLAC est peu lisible sur les appareils grand public et il est incompatible avec les produits Apple (format concurrent: ALAC).
⇒ Les formats audio compressés avec pertes (MP3, AC-3, AA, AAC, Ogg Vorbis, WMA). En théorie, la compression avec pertes ne s’applique qu’aux données perceptibles qui peuvent subir une modification sans que cela soit perceptible par un humain « ordinaire ». Certains professionnels ont la capacité d’identifier chaque hauteur de son, sans aucune référence préalablement donnée ou sans aucune autre note repère, inutile de préciser que ces personnes vont percevoir une différence.
Dans la pratique, on perçoit une différence notable entre les formats. Et il faut savoir que la perte d’information est irréversible, il est impossible de retrouver les données d’origine après une telle compression.
Dans les formats audio multi-pistes, nous avons le i-Klax, U-MYX, MXP4 etc..
Les formats de fichiers audio numériques les plus couramment utilisés :
-MP3 : Quelques pertes, 320 kbps, et les métadonnées.
-WAV : Sans perte, 16 Bit, 44,1 K.
-AIFF : Sans perte, 16 Bit, 44,1 K, et les métadonnées. AIF siginfie Audio Interchange File Format. Ce format équivaut au format WAV de Microsoft.
–FLAC : Sans perte, en 16 ou 24 Bit/192 kHz (si qualité master). Le Free Lossless Audio Codec (FLAC) est un codec libre de compression audio sans perte.
Le type de pertes engendrées par les formats lossy (compressés avec pertes) a une influence certaine sur la qualité du son restitué. Les formats compressés avec pertes tronquent la musique dans les aigus (différences d’amplitude et du spectre du signal).
Pour les formats les plus compressés il s’agit même d’une nette coupure à certaines fréquences. Les informations manquantes se situent dans un spectre audible et donc la différence est marquée selon les formats audio et par conséquent les morceaux joués. Les formats compressés avec pertes génèrent des pertes de données dont l’importance est directement proportionnelle au taux de compression.
Qu'est-ce qu'un fichier Stem ?
C’est un format crée par Native Instrument -Traktor et pensé pour le djing créatif.
Native Instruments a récemment présenté un nouveau format de fichiers appelé Stems. Le format Stems est un format ouvert et d’autres fabricants peuvent y contribuer. Un fichier Stems utilise le format MP4, ce qui signifie qu’il peut être lu par tous les lecteurs compatibles avec les fichiers MP4 comme par exemple, iTunes.
Un fichier Stem est un fichier audio multicanal ouvert qui contient une piste divisée en quatre éléments musicaux : par exemple un stem de batterie, un stem de ligne de basse, un stem de mélodie et un stem de voix..
Avec chaque élément disponible de manière indépendante, on peut ainsi mixer les fichiers audio de manière inédite. Le format Stems permet d’interagir librement avec les divers éléments musicaux d’un morceau.
Chaque « stem » peut être manipulé indépendamment pour créer instantanément de nouveaux mixes, mashups, instrumentaux, acapellas et plus encore en ajoutant différentes parties au cours d’un mixage DJ.

L’équipe éditoriale du site web DJ Frenchy est constituée d’une équipe d’experts dont certains ont plus de 40 ans d’expérience. Le webzine djfrenchy.com a été créé et mis en ligne en 2010.
Les auteurs s’engagent à vous fournir des ressources fiables et de qualité. Passionnés et motivés par leur travail, ils consacrent une grande partie de leur temps libre à maintenir ce site web et son contenu, à jour.
Leur expertise et leur expérience professionnelle (études supérieures…) en font des auteurs de confiance.
Avec une solide expérience et autorité, les auteurs fournissent régulièrement des ressources précieuses et un contenu fiable pour tous ceux qui recherchent des informations pertinentes et de qualité.
Les articles publiés sont exhaustifs, didactiques et agréables à lire (illustrations, graphiques, vidéo…).
bien vu, le mauvais côté des fichiers compressés c’est qu’on a écrasé quelques données !