hidden
Présentation
Théorie

Un flux vidéo est composé d'une succession d'images, 25 par seconde en Europe (30 par seconde aux USA), composant l'illusion du mouvement. Chaque image est décomposée en lignes horizontales, chaque ligne pouvant être considérée comme une succession de points. La lecture et la restitution d'une image s'effectue donc séquentiellement ligne par ligne comme un texte écrit : de gauche à droite puis de haut en bas.

Entrelacement


L'image d'un téléviseur est une succession de balayages horizontaux, de gauche à droite, partant du haut, et finissant en bas de l'écran. Au commencement de la télévision, la qualité des éléments phosphorescents du tube est fort médiocre. De ce fait, quand le faisceau balaye le bas de l'écran, le haut a déjà disparu, d'où un phénomène de scintillement, ressenti fortement par l'œil humain pour 25 Hz ou 30 Hz.

La solution la plus simple eût été d'accélérer la cadence de balayage, mais ceci imposait également d'augmenter la cadence des images, ce qui était inutile d'un point de vue cinématographique (le mouvement est perçu de la même façon), et fort coûteux en matériel et en bande passante.

Une solution plus astucieuse fut de doubler la cadence de balayage, en omettant une ligne sur deux, afin de garder une quantité d'information constante. Ainsi, une première passe affiche toutes les lignes impaires en deux fois moins de temps que pour une image entière et une seconde passe affiche les lignes manquantes paires : c'est ce que l'on appelle l'entrelacement.

On obtient bien le même nombre de lignes de balayages pour une image, et on balaye deux fois l'écran pour afficher une seule image. On désigne par le terme « trame » ("field" en anglais) une passe de balayage. Une image est donc constituée de deux trames, puisqu'il faut deux balayages pour définir l'image ("frame" en anglais).

 

Les caméras, qui fonctionnent comme un « téléviseur inversé », adoptèrent elles aussi cet entrelacement du balayage. Dans la première moitié du temps d'une image, une 1re prise de vue définit toutes les lignes impaires, et une moitié d'image plus tard, une seconde prise de vue définit les lignes paires.

Ce qu'il faut bien comprendre ici, c'est que les deux prises de vues sont distantes dans le temps (d'une moitié d'image). Et même si ces deux prises de vue sont complémentaires d'un point de vue spatial (les deux balayages se complètent dans le cadre), ces deux prises de vue n'affichent pas le même contenu

Si un sujet se déplace dans le champ, il aura une position différente sur chacune des deux trames : on a alors un effet de zig-zag sur chaque frame.

 

Ce problème est en partie résolu par un dispositif de lames cristallines biréfringentes qui "étalent" les détails en dédoublant les rayons lumineux. Il en découle une perte de définition qui confèrent aux système PAL et SECAM une résolution verticale multipliée par 0.7 (facteur de Kell) et qui n'est plus réellement que de 400 lignes environ.

Du fait de la capture en deux trames de 1/50 s chacune, c'est le temps de pose en vidéo (25i).

 

Il existe dorénavant de plus en plus d'appareils vidéo capables d'afficher 25, 50 ou 60 images complètes par seconde, l'affichage n'est plus entrelacé, on parle alors de balayage progressif. Parmi les appareils capables d'un tel affichage on trouve : les ordinateurs (leur carte vidéo et leur écran), certains vidéoprojecteurs, les téléviseurs haut de gamme, certaines platines DVD et quelques rares caméscopes.

C'est le mode de capture choisi pour les films tournés en HDTV ou en D-cinéma destinés à être transférés et projetés en 35 mm.

Les 25 images progressives (25p) confèrent alors aux caméras un temps de pose de 1/25 s ce qui est trop long en terme de résolution temporelle. On préfère alors limiter le temps d'intégration des trames à 1/50 s (obturateur électronique).

Capture de l'image

Les premières caméras vidéo, fonctionnant sur le même principe que les téléviseurs, analysaient l'image formée par l'objectif à l'aide d'un tube cathodique. Depuis la fin des années 1980, elles sont dotées de capteurs Charge-Coupled Device : CCD ou Dispositif à Transfert de Charges (DTC) en français.

Le transfert de ces charges peut se faire de 3 manières différentes : transfert interligne (capteur IT : Inteline Transfer), transfert trame (capteur FT : Frame Transfer) qui nécessite un obturateur mécanique et est rarement utilisé ou transfert FIT (Frame Interline Transfer).

Au début du XXIe siècle, les fabricants de capteurs ont décidé d'abandonner cette technologie et construisent désormais des capteurs CMOS (Complementary Metal Oxide Semi-conductor). On trouve cependant encore sur le marché des camescopes semi-professionnels utilisant la technologie dite "tri-CCD" qui permet d'améliorer notablement le traitement des couleurs.

La vidéo numérique - Le 4:2:2
  • 4 têtes de lecture avancée (Avance) permettent de lire le signal vidéo présent sur la bande quelques trames avant les têtes d’enregistrement. Cette fonction dite de « pre-read » permet d’apporter une modification sur un programme enregistré sans nécessiter plus d’un magnétoscope. En mode enregistrement, l’ancien signal lu par ces têtes de lecture avancées peut en effet être récupéré et traité par un équipement externe (mélangeur, correcteur colorimétrique…), puis réenregistré exactement à sa place d’origine. Cette fonction très intéressante doit faire l'objet d’une grande précaution d’utilisation car l’opération est irréversible.
  • 4 têtes dites « têtes confidence » (Confi) lisent les pistes après les têtes d’enregistrement afin de permettre la vérification de l’enregistrement en cours (avec un léger décalage temporel).
  • 4 autres têtes permettent la lecture en Betacam analogique.
  • 4 têtes permettent l’enregistrement numérique des données
  • 2 têtes servent à l’effacement des données audio et vidéo

 

La conversion analogique/numérique

Le procédé de l’acquisition vidéo analogique et de sa conversion en numérique peut s’assimiler au passage du langage oral au langage écrit. Pour prendre en note le discours oral d’une personne, cette dernière ne doit pas parler trop rapidement, dans tel cas il devient difficile d’écouter et de transcrire simultanément. Certes la personne pourrait ralentir son débit de parole mais si l’on assimile ces paroles avec le signal vidéo analogique, on comprend aisément que le débit ne peut pas être ralenti. On procède donc à l’échantillonnage du discours, c’est-à-dire que l’on ne saisit que des « morceaux » de message pour les retranscrire par la suite. La précision de la retranscription dépend donc directement du nombre d’échantillons de discours prélevés. Pour la vidéo, le phénomène est identique : il est nécessaire avant toute chose de connaître le signal et de savoir quels sont les signaux à numériser

Format d'enregistrement

Afin que la réponse d’un enregistreur soit optimale dans les hautes fréquences il est primordial que l’entrefer de la tête de lecture soit parfaitement

©2008 nanoimage.fr
Formats et standards vidéo Betacam / Betacam SP:

MPEG-4

MPEG-4 (ISO/CEI 14496), introduit en 1998, est une norme de codage d’objets audiovisuels spécifiée par
le Moving Picture Experts Group.

MPEG-4 est d’abord conçu pour gérer le contenu de scènes comprenant un ou plusieurs objets audio-vidéo.
Contrairement à MPEG-2 qui visait uniquement des usages liés à la télévision numérique (diffusion DVB et DVD)
les usages de MPEG-4 englobent toutes les nouvelles applications multimédias comme le téléchargement et
le streaming sur Internet, le multimédia sur mobile, la radio numérique, les jeux vidéo, la télévision et
les supports haute définition.

MPEG-4 a développé de nouveaux codecs audio et vidéo et enrichi les contenus multimédia, en ajoutant de
nouvelles applications comme le VRML (étendu), le support pour des présentations 3D, des fichiers composites
orienté-objet (incluant des objets audio, vidéo et VRML), le support pour la gestion des droits numériques
et plusieurs types d’interactivités.

MPEG-4 se décompose en une suite de normes, les parties, qui spécifient un type de codage particulier.
Dans chaque partie plusieurs profils (collection d’algorithmes) et niveaux (contraintes quantitatives) sont
définis. Un consortium industriel désirant utiliser MPEG-4 choisit une ou plusieurs parties de la norme et
pour chaque partie, il peut sélectionner un ou plusieurs profils et niveaux correspondant à ses besoins.

Motion-JPEG

Motion-JPEG ou M-JPEG est un codec vidéo qui compresse les images une à une en JPEG. Son évolution est le MJPEG2000.

Le débit binaire d’un flux MJPEG se situe généralement entre celui de formats non compressés
(comme RVB, de compression 1:1, et YUV, de compression 1:1,5 à 1:2,5) et celui des formats MPEG
(de l’ordre de 1:100). Des débits de l’ordre de 29 Mbit/s sont courants pour des vidéos de très
bonne qualité, mais conduisent en comparaison à d’autres formats à des tailles de fichier très importantes.

H.264

Profils

Le standard inclut les 6 ensembles de caractéristiques suivants, qui sont appelés des profils, chacun ciblant une classe d'applications précise :

  • Baseline Profile (BP): Principalement pour les applications bas-coût qui utilisent peu de ressources, ce profil est très utilisé dans les applications mobiles et de visio-conférence.
  • Main Profile (MP): À l'origine, prévu pour les applications grand public de diffusion et de stockage, ce profil a perdu de l'importance quand le profil High a été ajouté avec le même objectif.
  • Extended Profile (XP): Prévu pour la diffusion en flux (streaming) des vidéos, ce profil a des capacités de robustesse à la perte de données et de changement de flux.
  • High Profile (HiP): Le profil principal pour la diffusion et le stockage sur disque, en particulier pour la télévision haute définition (ce profil a été adopté pour les disques HD DVD et Blu-ray ainsi que pour la télévision numérique française haute définition).
  • High 10 Profile (Hi10P): Ce profil va au-delà des applications grand public et s'appuie sur le profil High — ajoutant jusqu'à 10 bits de précision par pixel.
  • High 4:2:2 Profile (Hi422P): Le profil principal pour les applications professionnelles, il s'appuie sur le profil High 10 — ajoutant le support pour la quantification 4:2:2 jusqu'à 10 bits par pixel.
  • High 4:4:4 Profile (Hi444P) [obsolète]: Ce profil s'appuie sur le profil High 4:2:2 — ajoutant le support pour la quantification 4:4:4, jusqu'à 12 bits par pixel et en plus le support pour un mode sans perte efficace. Note : Le profil High 4:4:4 est en cours de suppression du standard en faveur d'un nouveau profil 4:4:4 en cours de développement.

 

Baseline Extended Main High High 10 High 4:2:2 High 4:4:4
tranches I et P Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui
tranches B Non Non Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui
tranches SI et SP Non Non Oui Oui Non Non Non Non Non Non Non Non Non Non
Image de Références Multiples Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui
Filtre anti-blocs Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui
codage CAVLC Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui
codage CABAC Non Non Non Non Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui
ordonnancement flexible des macroblocs (FMO) Oui Oui Oui Oui Non Non Non Non Non Non Non Non Non Non
ordonnancement arbitraire des tranches (ASO) Oui Oui Oui Oui Non Non Non Non Non Non Non Non Non Non
tranches redondantes (RS) Oui Oui Oui Oui Non Non Non Non Non Non Non Non Non Non
partitionnement des données (DP) Non Non Oui Oui Non Non Non Non Non Non Non Non Non Non
codage entrelacé (PicAFF, MBAFF) Non Non Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui
format 4:2:0 Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui
format monochrome (4:0:0) Non Non Non Non Non Non Oui Oui Oui Oui Oui Oui Oui Oui
format 4:2:2 Non Non Non Non Non Non Non Non Non Non Oui Oui Oui Oui
format 4:4:4 Non Non Non Non Non Non Non Non Non Non Non Non Oui Oui
pixel 8 Bit Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui
pixel 9 et 10 Bit Non Non Non Non Non Non Non Non Oui Oui Oui Oui Oui Oui
pixel 11 et 12 Bit Non Non Non Non Non Non Non Non Non Non Non Non Oui Oui
transformée 8×8 Non Non Non Non Non Non Oui Oui Oui Oui Oui Oui Oui Oui
matrices de quantification Non Non Non Non Non Non Oui Oui Oui Oui Oui Oui Oui Oui
quantification Cb et Cr séparée Non Non Non Non Non Non Oui Oui Oui Oui Oui Oui Oui Oui
codage sans-perte Non Non Non Non Non Non Non Non Non Non Non Non Oui Oui
Baseline Extended Main High High 10 High 4:2:2 High 4:4:4
Copyright©2008nanoimage.fr