Audio Video Sync Monitor

Surveillez et pistez les problèmes de synchronisation entre audio et vidéo en temps réel

PDF Fiche technique de Audio Video Sync Monitor (2 pages, anglais)

Audio Video Sync Monitor (AVSM) est une solution logicielle très innovante pour mesurer et surveiller la synchronisation entre audio et vidéo grâce à des fingerprints (empreintes) audio et vidéo.

AVSM mesure la désynchronisation de sources audio vidéo. Le décalage audio vidéo (aussi appelé skew ou lip-sync offset) est le manque d'alignement entre audio et vidéo.

Dans AVSM, le décalage audio vidéo est exprimé en millisecondes. Des signaux audio vidéo parfaitement synchronisés ont un décalage de 0 ms (pas de décalage). Dans AVSM, le décalage est positif quand l'audio arrive avant la vidéo (par exemple, vous entendez une voix avant de voir quelqu'un parler) et négatif quand la vidéo arrive avant l'audio (par exemple, vous pouvez voir quelqu'un commencer à parler avant d'entendre sa voix).

AVSM est principalement conçu pour:

  • la surveillance d'équipements de diffusion
  • la surveillance et la qualification de différents fournisseurs de services IPTV
  • la surveillance et la qualification de différents diffuseurs
  • la mesure de latence des équipements audio vidéo

AVSM fonctionne sous Windows (XP, Vista ou Seven).

Présentation générale

AVSM consiste en 2 applications:

  • la sonde AVSM qui capture les signaux audio et vidéo et envoie des empreintes (fingerprints) au serveur AVSM
  • le serveur AVSM qui reçoit les fingerprints audio et vidéo à partir de plusieurs sondes afin de mesurer le décalage audio vidéo.

Au moins deux sondes doivent fonctionner (sur des machines différentes ou sur la même machine):

  • une sonde traitera les signaux audio et vidéo de référence (on verra par la suite que ces signaux sont dits "de référence" mais ils peuvent aussi être des signaux réels: encodés et dégradés): la sonde de référence
  • une ou plusieurs sonde(s) traiteront les signaux audio et vidéo testés: la(les) sonde(s) de test

Chaque sonde (sonde de référence ou sonde de test) transforme en permanence les signaux audio vidéo qu'elle reçoit en fingerprints audio et vidéo. Ces fingerprints audio et vidéo décrivent le signal audio et chaque image (frame) de la vidéo sous la forme d'une signature quasi-unique. Les fingerprints sont robustes face à l'encodage, le ré-encodage, le trasncodage et le redimensionnement. Chaque fingerprint contient aussi l'heure à laquelle il a été calculé. Cette information sera la base de tous les calculs de synchronisation.

Ces fingerprints sont régulièrement envoyés au serveur AVSM. Le serveur AVSM comapre les fingerprints audio et vidéo entre les différentes sondes qui lui sont connectées.

La comparaison entre fingerprints provenant de deux sondes différentes permet de mesurer précisément les décalages temporels (à la fois pour images de la vidéo et pour les signaux audio) entre ces deux sondes. Puis, ces décalages temporels audio et vidéo permettent de déterminer le décalage entre les deux sondes.

Capture #1 of Audio Video Sync Monitor

Sonde AVSM

Capture #2 of Audio Video Sync Monitor

Chaque sonde AVSM traite un signal audio et un signal vidéo.

Une sonde AVSM probe est très souple d'utilisation puisque les signaux audio et vidéo peuvent être capturés:

  • à partir d'une carte de capture
  • ou à partir d'un streaming sur IP (en UDP ou RTP)
  • ou à partir d'un fichier

L'audio peut être en format mono, stereo ou multi-canal. L'audio peut avoir n'importe quelle profondeur ou fréquence d'échantillonnage mais il sera rééchantilloné à 16-bit 48.0 kHz. Les vidéos peuvent être de n'importe quelle résolution, à n'importe quelle cadence temporelle (frame rate).

Chaque sonde affiche:

  • des descriptions des formats audio et vidéo, et des données reçues
  • une fenêtre de pré-visualisation vidéo
  • le spectre sur 8 barres des données audio traitées
  • le décalage audio, le décalage vidéo et le décalage entre sondes (mesurés par le serveur AVSM)

Une sonde peut aussi jouer (dans des haut-parleurs) les données audio capturées (un curseur permet de régler le volume audio).

Enfin, une sonde permet à l'utilisateur de sauver manuellement un échantillon audio vidéo.

Serveur AVSM

Le serveur AVSM reçoit et compare les fingerprints envoyés par les différentes sondes: la sonde de référence et la(les) sonde(s) de test).

Chaque sonde appartient à un "système". Une système représente généralement un service audio vidéo, comme une chaîne TV, qui a besoin d'être surveillée à partir de plusieurs emplacements et/ou de plusieurs diffuseurs.

Un systèA system contient au moins une sonde de référence et une sonde de test. Il peut aussi contenir plusieurs sondes de test (mais seulement une sonde de référence).

Dans un système, les fingerprints de chaque sonde de test sont comparés aux fingerprints de la sonde de référence de ce système.

Un seul seveur AVSM peut traiter des fingerprints provenant de plusieurs systèmes et par conséquent un serveur AVSM peut surveiller plusieurs chaînes TV différentes.

En comparant les fingerprints envoyés par les différentes sondes, le serveur AVSM calcule le décalage vidéo, le décalage audio et, finalement, le décalage audio vidéo entre sondes.

Le décalage audio vidéo est alors utilisé pour déclencher des alertes, afin de prévenir des utilisateurs en temps réel qu'un problème de synchronisation a été détecté entre les signaux audio vidéo au niveau d'une sonde donnée.

Capture #3 of Audio Video Sync Monitor

Configuration (systèmes, sondes, utilisateurs) et alertes

Capture #4 of Audio Video Sync Monitor

La configuration complète est définie au niveau du serveur AVSM. Plusieurs fenêtres permettent de créer, éditer et supprimer des systèmes, des sondes et des utilisateurs.

Commme expliqué précédemment:

  • un système représente un service audio vidéo surveillée, comme une chaîne de télévision
  • une sonde est un emplacement où audio et vidéo sont capturés et transformés en fingerprints (qui seront envoyés au serveur AVSM)
  • un utilisateur est quelqu'un qui sera alerté si un problème de synchronisation est détecté, en se basant sur les seuils de détection fixés par cet utilisateur

Les valeurs de décalage mesurées sont utilisées pour envoyer des alertes par email. Les alertes sont de deux types:

  • les avertissements
  • les erreurs

Une alerte email est envoyée quand le décalage audio vidéo est supérieur à seuil défini par l'utilisateur, pendant au moins une durée définie par l'utilisateur.

Des seuils et durées différents peuvent être utilisés pour les décalges positifs et négatifs, mais également pour les avertissements et les erreurs.

Serveur web

Le serveur AVSM intègre un serveur web (serveur HTTP) qui fournit une interface web afin d'obtenir les résultats de mesure (pour un ou plusieurs utilisateurs) en utilisant n'importe quel navigateur web (comme Mozilla Firefox, Google Chrome, Microsoft Internet Explorer ou Apple Safari). Il peut aussi rendre les résultats disponibles sur un smartphone.

L'interface web permet à l'utilisateur de:

  • calculer des statistiques, afficher des courbes (de décalage audio, décalage vidéo, décalage audio vidéo) et télécharger des échantillons audio vidéo à partir de n'importe quelle sonde
  • voir en temps réel (avec statistiques et courbes) les mesures qui sont en train d'être calculées pour une sonde

Capture #5 of Audio Video Sync Monitor

Résultats et échantillons audio vidéo

Capture #6 of Audio Video Sync Monitor

Grâce à l'interface web, la courbe de décalage audio vidéo (mais aussi la courbe de décalage audio ou de décalage vidéo) peut être affichée, pour n'importe quelle sonde, entre deux dates et heures choisies par l'utilisateur. Chaque date et heure est choisie sur un calendrier, avec une précision d'une minute (les résultats affichés ont une précision d'une seconde).

La courbe est interactive: en cliquand ou déplaçant leur souris, les utilisateurs peuvent zoomer (dans le temps) sur une partie donnée de la courbe.

Au-dessus de la courbe, des statistiques sont calculées sur la période de temps affichée.

Sous la courbe, un tableau affiche la liste des échantillons audio vidéo sauvés durant la période de temps affichée. Un simple clic sur un ficheir permet de le téléchargement de la sonde vers le serveur et de le jouer à partir du navigateur web.

Un bouton permet aussi de sauver manuellement un échantillon audio vidéo sur la sonde sélectionnée. Ceci permet, à partir d'un simple navigateur web, de sauver un échantillon à un emplacement distant, de plusieurs secondes avant le clic jusqu'à plusieurs secondes après le clic, puis de le télécharger.

Enfin, les valeurs affichées peuvent être exportées en format CSV.

Conclusion

Avec sa technologie de fingerprinting audio et vidéo avancée, ses sondes souples d'emploi et son serveur de mesuren AVSM permet enfin de:

  • surveiller la synchronisation entre audio et vidéo entre des réseaux de diffusion variés comme la Télévision Numérique Terrestre (TNT), le Câble, le Satellite et l'IPTV
  • déployer un nombre important de sondes avec des PC "bon marché"
  • concentrer la puissance CPU (et le coût) sur un simple serveur capable de traiter toutes les sondes de test

PDF Fiche technique de Audio Video Sync Monitor (2 pages, anglais)