(Ceci répond à une ancienne question, mais comme je faisais des recherches sur le sujet...)
C'est lié à la synchronisation de différents appareils matériels.
Lorsque vous créez un dispositif agrégé, plus d'un appareil de génération sonore peut être nécessaire pour fonctionner simultanément. Même si ces appareils fonctionnent à la même fréquence d'échantillonnage, ils utilisent probablement tous des horloges matérielles indépendantes pour envoyer de l'audio mis en mémoire tampon à travers leurs convertisseurs DAC et réellement générer du son. Si ces horloges ne sont pas synchronisées, l'audio se désynchroniserait également et éventuellement un ou plusieurs des appareils matériels commenceraient à épuiser leur tampon de données avant que les autres aient terminé avec les leurs. En bref, cela deviendrait saccadé et se casserait.
Par exemple, vous pourriez connecter une télévision via HDMI et l'utiliser comme deuxième moniteur pour regarder des films, mais vous pourriez vouloir que les haut-parleurs de la télévision et vos haut-parleurs d'ordinateur soient utilisés - peut-être avez-vous branché des haut-parleurs d'ordinateur avec un caisson de basses et vous aimez les basses supplémentaires que les haut-parleurs de la télévision ne peuvent pas produire. Vous utilisez donc Configuration audio MIDI pour ajouter un dispositif agrégé pour à la fois votre ordinateur et la télévision. Mais l'ordinateur envoie de l'audio numérique via HDMI à la télévision qui le décode indépendamment - il doit y avoir un moyen de s'assurer que l'ordinateur et la télévision décodent à la même vitesse, sans que le décalage de l'horloge au fil du temps ne perturbe les choses.
Sur des liaisons numériques comme le SP/DIF, les appareils matériels peuvent à la fois émettre et recevoir un signal en plus des données audio qui sont utilisées pour effectuer ce type de synchronisation. Cela s'appelle horloge de mot. C'est très important lorsque vous enregistrez de l'audio numérique, pour que le récepteur numérique d'enregistrement soit rigoureusement synchronisé avec la source numérique de transmission. Vous pouvez en savoir plus à ce sujet ici:
http://en.wikipedia.org/wiki/Word_clock
Si tous vos dispositifs agrégés prennent en charge l'horloge de mot, vous n'avez pas besoin de correction de dérive logicielle - le maître sera utilisé comme source d'horloge de mot et les données d'horloge de mot seront envoyées aux autres appareils. Ils utiliseront tous cette horloge pour se maintenir synchronisés. Sinon, tous les appareils sauf le maître qui ne supportent pas l'horloge de mot ont besoin d'activer la correction de dérive. Cela utilise une sorte de mécanisme logiciel pour tenter de lutter contre la dérive de l'horloge (je ne sais pas comment cela est réellement réalisé, ou à quel point c'est robuste / fiable).
Dans l'exemple de la télévision, vous définiriez l'ordinateur comme dispositif audio maître et ajouterez la sortie audio de la télévision, activant la correction de dérive pour la télévision (mais pas pour le dispositif maître car cela n'aurait pas de sens - l'horloge audio de la télévision est corrigée en utilisant le maître comme référence). Pour un autre exemple de comment l'horloge de mot et la correction de dérive fonctionnent ensemble, voir les étapes 11 et 12 ici:
http://www.absolutemusic.co.uk/community/entries/set-aggregate-audio-device-mac-os-lion