Na sicher ist die aktiv. Nur der Taktgenerator wird umgangen. Die PLL im Apollo nutzt damit nicht den Takt des internen Quarzes oder Oszillators, sondern eben den Eingangstakt. Mit dem Ausgang der PLL wird die Apollo-Elektronik und damit die Mikroeingänge getaktet. Damit sind alle 3 Mikro Datenströme im Groben samplegenau.
Der Punkt ist natürlich der, dass die PLL im Apollo permanent um die ankommenden Taktflanken des Scarlett herumregelt (und damit hoffentlich diese gut glättet). Also Folge sind die Samples dann natürlich nicht perfekt flankensynchron, weil der Takt ja rekonstruiert ist und damit minimal schwankt. Da der ADC im Scarlet ja auch nicht perfekt genau die Flanke hat, die der Scarlet hinten an der Buchse ausgibt, gibt es auch da schon eine Differenz. So ein ADC hat nochmal eine eigene PLL und auch die im Apollo hat das.
Damit laufen die Takte im Groben alle gleich, in der Feinbetrachung aber alle mit etwas jitter. Und natürlich gibt es bei mehr Verkettung mehr jitter. Insofern vermutest du schon richtig, dass es besser wäre, es gäbe nur einen Taktgeber im Apollo. Man kann davon ausgehen, dass der Takt dann minimal besser ist, als wenn er von draußen kommt. Daher wäre die Frage, ob man nicht den Scarlet mit dem Apollotakt treiben kann.
So richtig dolle ist so so eine Verkettung von Geräten nicht. Allerdings bewegen wir uns ja im Bereich von 192kHz und damit Abtastperioden im Bereich von 5us. Die Flanken werden da maximal um 1-2us jittern und durch die Filterung, die jede PLL macht, sicher nur ein 1/10 davon. Diese Filterung ist allein schon wegen der potenziellen Störungen auf den Leitungen nötig, die jede Taktflanke anders verzieht. Wir sprechen insgesamt von vlt 100ns drift und weniger, welche die Takte maximal abweichen. In dem tieffrequenten Spektralbereich, der interessant ist, wird das nochmal weniger sein, um was die entfernt arbeitenden Takte jittern und die einzelnen Spuren am Ende letzlich gegeneinander schwimmen. Wenn das gut gebaute PLLs sind, dann filtern die runter bis unter 1Hz, mit der die Spuren sich versetzen. Das sind Bruchteile eines Samples oder auf einen Ton bezogen auch nur Bruchteile eines Cents an Tonhöhenschwankung.
Ich habe eine solche Betrachtung mal für Stereo durchgeführt, wo ein digitaler Monitor die Daten und damit den Takt auf den nächsten schiebt (der Takt ist ja im S/PDIF eincodiert). Da gibt es das gleiche Problem, dass die PLLn minimal auseinander laufen, d.h. beide Monitore arbeiten nicht exakt gleich. Dadurch könnte es zu einem wackeligen Stereobild kommen. Durch die Filterung ergaben sich am Ende auch in der Tat jitter-Spektren im Bereich von immerhin 5 Hz abwärts bis auf 0,2Hz herunter. D.h. es ergeben sich Zeitverzögerungen in der Abstrahlung der Lautsprecher, so als ob man die Lautsprecher etwas schütteln würde. Der Phasendrift lag aber ähnlich meiner Abschätzung oben im Bereich von weniger als 0,2us (war ein 48kHz System) - umgerechnet auf die Membranbewegung sind das 0,07 mm. Ein Lautsprecher auf einem hohen Ständer biegt sich fast mehr, wenn du ihn anpustest.
Entscheidend ist, dass dieser drift sehr tieffrequent ist. Die Chips und die heutigen Wandlern sind diesbezüglich aber so gut, dass man da kaum Probleme bekommt.
Schwierig wird es nur, wenn die Geräte auf unterschiedlichen Frequenzen arbeiten und zwischendrin hin und her gesynched werden muss. Dann kriegt man da richtig drift. Bei den ganzen 48kHz-Systemen rund um ADAT, einfachen Soundkarten und Mischpulten um die 2000er herum war das eher ein Problem.
Der ganz saubere Weg ist, einen zentralen Taktgeber zu nehmen und alle an den dranzuhängen. Dazu haben ja die Geräte meist einen clk-Eingang. Wenn man das hat, hoppelt zwar jeder individuell um diesen Takt herum, aber es kommt jeweils nur 1x jitter rein, d.h. nur das ADC / DAC vorne in jedem Gerät läuft etwas weg.