From Mauro.Villa@bo.infn.it Mon Sep 18 12:35:24 2006
Date: Sun, 17 Sep 2006 09:39:51 +0200
From: Mauro Villa <Mauro.Villa@bo.infn.it>
To: Paola Giannetti <paola.giannetti@pi.infn.it>
Cc: Mauro Villa <Mauro.Villa@bo.infn.it>,
     Livio Lanceri <Livio.Lanceri@ts.infn.it>,
     Luciano Bosisio <Luciano.Bosisio@ts.infn.it>, stefano.bettarini@pi.infn.it,
     Francesco Forti <Francesco.Forti@pi.infn.it>,
     giuliana rizzo <giuliana.rizzo@pi.infn.it>,
     Valerio Re <valerio.re@unibg.it>,
     Manghisoni Massimo <massimo.manghisoni@unibg.it>
Subject: Re: latenza e # di linee di outputs


Ciao a tutti,

Ho due piccole osservazioni e un nuovo conto:
- come risulta dai conti della Paola con 6 linee di uscita dall'FSSR2 si e' 
gia' vicini al limite di clock della AM (20/25 ns rispetto ai 28.6 ns 
necessari per ogni hit);
- il punto chiave e' che nel conto si e' considerato solo 1 chip FSSR, mentre 
su UNA LINEA dati verso l'AM devono transitare tutte le hit di un ibrido (3 
FSSR2) piu' un time stamp per ogni evento. In sostanza un ibrido equipaggiato 
on 3 chip letti su 6 linee ognuno fornisce le hit ad un rate massimo di una 
hit ogni 9.5 ns. Questo rate (105 MHz) non e' gestibile ne' dalla EDRO (dove 
vorremmo lavorare a 40 MHz) ne' dalla AM (max 50MHz).

Provo a fare un conto dettagliato con queste assunzioni:
Ibrido con 3 chip letti con N linee, 24 bits/hit
Clock di lettura a 140 MHz  (1 bit)
BCO clock a 2.52 MHz   
	( da rivedere in quanto sembra troppo veloce per le MAPS)
Clock EDRO e AM a 40 MHz.

Il rate di HIT in uscita dall'ibrido con N linee e' dato da:
140 MHz * (N/24)*3 = 17.5 MHz*N
Il rate di Hit e' quindi:
17.5 MHz per N=1   - gestibile da EDRO+AM
35 MHz per N=2	  - gestibile da EDRO+AM (vicino al limite di 40 MHz)
70 MHz per N=4	  - NON gestibile
105 MHz per N=6    - NON gestibile

Concludendo il conto: N=1 o N=2 sono gestibili dalla EDRO+AM, c'e' abbastanza 
spazio per aggiungere il time stamp ad ogni evento. (N=3 non e' previsto nel 
FSSR). N=4 o N=6 non risultano gestibili: il sistema EDRO+AM risulterebbe il 
collo di bottiglia del sistema.

Vediamo ora quante linee di I/O deve portare l'ibrido nuovo in funzione di N:
Nell'ibrido vecchio (6 Chip FSSR2 letti a 6 linee) era stato fatto questo 
conto: 
Ogni chip era letto con N=6 linee di I/O + altre 3 linee di controllo; vi 
erano altre 7 linee di I/O comuni a tutti i chip per un totale di (6*(N+3)+7) 
= 61; 18 di queste non erano collegate e quelle rimanenti (7) per arrivare a 
50 portavano le alimentazioni. (Su questo punto ho un dubbio: le linee di I/O 
sono differenziali, mentre le alimentazioni no: come e' possibile arrivare a 
50 linee sul connettore??? - )
Ripetendo il conto per il caso di 3 chip FSSR2:
Il numero di linee differenziali è (3*(N+3)+7) cioe':
19 per N=1   -> 38 linee di I/o singolo + 12 alim. su un connettore da 50
21 per N=2	   -> 42 linee di I/o sing, + 6 alim. su un connettore da 50
27 per N=4   -> 54 linee di I/o sing,
33 per N=6   -> 66 linee di I/o

A me sembra che N=2 linee di I/O per ogni FSSR sia piu' che sufficiente per i 
nostri scopi; siamo gia' vicini al limite del nostro sistema.

Performances di un sistema con N=2 linee di uscita sul FSSR2 e il BCO clock a 
2.52 MHz:
- processiamo le hit ad un rate massimo di 35 MHz; 
- ogni "Evento" e' caratterizzato da un time stamp con la frequenza del BCO 
clock (2.52 MHz); 
- ad ogni BCO clock abbiamo la capacita' di processare 35 MHz/2.52 MHz = 13.9 
Hit in media per ogni ibrido (o se preferite 4.6 Hit/Chip FSSR2); 

Visto che non credo avremo 14 tracce su ogni ibrido ad ogni evento e il rate 
di eventi dovrebbe essere inferiore ai 2.52 MHz, mi sembra inutile spingere 
le performance del sistema oltre quello che si puo' ottenere con N=2 linee di 
lettura sui chip FSSR2. 
	Che ne pensate?

Ciao,
	Mauro

 
On Thursday 14 September 2006 23:37, Paola Giannetti wrote:
> Cari tutti,
> alcuni dati (da confrontare con quello che avete capito voi, per favore
> controllate) per giudicare se ci possiamo permettere di usare meno di 6
> linee di outputs:
>
> mi sembra di capire che la lettura seriale veloce va al massimo a  140
> MHz  -> ~1 bit ogni 7,15 ns.
>
> Se si usano 6 linee di output per leggere una parola di 24 bits,
> occorrono 4 cicli e quindi  ~28,6 ns che e' leggeremente piu' lento
> della memoria associativa che sulla carta puo' funzionare fino a 50 MHz
> (un hit ogni 20 ns) ma in CDF e' stata testata ampiamente solo a 40 MHz
> (un hit ogni 25 ns).
>
> Se si usano 3 linee di output invece di 6, per leggere un hit occorrono
> il doppio di cicli di clock, quindi  ~57 ns/hit.
>
> Se si usa 1 sola linea di output occorrono 24 cicli di clocks,  ~171
> ns/hit.
>
> Il tempo di latenza e' quindi dominato dalla lettura del rivelatore,  e
> qualcuno si puo' chiedere perche' si sia usato un readout ~6 piu' lento
> della AM, ma tuttavia tutto funziona anche usando una sola linea di
> readout per chip. Forse la dimostrazione di fattibilita' del sistema non
> e' inficiata dal fatto di andare piano nel readout. Se tutto funziona,
> possono credere che e' possibile usare un output piu' parallelo ed
> andare piu' forte....
>
> Non so, sollevo la questione perche' penso piu' si restringe il campo
> delle variabili, piu' abbiamo facilita' di convergere presto.
> Pensate che potremmo lavorare con meno di 6 linee di output per chip? Se
> tutti sono daccordo, rilasciare questa richiesta favorirebbe l'uso del
> sistema vecchio che sembra fortemente preferito (se comunque riordinano
> il PCB dell'ibrido io sarei comunque favorevole ad usare connettori piu'
> affidabili in modo da andare direttamente alla vecchia PMC se possibile,
> senza passare dal patch panel)
>
> Ciao
>                                       Paola

-- 
___________________________________________________________________
  Mauro VILLA,

  email: villa@bo.infn.it
  address:  Dipartimento di Fisica, Università di Bologna
            Via Irnerio, 46, I-40126 Bologna, BO
  Tel: + 39 051 209 10 64  Fax: + 39 051 24 43 80