Re: [MQ] Teoria della misura di Zurek

From: Paolo Russo <paolrus_at_libero.it>
Date: Fri, 22 Dec 2017 19:24:47 +0100

Rimando il papiro dopo aver convertito i caratteri strani in
roba piu' normale (non so perche', non sono riuscito a
rileggerlo neanch'io)... quindi a questo punto le citazioni
dal paper di Zurek non sono piu' proprio letterali.

Nel seguito cerco di chiarire, a modo mio, la questione della
decoerenza e nel farlo devo criticare alcune parti del lavoro
di Zurek. In breve, secondo me c'è qualche errorino e
tendenziosità non solo sulla MWI ma più in generale su tutta
la questione della base privilegiata.

> Vorrei cercare, a scopo autodidattico, di fare una breve sintesi, solo
> di alcuni punti del paper di Zurek. Sarei grato a te o a quanti
> avranno voglia di correggermi e farmi capire qualche cosa di piu’.

Okay, cominciamo. Premetto che nel seguito commento quel che
Zurek scrive e che tu riassumi dal mio punto di vista (che e`
inevitabilmente di parte MWI).

> Zurek ricorda come la matrice di densita’, introdotta da von Neumann,
> sia necessaria per “contenere” tutte le informazioni relative ad una
> misura quantistica che rende conto dell’ interazione del sistema
> considerato con l’ apparato di misura (detector).

Per la MQ, una funzione d'onda (o meglio, uno stato
quantistico o ket; la fdo ne e` la rappresentazione nella
base posizionale) e` piu' che sufficiente a contenere tutta
l'informazione di un sistema quantistico anche complesso,
apparato di misura compreso (se riteniamo che la MQ sia
applicabile ai sistemi macroscopici, che e` il punto di
partenza di tutto il discorso). La matrice di densità diventa
utile quando si vuole aggiungere alla descrizione quantistica
di un sistema anche coefficienti probabilistici dovuti
all'ignoranza dell'osservatore; in altre parole, il ket
contiene gia` tutta l'indeterminazione quantistica, ma se
vogliamo aggiungerci per comodita` nostra una casualita` da
ignoranza bisogna passare alla matrice di densita` che puo`
agevolmente rappresentarle entrambe senza confonderle. Se
quindi il sistema in esame ha probabilità classica P1 di
trovarsi nello stato |1>, probabilita` classica P2 di
trovarsi nello stato |2> e cosi' via, si può rappresentarne
le caratteristiche con una matrice di densita`. Tali
probabilita` non vanno confuse con l'indeterminazione
quantistica che si ha quando il sistema e` in uno stato che
e` una reale sovrapposizione degli stati |1>, |2> eccetera.
Prima di eseguire una misura non si sa quale ne sara`
l'esito, tuttavia se si conosce lo stato quantistico del
sistema in esame si conoscono i possibili esiti e le loro
probabilita`. Pertanto, l'esito complessivo di una misura e`
descrivibile da una matrice di densita`: con probabilita` p1
misureremo che il sistema e` nello stato |1>, con
probabilita` p2 misureremo che e` nello stato |2> e cosi'
via.
Se usiamo una matrice di densita` anche per rappresentare lo
stato del sistema prima della misura, possiamo confrontare le
due matrici e vedere cosa cambia durante la misura. Von
Neumann (riporta Zurek) ha ipotizzato l'esistenza di un non
meglio identificato "processo 1" che alteri la matrice di
densita` convertendo l'indeterminazione quantistica in
casualita` da ignoranza; per fare cio` il processo 1 dovrebbe
"solo" azzerare i termini non diagonali della matrice di
densita`. Detta cosi' sembra roba da niente, ma il
significato fisico di un tale azzeramento e` drastico: si
passa da uno stato fisico (quantistico) a una descrizione
statistica. Nella MQ non sono possibili processi fisici che
possano fare, di per se', una cosa del genere: l'evoluzione
temporale di uno stato quantistico e` deterministica. E` solo
il processo di misura a costituire, per l'appunto, quel caso
a parte che si vorrebbe armonizzare con tutto il resto.

> Non considerando i
> termini non diagonali, che rappresentano le correlazioni quantistiche,
> si ottiene una matrice di densita’ i cui elementi diagonali
> rappresentano probabilita’ classiche. A pag. 8 Zurek afferma che le
> correlazioni quantistiche possono disperdere contenuto informativo
> in gradi di liberta’ inaccessibili all’ osservatore ed introduce una
> possibile spiegazione che concretizza piu’ avanti, descrivendo una
> schematizzazione dell’ “ambiente” come struttura formata
> opportunamente da un insieme di oscillatori armonici.

Si', ma cosi' facendo sta gia` un po' barando. Prima dice che
per capire una misura ci vogliono tre elementi: il sistema da
misurare (un atomo con spin 1/2, nel suo esempio), l'apparato
di misura "d" (detector) e l'ambiente "E", poi nel modello fa
interagire direttamente il sistema (una particella) con
l'ambiente (il campo di oscillatori armonici). E l'apparato
che fine ha fatto?
In realta` (e qui parlo da many-worlder, ma non posso
evitarlo) quando c'e` di mezzo un apparato di misura
l'ambiente diventa irrilevante. La decoerenza si verifica
quando il sistema quantistico interagisce con un qualunque
altro sistema, preferibilmente ma non necessariamente
macroscopico, abbastanza intensamente da alterarne lo stato
in modo significativo; tale sistema puo` essere l'apparato di
misura, se c'e`, o in sua assenza l'ambiente.
A questo punto mi tocca spiegare meglio cosa intendo, quindi
spiego un attimo la decoerenza non secondo Zurek ma secondo
me. Prendiamo un sistema qualunque, che possa trovarsi in due
stati |A> e |B> ortogonali tra loro (potrebbero essere spin
opposti di una particella a spin 1/2, polarizzazioni
ortogonali di un fotone o qualunque altra cosa; immaginiamo
però che esista un'osservabile associata a questi stati, la
cui misura consenta di distinguerli; per semplicità userò
come osservabili i proiettori sugli stati stessi). Prendiamo
in considerazione, tra gli infiniti stati |psi> in cui il
sistema può trovarsi, i seguenti tre (sì, lo so, psi
generalmente si usa per le fdo, ma lo usa anche Zurek):

sistema singolo
1) |psi> = |A>
2) |psi> = |B>
3) |psi> = |C> = (|A> + |B>)/sqrt(2)

Supponiamo di eseguire una misura che ci dica in che stato si
trova il sistema. In generale, la misura che un sistema in
stato |psi> si trovi in stato |s> si può fare misurando
l'osservabile S = |s><s|, i cui autovalori sono 0 e 1. Il
valore medio della misura è <psi|S|psi>, ossia
<psi|s><s|psi>.
Misuriamo se il sistema è nello stato |A>. Dato che <A|A> =
<B|B> = <C|C> = 1 per definizione, <A|B> = 0 per
ortogonalità, <A|C> = (<A|A> + <A|B>)/sqrt(2) = (1 +
0)/sqrt(2) = 1/sqrt(2), abbiamo, nei tre casi qui sopra:

sistema singolo, misura di |A>
1) <A|A><A|A> = 1
2) <B|A><A|B> = 0
3) <C|A><A|C> = 1/2

Fin qui, tutto banale. Ora, supponiamo di verificare che il
sistema sia nello stato |C> (potrebbe trattarsi di un
esperimento di interferenza). Le probabilità nei tre casi
sono rispettivamente:

sistema singolo, misura di |C>
1) <A|C><C|A> = 1/2
2) <B|C><C|B> = 1/2
3) <C|C><C|C> = 1

Fin qui, ancora tutto da manuale. Faccio notare in
particolare la probabilità = 1 nel caso 3), che indica che la
sovrapposizione degli stati |A> e |B> è ancora coerente.
Supponiamo adesso che prima della misura il sistema
interagisca con qualcos'altro, chiamiamolo genericamente
"secondo sistema", influenzandone lo stato in base al
proprio. Diciamo che il secondo sistema si trova inizialmente
nello stato |?>, ma in seguito all'interazione il suo stato
cambia in |X> se lo stato del primo sistema è |A>, in |Y>
altrimenti:

sistema doppio
1) |A>|?> => |A>|X>
2) |B>|?> => |B>|Y>
3) |C>|?> = ((|A> + |B>)/sqrt(2))|?> => (|A>|X> +
|B>|Y>)/sqrt(2)

Notate che una volta specificate la 1) e la 2), la 3) ne
deriva per linearità.
Notate inoltre che non ho detto nulla degli stati |?>, |X> e
|Y>; non è detto che |X> e |Y> siano ortogonali, potrebbe
essere addirittura |X> = |Y>; potrebbe perfino essere |?> =
|X> = |Y> (se non c'è stata interazione). Notate inoltre che
non ho previsto che l'interazione cambi lo stato del primo
sistema; può ben accadere, ma non ha molta importanza ai fini
del discorso anche se lo complicherebbe, quindi assumerò per
semplicità che lo stato del primo sistema non cambi.
Cosa succede ora se misuriamo nei soliti tre casi che il
primo sistema sia nello stato |A>?

sistema doppio, misura di |A>
1) <X|<A|A><A|A>|X> = <X|X> = 1
2) <Y|<B|A><A|B>|Y> = 0
3) ((<X|<A| + <Y|<B|)/sqrt(2))|A><A|(|A>|X> + |B>|Y>)/sqrt(2) =
 = (<X|<A|A> + <Y|<B|A>)(<A|A>|X> + <A|B>|Y>)/2 =
 = (<X|)(|X>)/2 = 1/2

Non sembra quindi che sia cambiato nulla rispetto al caso del
sistema singolo. La differenza compare se proviamo a
verificare che il primo sistema sia nello stato |C> = (|A> +
|B>)/sqrt(2):

sistema doppio, misura di |C>
1) <X|<A|C><C|A>|X> = <X|X>/2 = 1/2
2) <Y|<B|C><C|B>|Y> = <Y|Y>/2 = 1/2
3) ((<X|<A| + <Y|<B|)/sqrt(2))|C><C|(|A>|X> + |B>|Y>)/sqrt(2) =
 = (<X|<A|C> + <Y|<B|C>)(<C|A>|X> + <C|B>|Y>)/2 =
 = (<X|<A|C> + <Y|<B|C>)(<C|A>|X> + <C|B>|Y>)/2 =
 = (<X| + <Y|)(|X> + |Y>)/4 =
 = (<X|X> + <X|Y> + <Y|X> + <Y|Y>)/4 =
 = (1 + <X|Y> + <Y|X> + 1)/4 =
 = (2 + <X|Y> + <X|Y>^*)/4 =
 = 1/2 + Re(<X|Y>)/2

L'ultimo risultato è quello importante. Vediamo due casi
limite.
Per |X> = |Y>: <X|Y> = 1, valore atteso = 1/2 + 1/2 = 1.
Questo è il valore che ci si aspetterebbe se il primo sistema
fosse (come infatti è) nello stato |C>.
Per |X> ortogonale a |Y>: <X|Y> = 0, valore atteso = 1/2.
Questo è il valore che ci si aspetterebbe se il primo sistema
fosse nello stato |A> o nello stato |B>: la coerenza della
sovrapposizione dei due stati nello stato |C> è quindi andata
distrutta.
Quando |X> e |Y> non sono ortogonali anche la loro fase
conta, ma nel seguito saranno perloppiù ortogonali.

Riassumo: la decoerenza tra gli stati nel primo sistema
avviene quando interagisce con un secondo sistema portandolo
in stati ortogonali intrecciati con quelli del primo sistema.
Se gli stati non sono ortogonali, la perdita di coerenza è
parziale ed in linea di massima (fase a parte) è tanto
maggiore quanto più gli stati sono prossimi all'ortogonalità.
Ma cos'è realmente la decoerenza? Davvero non è più possibile
rivelare se il primo sistema è nello stato |C>? Be', in
teoria si può. Basta modificare il processo di misura in modo
che non verifichi se il primo sistema è nello stato |C> =
(|A> + |B>)/sqrt(2) ma se il sistema composito è nello stato
(|A>|X> + |B>|Y>)/sqrt(2). Tale misura darebbe banalmente
sempre esito 1.
Il problema è che per eseguire questa misura bisogna innanzi
tutto sapere che c'è stata l'interazione con il secondo
sistema, sapere cos'è questo secondo sistema e conoscerne gli
stati |X> e |Y>, poi bisogna escogitare un esperimento per
misurare quell'osservabile complessiva e non è nemmeno detto
che sia fattibile. Quando tutto ciò non viene fatto, non
importa per quale motivo, si parla di decoerenza.

Fin qui ho usato la MQ pura e semplice, con tanto di
postulati sulla misura, quindi, a meno che non abbia cannato
qualche passaggio, direi che fin qui dovremmo essere tutti
d'accordo.
Ora cominciano i problemi.

Sia Zurek che la MWI partono dal presupposto che la MQ sia
applicabile a sistemi macroscopici e che il collasso della
fdo sia un concetto superfluo. Sia Zurek che la MWI prendono
in considerazione cosa succede se il "secondo sistema" è
macroscopico e, casi particolari, se sia un apparato di
misura, il semplice ambiente o una somma di apparato di
misura e ambiente. La MWI spesso nei ragionamenti include
nell'ambiente anche uno o più osservatori; mi par di capire
che Zurek cerchi di farne a meno.
E` immediato dimostrare che se il secondo sistema è un
apparato di misura i suoi stati corrispondenti ai valori
dell'osservabile da misurare sono ortogonali. Basti pensare
che per la MQ, se due stati |X> e |Y> non sono ortogonali,
non c'è un modo sicuro al 100% di distinguerli. Siete in
grado di distinguere i valori misurati dall'apparato? C'e`
una qualunque differenza macroscopica, come una lancetta
spostata almeno di una frazione di millimetro, un display che
mostra una cifra invece di un'altra? Allora questi stati
dell'apparato sono banalmente ortogonali. In generale, se c'è
una qualunque differenza osservabile tra gli stati di un
sistema macroscopico significa che sono ortogonali.
Naturalmente, gli stati possono ben essere ortogonali senza
che si veda chiaramente una differenza. Per un corpo solido,
penso che basti spostarlo di una frazione di angstrom. Per un
gas non saprei esattamente, ma penso che basti un'alterazione
molto piccola.

Zurek assume che con il procedere dell'interazione di un
sistema con l'ambiente gli stati dell'ambiente intrecciati
con quelli del sistema diventino ortogonali. Non ho
verificato formule e simulazioni, ma intuitivamente mi
quadra, quindi non ho nulla da obiettare.

Quando un sistema quantistico non viene misurato ma
interagisce liberamente con l'ambiente (Zurek fa l'esempio di
una particella "gatto di Schrödinger" la cui fdo ha due
picchi in posizioni diverse), Zurek giustamente tira in ballo
l'interazione con l'ambiente per mostrare come la decoerenza
avvenga già normalmente anche in assenza di apparati di
misura.
Tuttavia, perché Zurek tira in ballo l'ambiente anche quando
l'apparato di misura c'è e la decoerenza, come ho mostrato, è
senz'altro già avvenuta durante la misura? A mio avviso è
solo un trucco per tentare di fare a meno della MWI (con
scarso successo). Penso che convenga ripercorrere il
ragionamento di Zurek, citando l'originale. Zurek parte da un
esempio, un sistema a due stati (ad esempio lo spin di un
atomo in un esperimento Stern-Gerlach). Le note tra parentesi
quadre sono mie.
____________________________________________________________

I shall reproduce his analysis [John von Neumann (1932)] for
the simplest case: a measurement on a two-state system S
(which can be thought of as an atom with spin 1/2) in which a
quantum two-state (one bit) detector records the result.
The Hilbert space Hs of the system is spanned by the
orthonormal states |up> and |down>, while the states |d_up>
and |d_down> span the Hd of the detector. A two-dimensional
Hd is the absolute minimum needed to record the possible
outcomes. One can devise a quantum detector (see Figure 1)
that “clicks” only when the spin is in the state |up>, that
is,

 (2) |up> |d_down> => |up> |d_up> ,

and remains unperturbed otherwise (Zeh 1970, Wigner 1963,
Scully et al. 1989).
I shall assume that, before the interaction, the system was
in a pure state |psi_s> given by

 (3) |psi_s> = alpha|up> + beta|down> ,

with the complex coefficients satisfying |alpha|^2 + |beta|^2
= 1. The composite system starts as

 (4) |phi_i> = |psi_s>|d_down> .

Interaction results in the evolution of |phi_i> into a
correlated state |phi_c>:

 (5) |phi_i> = (alpha|up> + beta|down>)|d_down> =>
 => alpha|up>|d_up> + beta|down>|d_down> = |phi_c> .

This essential and uncontroversial first stage of the
measurement process can be accomplished by means of a
Schrödinger equation with an appropriate interaction. It
might be tempting to halt the discussion of measurements with
Equation (5). After all, the correlated state vector |phi_c>
implies that, if the detector is seen in the state |d_up>,
the system is guaranteed to be found in the state |up>. Why
ask for anything more? The reason for dissatisfaction with
|phi_c> as a description of a completed measurement is simple
and fundamental: In the real world, even when we do not know
the outcome of a measurement, we do know the possible
alternatives, and we can safely act as if only one of those
alternatives has occurred. As we shall see in the next
section, such an assumption is not only unsafe but also
simply wrong for a system described by |phi_c> [non è vero,
ci torno dopo].
____________________________________________________________

Taglio la parte successiva che illustra come von Neumann
affronto` il problema, introducendo una matrice di densità
rho_c e poi un ipotetico "processo 1" che produrrebbe una
matrice ridotta rho_r senza più i termini diagonali.
____________________________________________________________

The key advantage of rho_r over rho_c is that its
coefficients may be interpreted as classical probabilities.
[...]
By contrast, it is impossible to interpret rho_c as
representing such “classical ignorance.” In particular, even
the set of the alternative outcomes is not decided by rho_c!
This circumstance can be illustrated in a dramatic fashion by
choosing alpha = -beta = 1/sqrt(2) so that the density matrix
rho_c is a projection operator constructed from the
correlated state

 (8) |phi_c> = (|up>|d_up> - |down>|d_down>)/sqrt(2) .

This state is invariant under the rotations of the basis. For
instance, instead of the eigenstates of |up> and |down> of
sigma_z one can rewrite |phi_c> in terms of the eigenstates
of sigma_x:

 (9a) |forward> = (|up> + |down>)/sqrt(2) ,

 (9b) |backward> = (|up> - |down>)/sqrt(2) .

This representation immediately yields

 (10) |phi_c> = - (|forward>|d_forward> -
 - |backward>|d_backward>)/sqrt(2) ,

where

 (11) |d_forward> = (|d_down> - |d_up>)/sqrt(2) and
        |d_backward> = (|d_up> + |d_down>)/sqrt(2)

are, as a consequence of the superposition principle,
perfectly "legal" states in the Hilbert space of the quantum
detector. Therefore, the density matrix
 rho_c = |phi_c><phi_c|
could have many (in fact, infinitely many) different states
of the subsystems on the diagonal.
This freedom to choose a basis should not come as a surprise.
Except for the notation, the state vector |phi_c> is the same
as the wave function of a pair of maximally correlated (or
entangled) spin-1/2 systems in David Bohm’s version (1951) of
the Einstein-Podolsky-Rosen (EPR) paradox (Einstein et al.
1935). And the experiments that show that such nonseparable
quantum correlations violate Bell’s
inequalities (Bell 1964) are demonstrating the following key
point: The states of the two spins in a system described by
|phi_c> are not just unknown, but rather they cannot exist
before the “real” measurement (Aspect et al. 1981, 1982). We
conclude that when a detector is quantum, a superposition of
records exists and is a record of a superposition of outcomes
[non è vero] - a very nonclassical state of affairs.
____________________________________________________________

E qui è dove Zurek commette un errore. Consideriamo le sue
equazioni (8) e (10):

 (8) |phi_c> = (|up>|d_up> - |down>|d_down>)/sqrt(2) .

 (10) |phi_c> = - (|forward>|d_forward> -
 - |backward>|d_backward>)/sqrt(2) ,

*Sembrano* perfettamente simmetriche. Interpretando la (8) in
base alla MWI, avremmo due universi paralleli, uno in cui lo
spin è stato misurato come up, uno in cui è down. Per come è
scritta la (10), sembrerebbe avere lo stesso significato
fisico della (8); Zurek in sostanza sostiene che per la MWI
dovremmo allora avere due universi in cui sono stati ottenuti
forward e backward come esiti della misura e che quindi la
suddivisione in universi è arbitraria.
L'errore consiste nel dare ai simboli un significato che non
hanno. Mentre |backward> rappresenta il sistema (ad esempio
un atomo) nello stato backward, che è un vero stato di spin,
|d_backward> non è affatto lo stato di uno strumento che ha
misurato backward, come potrebbe sembrare dal simbolo
adottato; è banalmente, come da definizione (11), la
combinazione lineare di due stati, uno in cui lo strumento ha
misurato up, uno in cui ha misurato down:

 (11) |d_backward> = (|d_up> + |d_down>)/sqrt(2)

E` una cosa completamente diversa. Per rendersene conto,
basta immaginare che il detector d comprenda non solo uno
strumento ma anche uno sperimentatore umano che guarda cosa
indica lo strumento, scrive una frase su un foglio di carta e
preme uno di due pulsanti che accendono luci di diversi
colori. Abbiamo tre possibilità:

 a) scrive "ho misurato up" e accende la luce verde
 b) scrive "ho misurato down" e accende la luce verde
 c) scrive "non ho misurato né up né down, non capisco!" e
accende la luce rossa.

Se Zurek avesse ragione, nello pseudouniverso backward
dovremmo avere la situazione c, invece per la (11) abbiamo
una combinazione lineare di a e b. La scritta "non capisco!"
non compare da nessuna parte dello stato quantistico globale;
la luce verde si accende sempre; la rossa mai. Citando Zurek:
"In the real world, even when we do not know the outcome of a
measurement, we do know the possible alternatives, and we can
safely act as if only one of those alternatives has
occurred." E questo è esattamente quel che accade nella MWI:
non c'è proprio nessun universo con la scritta "non capisco!"
su quel foglio di carta e la luce rossa accesa.
E la questione della suddivisione in universi? Non è
arbitraria? Perché dovrebbero formarsi due universi up e down
e non due universi forward e backward? In realtà nella MWI
non "si formano" mai universi: esiste solo lo stato
quantistico universale, che noi esseri umani scomponiamo
idealmente in "universi" in base a criteri di buon senso.
Vediamola così: potremmo anche definire un universo backward
e dire che esiste. Il problema è che in questo pseudouniverso
non succede nulla che non stia succedendo negli universi up e
down, perché è solo una loro combinazione lineare. Magari
nell'universo up lo sperimentatore dopo aver scritto "ho
misurato up" esce a bere una birra, nell'universo down dopo
aver scritto "ho misurato down" va a mangiare una pizza, ma
nello pseudouniverso backward non fa altro che una
combinazione lineare delle due cose. In un certo senso, da un
certo punto di vista, si può sostenere che l'universo
backward esista; ma nello stesso senso, bisogna ammettere che
non contiene esseri senzienti che lo possano percepire
dall'interno, cosa che invece succede in up e down. In up lo
sperimentatore sa di stare bevendo una birra, in down di
stare mangiando una pizza, ma in backward non sa affatto di
stare alpha|bevendo una birra> + beta|mangiando una pizza>.
Se glielo si chiedesse, non potrebbe che rispondere alpha|sto
SOLO bevendo una birra!> + beta|sto SOLO mangiando una
pizza!>.
Pensare allo stato universale come composto dagli universi
forward e backward si può anche fare ma non serve a nulla.
Solo negli universi up e down i corsi degli eventi sono
indipendenti, pseudoclassici (almeno macroscopicamente) e
soprattutto internamente percepiti da osservatori senzienti;
la base secondo la quale si possa operare tale scomposizione
non è arbitraria, viene definita dalla dinamica (da come
funziona lo strumento di misura, se c'è, o l'interazione con
l'ambiente se non c'è: in generale, da come il sistema
quantistico in esame interagisce con qualcos'altro).
C'è poi un altro problemino, a mio avviso minore. La
rotazione di basi che Zurek esemplifica funziona bene su
un'espressione del tipo
(|up>|d_up> - |down>|d_down>)/sqrt(2),
i cui addendi sono prodotti tensoriali di al più due
sistemi, ma gli universi della MWI contengono non due ma
miliardi di sistemi i cui stati sono tutti intrecciati
assieme. Seguendo la logica di Zurek, se il detector d
interagisce con qualcos'altro, chiamiamolo A, e tentiamo di
cambiare base, abbiamo la seguente equazione:

(|up>|d_up>|A_up> - |down>|d_down>|A_down>)/sqrt(2) =
= - (|forward>|d_forward>|A_forward> -
- |backward>|d_backward>|A_backward>)/sqrt(2)

che mi risulta falsa per qualunque scelta di |d_forward>,
|d_backward>, |A_forward> e |A_backward> (sempre se non ho
cannato i calcoli), anche cambiando i segni - in +. E` sempre
possibile scegliere un'altra base, ma non mantenendo la
stessa forma.

Ma se Zurek non risolve il problema della base preferenziale
coinvolgendo l'osservatore come fa la MWI, come lo risolve?
Pretenderebbe di risolverlo con la decoerenza, coinvolgendo
l'ambiente anche quando non serve perché (dico io) la
decorenza è già avvenuta nell'apparato di misura:
____________________________________________________________

To illustrate the process of the environment-induced
decoherence, consider a system S, a detector D, and an
environment E. The environment is also a quantum system.
Following the first step of the measurement
process-establishment of a correlation as shown in Equation
(5)-the environment similarly interacts and becomes
correlated with the apparatus:

 (13) |phi_c>|E_0> =
 = (alpha|up>|d_up> + beta|down>|d_down>)|E_0> =>
 => alpha|up>|d_up>|E_up> + beta|down>|d_down>|E_down> =
 = |psi> .

The final state of the combined SDE “von Neumann chain” of
correlated systems extends the correlation beyond the SD
pair. When the states of the environment |E_i> corresponding
to the states |d_up> and |d_down> of the detector are
orthogonal, <E_i|E_i′> = delta_ii′, the density matrix for
the detector-system combination is obtained by ignoring
(tracing over) the information in the uncontrolled (and
unknown) degrees of freedom

 (14) rho_DS = TrE |psi><psi| = sum_i<E_i|psi><psi|E_i′> =
[nota: il precedente E_i′ dovrebbe essere E_i]
 = |alpha|^2|up><up||d_up><d_up| +
 + |beta|^2|down><down||d_down><d_down| =
 = rho_r .

The resulting rho_r is precisely the reduced density matrix
that von Neumann called for. Now, in contrast to the
situation described by Equations (9)-(11), a superposition of
the records of the detector states is no longer a record of a
superposition of the state of the system. A preferred basis
of the detector, sometimes called the “pointer basis” for
obvious reasons, has emerged [e qui sbaglia]. Moreover, we
have obtained it - or so it appears - without having to
appeal to von Neumann’s nonunitary process 1 or anything else
beyond the ordinary, unitary Schrödinger evolution. The
preferred basis of the detector - or for that matter, of any
open quantum system - is selected by the dynamics.
____________________________________________________________

Dicevo che qui Zurek sbaglia, o forse, più esattamente, dice
qualcosa di molto fuorviante. Intuitivamente c'era qualcosa
che non mi quadrava da qualche parte, ma dato che l'algebra
lineare non è il mio forte mi ci sono voluti giorni solo per
trovare il problema. La matematica in sé è corretta; è solo
la conclusione che non regge.
Zurek aveva scritto in precedenza, a proposito della matrice
di densità iniziale, senza decoerenza: "In particular, even
the set of the alternative outcomes is not decided by rho_c!
This circumstance can be illustrated in a dramatic fashion by
choosing alpha = -beta = 1/sqrt(2) [...] This state is
invariant under the rotations of the basis."
Bene. Lasciamo perdere un attimo il detector; consideriamo il
caso della particella "gatto di Schrödinger" la cui fdo ha
due picchi in posizioni diverse e che interagisce con
l'ambiente modellato da Zurek come un campo di oscillatori.
Zurek mostra che gradualmente, con il procedere
dell'interazione, la matrice di densità perde i termini non
diagonali. Se quindi indichiamo concisamente i due picchi a
sinistra e a destra (dopo l'interazione) rispettivamente come
|sinistra> e |destra>, la matrice ridotta risultante si può
scrivere come:

rho_r = (|sinistra><sinistra| + |destra><destra|)/2

Zurek sembra pensare che una matrice del genere, data la
perdita dei coefficienti di coerenza, identifichi i possibili
esiti sperimentali, indicando una base preferenziale, la base
{|sinistra>, |destra>}, ma non è così. Quella matrice di
densità può ben /derivare/ da una miscela statistica di stati
|sinistra> e |destra>, ma non /è/ quella miscela. Per
evidenziare la differenza, rappresentiamo la stessa matrice
nella base:

|ovunque> = (|sinistra> + |destra>)/sqrt(2)
|altrovunque> = (|sinistra> - |destra>)/sqrt(2)}

che è praticamente la stessa base usata da Zurek proprio per
sollevare il problema della base preferenziale:

(|sinistra><sinistra| + |destra><destra|)/2 =
= (((|ovunque> + |altrovunque>)/sqrt(2))((<ovunque| +
+ <altrovunque|)/sqrt(2)) +
+ ((|ovunque> - |altrovunque>)/sqrt(2))((<ovunque| -
- <altrovunque|)/sqrt(2)))/2 =
[cut vari passaggi]
= (|ovunque><ovunque| + |altrovunque><altrovunque|)/2

Ora la stessa matrice /sembra/ indicare una miscela di stati
del tutto diversa: entrambi gli stati sono ancora del tipo
"gatto di Schrödinger". Questo risultato non dovrebbe
sorprendere. Questo tipo di matrice di densità si ottiene per
esempio considerando due particelle a spin 1/2 nello stato di
singoletto, se si costruisce la matrice che rappresenta gli
esiti delle misure su una sola delle due particelle,
ignorando l'altra. E` ben noto che in questo caso non c'è una
direzione preferenziale: lungo qualunque direzione si misuri
lo spin, viene sempre fuori una miscela statistica 50%-50% di
versi opposti, ed è proprio questo che una matrice di densità
rappresenta: gli esiti prevedibili delle misure, non lo stato
reale del sistema.
Non è una coincidenza. L'altra particella è un caso
particolare di secondo sistema a stati intrecciati ortogonali
di cui parlavo prima, per cui la prima particella si può
considerare in una specie di decoerenza. Solo che questo non
basta a definire una base.
Devo dire onestamente che se consideriamo anche il detector
la reinterpretazione in una base diversa della matrice
ridotta si fa difficile, esattamente come nel caso del
prodotto tensoriale di tre sottosistemi, e per lo stesso
motivo: la matrice ridotta deriva appunto dalla riduzione a
due di un sistema composto da tre sottosistemi. Può sempre
essere ruotata in qualche altra base a scelta, ma diventa
molto più complicata. Ma a questo punto, se vogliamo pensare
che basti questo a risolvere il problema della base
preferenziale (e qualche dubbio l'avrei), chiamare in causa
l'ambiente è fuorviante: basta che siano coinvolti almeno tre
sistemi qualunque, anche tutti microscopici.

Veniamo quindi al perché Zurek tiri in ballo l'ambiente E
anche quando c'è l'apparato di misura d. In quella parte del
paper il coinvolgimento dell'ambiente consente a Zurek di
fare due cose:

1) Sostenere che, dato che gli stati dell'ambiente sono
sconosciuti e non sotto il controllo dell'osservatore (in
parole povere, non interessano), tanto vale rimuoverli dalla
matrice di densità. Ecco allora che eseguendo una traccia
parziale la matrice di densità perde gli elementi non
diagonali e passa da stato quantistico puro (con tanto di
sovrapposizione di macrostati, ossia universi paralleli) a
miscela statistica (e con ciò gli universi vengono nascosti
sotto il tappeto). Sarebbe un po' dura sostenere che gli
stati del detector siano sconosciuti e irrilevanti e vadano
ignorati, è più facile dirlo dell'ambiente.

2) Interpretare il risultato della riduzione in una base
arbitraria senza che la cosa sia troppo evidente. La
scomparsa dei coefficienti di coerenza fa pensare che sia
stata individuata una base, anche se non è esattamente così.

Personalmente trovo la cosa un po' ridicola dal punto di
vista fisico. L'apparato di misura non sarebbe abbastanza
macroscopico da produrre decoerenza, ma l'ambiente sì? E
quale sarebbe mai il confine tra i due? Il ragionamento di
Zurek non fa uso di alcuna assunzione sulla complessità del
sistema ambiente E; qualsiasi cosa può farne le veci, basta
che assuma stati ortogonali correlati a quelli del sistema
sotto osservazione e del detector. Se proprio mi serve un
terzo sistema da correlare a entrambi per poi tracciarlo via
dalla matrice, posso sempre usare come "ambiente" un pezzo
non essenziale dello strumento stesso; ad esempio, per uno
strumento con indicatore a lancetta protetto da una lastrina
di vetro, posso considerare l'aria trattenuta dal vetro.
Quella sicuramente si correla alla posizione della lancetta,
la chiamo "ambiente", la considero separatamente nella
matrice, poi la traccio via perché non mi interessa e oplà,
ho ridotto la matrice senza usare nient'altro che lo
strumento. Probabilmente andrebbe bene anche uno dei piedini
di gomma dello strumento, riceverà bene qualche
microvibrazione. In verità gran parte della massa dello
strumento andrebbe probabilmente bene...

> Continua quindi,
> mostrando l’ aumento di entropia nella transizione della matrice di
> densita’ ad una condizione diagonale (situazione classica), dove
> questa trasformazione e’ dovuta all’ interazione del sistema
> considerato insieme al detector con l’ ambiente. Tale interazione
> produce la decoerenza.
>
> Zurek mostra come il risultato della correlazione dello stato finale
> della “von Neumann chain”, produce una “riduzione” nella matrice di
> densita’.

L'interazione con l'ambiente di per sé non riduce affatto la
matrice, è Zurek a ridurla a forza di TrE per tagliare via
quel che non gli interessa. Solo in quel momento gli elementi
non diagonali spariscono.
Le simulazioni numeriche si basano su una formula che
contiene il calcolo del TrE: "Equation (17) is obtained by
first solving exactly the Schrödinger equation for a particle
plus the field and then tracing over the degrees of freedom
of the field."

> La conseguente sovrapposizione di informazioni degli stati del
> detector produce la necessita’ di stabilire una “base preferenziale
> per il detector” .
>
> A questo punto Zurek afferma che la “base preferenziale” e’
> determinata dalla dinamica (questa cosa non l’ ho ben capita. Cosa
> vuol dire, che elementi di informazione relativi alla “base
> preferenziale” sono impliciti nell’ Hamiltoniana ?

Si', ma tieni conto che l'Hamiltoniana sistema - apparato di
misura è determinata prima di tutto dalla struttura
dell'apparato, che deriva da quel che si vuole misurare.
Comunque, la questione è sottile.
Secondo Zurek, la base preferenziale deriva dalla dinamica,
ma la dimostrazione che ne dà nel paper è incompleta (la
dinamica determina come gli stati del sistema quantistico si
intreccino con quelli del detector e dell'ambiente E, ma poi
è Zurek a scegliere in che base rappresentare la matrice).
Anche secondo me la base preferenziale deriva dalla dinamica,
ma devo necessariamente tirare in ballo l'osservatore. La
base preferenziale è quella che corrisponde a universi
"classici", con osservatori senzienti. E` la dinamica a
determinare come gli stati del sistema quantistico si
intreccino con quelli del resto dell'universo, osservatori
compresi. Intrecciarli nel modo voluto, in modo che a ogni
stato del sistema che l'osservatore voleva distinguere
corrisponda un diverso macrostato dell'apparato e della
memoria dell'osservatore, è appunto la funzione dell'apparato
di misura. Par la MWI, un processo di misura non fa in realtà
nient'altro che quello. A seconda di cosa si vuole misurare,
si usa lo strumento la cui dinamica di interazione con il
sistema da osservare è tale da produrre l'effetto voluto. Se
non c'è una misura in atto, il sistema interagisce in modo
incontrollato con l'ambiente e la base che si afferma nella
maggior parte dei casi è approssimativamente posizionale.

Faccio un esempio assurdo (di "mixing alchemico") per
evidenziare meglio quanto sia critico lo stabilirsi delle
correlazioni tra stati di sistemi diversi.
Abbiamo un sistema L (lingotto) in stato |L> = |Pb> (lingotto
di piombo). Non è quindi un "gatto di Schrödinger", è un
normalissimo lingotto di piombo. Magari avrebbe potuto essere
un lingotto d'oro di pari massa (sistema in stato |Au>), ma
non lo è. Lo riscriviamo in un'altra base:

|L> = |Pb> = (|L_1> + |L_2>)/sqrt(2)
|L_1> = (|Pb> + |Au>)/sqrt(2)
|L_2> = (|Pb> - |Au>)/sqrt(2)

dove |L_1> e |L_2> sono "lingatti di Schrödinger", che sono
sia d'oro che di piombo.
Poi sosteniamo che il sistema interagisca con l'ambiente,
portandolo in stati ortogonali associati:

|LE_0> = ((|L_1> + |L_2>)/sqrt(2))|E_0> => (|L_1>|E_1> +
|L_2>|E_2>)/sqrt(2) = |LE>

assumendo che |L_1>|E_0> => |L_1>|E_1>, |L_2>|E_0> =>
|L_2>|E_2>.
Poi tracciamo via l'ambiente e otteniamo la matrice ridotta
di densità:

rho_r = (|L_1><L_1| + |L_2><L_2|)/2

Poi la ruotiamo tornando alla base originaria:

rho_r = (|Pb><Pb| + |Au><Au|)/2

Abbiamo quindi p = 1/2 di trovare che il lingotto è d'oro. Ma
com'è successo?
L'errore sta nell'aver assunto che in seguito all'interazione
con l'ambiente il sistema risultante fosse fattorizzabile
(es. |L_1>|E_0> => |L_1>|E_1>). Chiaramente non è vero:

|Pb>|E_0> => |Pb>|E_Pb>
|Au>|E_0> => |Au>|E_Au>
|L_1>|E_0> = ((|Pb> + |Au>)/sqrt(2))|E_0> => => (|Pb>|E_Pb> +
|Au>|E_Au>)/sqrt(2) =/= |L_1>|E_1>

Quella somma in generale non è fattorizzabile come
|L_1>|E_1>. Però noterete che non ho dimostrato che sia
invece corretto scrivere |Pb>|E_Pb> e |Au>|E_Au>... essendo
sistemi macroscopici, è praticamente impossibile che sia
matematicamente corretto scriverlo. E` solo un modello.
Queste notazioni semplificate sono usabili, ma tenendo sempre
ben presenti le assunzioni e i limiti del modello.
Quindi perché ho scritto che |Pb>|E_0> => |Pb>|E_Pb> è
sostanzialmente giusto mentre |L_1>|E_0> => |L_1>|E_1> è
sostanzialmente sbagliato? Dipende tutto dalla dinamica di
interazione tra lingotto e ambiente. L'ambiente non è un
sofisticatissimo (e imho irrealizzabile) strumento in grado
di eseguire un esperimento di interferenza tra l'essere un
lingotto di piombo o d'oro come se fosse un fotone che passa
attraverso due fenditure. Non è ragionevole assumere che
l'ambiente si correli con |L_1> (che è come dire che "misuri"
l'osservabile |L_1><L_1|); è invece ragionevole assumere che
si correli con |Pb>. Per le leggi fisiche è facile
distinguere un lingotto di piombo da uno d'oro; escogitare un
setup capace di distinguere tra |L_1> e |L_2> mi pare molto
più difficile, per non dire impossibile.
Quindi quando Zurek intreccia gli stati del detector e
dell'ambiente seguendo la base {up, down} sta facendo
un'ipotesi (ragionevole) sulla dinamica. Se invece avesse
intrecciato gli stati nella base {forward, backward} la
matrice sarebbe venuta fuori completamente diversa.

> Piu’ avanti dice
> che il “puntatore” e’ una costante del movimento descritto dall’
> Hamiltoniana . Non molto chiaro per me).

Decoerenza e processo di misura sono sostanzialmente la
stessa cosa. La decoerenza prodotta non da un apparato di
misura ma direttamente dall'ambiente si comporta come una
specie di misura eseguita dall'ambiente, come se l'ambiente
fosse un grosso apparato che fa misure (prevalentemente di
posizione) e poi non informa nessuno del risultato.
Se misuri due volte consecutive la stessa osservabile,
ottieni lo stesso valore (a parte la sua eventuale evoluzione
nel tempo tra le due misure). Deriva dai postulati sulla
misura: alla prima misura il sistema collassa in un autostato
dell'osservabile, alla seconda misura non succede niente
perché è già in un autostato. Stessa cosa quando a "misurare"
e` l'ambiente.
Facendo il solito esempio del lingotto, potremmo dire che,
anche se non sappiamo scrivere l'hamiltoniana di interazione
lingotto-ambiente, possiamo essere ragionevolmente certi che
le osservabili |Pb><Pb| e |Au><Au| commutino con
l'hamiltoniana (infatti i lingotti di piombo non tendono a
diventare d'oro), mentre |L_1><L_1| e |L_2><L_2| non
commutano.

> Quello che mi domando e se le collezioni di stati che si ottengono con
> la decoerenza (di cui il detector nella base scelta non possiede
> informazioni) possano costituire “set di informazioni distribuite
> nell’ ambiente” altresi’ chiamati MWI.

Per me sì, ovviamente, ma altri potrebbero non essere
d'accordo.

Ciao
Paolo Russo
Received on Fri Dec 22 2017 - 19:24:47 CET

This archive was generated by hypermail 2.3.0 : Wed Sep 18 2024 - 05:10:11 CEST