Lap(l)aciano: successioni

Visualizzazione post con etichetta successioni. Mostra tutti i post

venerdì, maggio 31, 2013

Test-driven maths: convergent sequences

I want to show today that working in the paradigm of test-driven-development, we can develop a working definition of a convergent sequence. Metaphorically speaking, we want to develop a mathematical "program" that, given a sequence, says to us that this sequence is convergent in some useful sense.

I will start with an easy example (which will be our first test). We look at the sequence of numbers, which we will call

Test sequence 1

$$1, \frac{1}{2}, \frac{1}{3}, \frac{1}{4}, ...$$

or, in other, terms $\{\frac{1}{n}\}_n$

It is clear (by intuition) that the numbers in this sequence (in the following sequence 1) become smaller and smaller approaching, but never touching 0. For this reason we will use this as our first test case, and try to derive a formal definition of what is a sequence of numbers that converges to 0.

By looking at the sequence 2 things become apparent: 1) the numbers get smaller and smaller and 2) the numbers always are positive. So we try our first defintion.

Convergent sequences, take 1

A sequence of positive numbers is said to be convergent to 0 if the numbers become smaller and smaller.

Let us try now to put it in more formal terms

Convergent sequences, take 2

A sequence of positive numbers $x_n\geq0$ is said to be convergent to 0 if $x_{n+1}< x_n$ for all $n$ index of the sequence.

Since now $\frac{1}{n+1}<\frac{1}{n}$, this definition seems to include our test tesequence 1, in the sense that according to this definition, our sequence converges to 0. Can we stop now? No. We have written a small test (checking whether the sequence 1 is converging) and a small piece of code (our take 2). But our mathematical insight is not yet satisfied, because our test does not cover many possible inputs (in form of test sequences of course). So, we have to extend our test.

In particular, it is maybe useful to have a sequence of which we know (always by intuition) that it does not converge to 0 so that we can check that our definition also fails when it must. The simplest thing to do is to consider the sequence 1 and add 1 to all members.

Test sequence 2

$$2, 1+\frac{1}{2}, 1+\frac{1}{3}, 1+\frac{1}{4}, ...$$

Now, since our sequence is composed of decreasing positive numbers, our tentative definition would call it convergent. Since we know that this sequence does not converge, that means that our program (take 2) does not pass the test. In fact the point is that our test sequence 2 is always at least 1 away from 0. So, let us add to our definition that the sequence cannot have a definite distance from 0.

Convergent sequences, take 3

A sequence of positive numbers $x_n\geq0$ is said to be convergent to 0 if $x_{n+1}< x_n$ for all $n$ index of the sequence and for any positive number $\epsilon$, it is not true that all numbers in the sequence are larger than $\epsilon$.

This looks good. Let us build some new test to check whether we are really there. Say, we take the sequence 2 and we put some 0 here and there. The resulting sequence should not converge according to our definition, since we are not getting closer and closer to 0 with all numbers!

Test sequence 3

$$2, 0, 1+\frac{1}{2}, 0, 1+\frac{1}{3}, 0, 1+\frac{1}{4}, ...$$

Now we have problem. The sequence is clearly non convergent: if we take the odd indexes, we go to 1, otherwise we go to 0. Since we have 0s over and over again in our sequence, we cannot find an $\epsilon$ such that all numbers are larger than that, so for that reason the sequence would be classified as convergent. But: since we inserted 0 over and over again, the numbers are not decreasing, and the sequence is classified as not convergent for that reason. This sounds weird. It looks that we pass the test, but for the wrong reason. Let us keep in mind that there is some problem with the decreasing property and let us correct the part regarding the distance from 0.

Convergent sequences, take 4

A sequence of positive numbers $x_n\geq0$ is said to be convergent to 0 if $x_{n+1}< x_n$ for all $n$ index of the sequence and for any positive number $\epsilon$, we can find some index $k$ (dependent on $\epsilon$) such that all numbers with index larger than $k$ are smaller than $\epsilon$.

Now we are on the safer side with the test sequences 2 and 3. Indeed, if I choose my $\epsilon = 0.9$ I am not able to find any index such that the numbers with larger index are smaller than 0.9, since I have over and over again some $1+\frac{1}{n}$ popping up in my sequence. Are we still on the safe side with sequence 1? Yes, since if I choose $k=\frac{1}{\epsilon}$, it is clear that for all larger index the numbers in the sequence are smaller than $\epsilon$ (this is undergraduate algebra, just try it). Note that now the test sequence 3 is classified as not convergent for both not being decreasing and for being not arbitrary small.

Now let us go back to the problem with the decreasing sequences.. If I have a sequence of numbers and scramble the order, I do not want that this scrambling changes whether we call the sequence convergent or not. So, we come with a second test sequences that has to converge.

Test sequence 4

$$\frac{1}{2}, 1, \frac{1}{4}, \frac{1}{3}, ...$$

We just switched the position of the neighbours. Now, this sequence is intuitevly convergent, but our take 4 says it is not, since the elements are not decreasing. So, what if we drop the assumption of having decreasing numbers?

Convergent sequences, take 5

A sequence of positive numbers $x_n\geq0$ is said to be convergent to 0 if for any positive number $\epsilon$, we can find some index $k$ (dependent on $\epsilon$) such that all numbers with index larger than $k$ are smaller than $\epsilon$.

This sounds familiar. Surprising as it is, real world mathematics really feel like that often: you start with some hypothesis of a theorem, try out some examples, until you are confident enough. Constructing the examples exactly gives you the boundaries of the hypothetical theorem. Can we build proofs by this method?

mercoledì, aprile 22, 2009

Why the exponential function?

In the first lecture of the point processes course, we have used at least twice the exponential function. It is maybe worth to shortly explain why the exponential function can be represented in different ways.
We are mainly concerned with the identities


e^{x} =  \sum_{n=0}^\infty \frac{x^n}{n!}= \lim_n (1+\frac{x}{n})^n

Let us start by defining the exponential function to be the only function for which


f(x) = f'(x)

up to a scalar factor. So, we have to check that both definitions enjoy this property. If it is case, then they will both agree with the exponential function, assumed that everything converges.

Let us check it for the first formula. Deriving term by term yields


d/dx\sum_{n=0}^\infty \frac{x^n}{n!} = \sum_{n=1}^\infty \frac{n x^{n-1}}{n!}=\sum_{n=1}^\infty \frac{ x^{n-1}}{(n-1)!}

By calling k the term n-1 we obtain our desired identity.

For the second one, observe that


d/dx f^n(x) = nf'(x)f^{n-1}(x)

Applying this to the product in the formula we obtain


d/dx(1+\frac{x}{n})^n  =\frac{n}{n} (1+\frac{x}{n})^{n-1}

But since


\lim_n (1+\frac{x}{n})=1

one could hope that the identity holds. But here we have some difficulties with the convergence, indeed.

giovedì, novembre 20, 2008

Una cosa poco nota...

Tutti conoscono il teorema del limite centrale: media di una sequenza di variabili i.i.d. con media 0 converge a N(0,n), dove N è la distribuzione normale, in formule

$\frac{X_1 + \ldots + X_n}{n} \to {\mathcal N}(0,n),\quad n \to \infty$

Meno nota è una sua semplice applicazione. Supponiamo che la nostra sequenza i.i.d. abbia 1 come valore atteso. Invece di considerare la media aritmetica, consideriamone la media geometrica data da

$\sqrt[n]{X_1 \times \ldots \times X_n}$

Il logaritmo della media geometrica è dato da

$\frac{\log X_1 + \ldots + \log X_n}{n}$

Queste sono variabili indipendenti, e quindi convergono a una distribuzione normale.
Esponenziando tutto quello che c'era all'inizio otteniamo: il prodotto di variabili i.i.d. con media 1 converge ad una distribuzione logonormale.

PS: tutto quello che ho detto vale a meno di qualche normalizzazione opportuna...

domenica, novembre 16, 2008

Bernoulli

Spesso mi piace pensarlo: uno dei piaceri più sottili della matematica è scoprire banalità di cui non ci si era mai accorti.

Consideriamo, a mo' d'esempio, una variabile casuale di Bernoulli (non so quante volte ho già linkato la pagina di Wiki sulle variabili casuali...). Essa vale 1 con probabilità 1/2 e vale -1 con probabilità 1/2. Nel caso di una famiglia composta da due variabili di Bernoulli indipendenti è semplice capire come faremo ad assegnare le probabilità: ognuno dei quattro valori possibili, cioè

(1,1), (1,-1), (-1,1), (-1,-1)

è assunto dalla nostra famiglia di variabili casuali con probabilità 1/4.

Ugualmente si prosegue per una famiglia composta da N variabili di Bernoulli indipendenti. Ognuno dei 2^N valori ha probabilità 2^-N e siamo tutti contenti.

Ma che succede se consideriamo infinite variabili indipendenti di Bernoulli? Succedono due cose gravi. La prima è che se divido 1 per 2^N ottengo 0 e quindi non è chiaro che misura debba avere ognuna delle successioni del tipo (1,1,-1,1,-1,...) nel nostro spazio di probabilità.

Più che grave, questa faccenda sarebbe solo un po' ironica, perchè se mi è richiesto di simulare una tale sequenza, scrivo rapidamente un programmo in pseudocodice

while 0<1:
print random in {0,1}

e mi cavo d'impiccio. Quindi sono ina situazione in cui so esattamente di cosa parlo, ma non so scriverlo in matematica.

Allora potrebbe venirmi in mente di usare una qualche variante della NSA e assegnare ad ogni successione un valore infinitesimo pari 1/|2^N|.

E qua arriva la seconda cosa grave: quel numero infinito |2^N| è un mostro, perchè è più che numerabile!

Non so perchè, ma quando mi sono accorto di questo inghippo sono rimasto un po' basito.

venerdì, agosto 15, 2008

Teoria alfa - composizione

Come promesso, continuo la mia discussione sulla teoria alfa.

Oggi parliamo della composizione di funzioni.

ASSIOMA DI COMPOSIZIONE

Siano f e g due successioni di reali e sia F una funzione tale che esistono F(f)(n) e F(g)(n). Allora f(Q)=g(Q) implica F(f)(Q)=F(g)(Q).

Qualche commento. Il primo: l'assioma afferma che F(f)(Q) dipende solo dal valore in Q di f. Quindi si può candidamente scrivere F(f(Q)) senza sbagliare.

Secondo commento: il nostro obiettivo è quello di scrivere e usare espressioni del tipo sin(Q²). Se si interpretasse sin(Q²) come il limite di sin(n²), allora il tutto non avrebbe senso, in quanto il limite si sin(n²) non esiste.

Con l'assioma di composizione possiamo dare un'ulteriore spiegazione del fatto che f(Q) non è il limite di f. Consideriamo le due successioni f(n)=(4n+1)p/2 e g(n)=4np/2. Evidentemente, sia f che g vanno ad infinito. Quindi se interpretassimo sin(Q) semplicemente come il valore di sin all'infinito, si dovrebbe avere sin(f(Q))=sin(g(Q)).

Tuttavia sin(f(n))=1 differisce da sin(g(n))=0 per ogni n. Quindi, per il secondo assioma di estensione, sin(f)(Q) deve essere diverso da sin(g)(Q).

Tutto questo accade perchè f(Q) non è Q, come accadrebbe se Q venisse interpretato semplicemente come un'altra maniera di dire "infinito", ma bensì f(Q)=(4Q+1)p/2, mentre g(Q)=4Qp/2. Per cui sin(f(Q))=sin((4Q+1)p/2) mentre sin(g(Q))=sin(4Qp/2) e non è nessun motivo per cui essi debbano essere uguali.

Non è difficile immaginare il valore di sin(f(Q)) e quello di sin(g(Q)), ma questo è per la prossima volta, fra 10 giorni.

lunedì, luglio 28, 2008

Teoria alfa - estensione

L'idea di Benci e di Di Nasso nel costruire la semplificazione dell'analisi non standard di cui parlavo precedentemente, consiste nel costruire un'estensione del campo dei numeri reali in maniera analoga a quello che si fa coi numeri complessi. In quel caso si aggiunge al campo dei reali l'unità i, che ha la proprietà i²=-1, e poi si completa il campo dichiarando le operazioni che si possono fare con questo nuovo elemento i.

Per esempio si dichiara che è possibile sommare un reale e i, o di moltiplicare un reale e i, per cui tutti i numeri del tipo a i + b i sono numeri del nostro nuovo sistema.

Nel nostro caso, chiamiamo la nuova unità Q. Il nostro campo dei numeri iperreali sarà quindi formato dai numeri reali, da Q, e da tutto quello che si ottiene applicando a Q le regole che permettono di manipolarlo.

Analogamente al caso dei numeri immaginari, dobbiamo elencare quali sono le regole con le quali Q viene manipolato. Oggi discuteremo le due prime ragole: i due assiomi di estensione.

ASSIOMI DI ESTENSIONE

1) Se f è una successione di reali, allore f può essere estesa in maniera unica nel punto Q.

Si può tenere a mente che Q è come un numero naturale, ma inifinitamente grande. Si potrebbe allora pensare che f(Q) è il limite di f. Questo non è completamente esatto, perchè vale:

2) Se f e g sono due successioni tali che f(n) differisce da g(n) per ogni n, allora f(Q) differisce da g(Q).

Facciamo adesso un esempio; consideriamo f(n)=1/n e g(n)=2/n. Per prima cosa notiamo che, per il primo assioma di estensione f(Q) e g(Q) esistono. Denotiamoli, per ovvi motivi 1/Q e 2/Q.
Per il secondo assioma di estensione, si ha che 1/Q è diverso da 2/Q.

Sarebbe interessante verificare che 2/Q=2 1/Q, ma questo è impossibile con gli assiomi scelti fino ad ora.

mercoledì, maggio 14, 2008

Misure e continuità

Sto studiando un po' di teoria della misura in questo periodo. Devo confessarlo: è una materia che ho spesso considerato noiosa.

Anzi no, il corso Analisi IV a Tübingen (dove si faceva quasi solamente teoria della misura) mi è piaciuto anche parecchio. Poi, la difficoltà del corso e la freddezza del docente mi hanno portato ad orientarmi più verso l'analisi. La mazzata finale l'ha data un noiosissimo corso di Stocastica I...

Ma basta divagazioni: una cosa divertente delle misure è che ogni misura ha delle proprietà intrinseche di continuità; qualcuno chioserebbe che tali proprietà le derivano dall'essere una funzione positiva.

Se volete rinfrescarvi la memoria, potete dare un'occhiata all'articolo di wiki sulle misure.

La proprietà di continuità di cui parlo può essere formulata in questa maniera: la misura di un punto singolo si ottiene come limite della misura delle palle attorno al punto. Come al solito denoto B(x,r) la palla di centro x e raggio r.

Lemma di continuità per misure

Sia N una misura di probabilità (di Borel definita su uno spazio metrico ) e sia a(n) una successione decrescente di reali positivi convergente a 0.

Allora N({x}) = lim N(B(x, a(n))).

Dimostrazione

La dimostrazione è un corollario del fatto che una misura è continua dall'alto; se gli A_n sono insiemi misurabili e soddisfano

$\ldots \subset A_{n+1} \subset A_n\subset \ldots$

allora la misura dell'intersezione converge al limite delle misure. Quindi, dato che l'insieme {x} è l'intersezione delle palle attorno a se stesso, si ottiene il risultato voluto. Q.e.d.

Ovviamente abbiamo barato, perchè la difficoltà della dimostrazione consiste nel provare la continuità dall'alto. Tuttavia, la dimostrazione della continuità dall'alto non è particolarmente interessante è può essere trovata qui. Si tratta solo di usare la sigma-additività della misura e di fare una stima attenta.

Questo facile lemma ha un suo interesse: infatti è la chiave per la dimostrazione della rappresentazione delle misure di conteggio data qui.

mercoledì, aprile 02, 2008

Successioni di Cauchy

Gli spazi metrici hanno un grande vantaggio. In un tale spazio è infatti possibile definire una successione di Cauchy.

Una successione (x_n) di elementi in uno spazio metrico è detta di Cauchy se per ogni quantità qcomunque piccola è possibile trovare un N tale che d(x_n, x_m) <> N.

Detto così, è un po' triste e freddo; per apprezzare l'utilità di una tale proprietà il primo passo è ricordare un ottimo teorema di analisi I.

Teorema

Sia (x_n) una successione di numeri reali. Allora (x_n) converge se e solo se è di Cauchy.

Dimostrazione

Incominciamo ricordando che la distanza di due numeri reali x,y è definita tramite d(x,y):=|x-y|. Dimostriamo prima l'implicazione più facile.

Supponiamo che la successione converga verso un limite x e fissiamo un q arbitrario. Dato che la successione converge, esiste un N tale che |x_n - x| < 0.5 q per ogni n > N.
Fissiamo adesso n,m arbitrari maggiori di N. Per la disuguaglianza triangolare vale

|x_n - x_m| =< |x_n - x| +| x_m-x| < q

Questo è ciò che volevamo dimostrare.

Per vedere che vale anche l'implicazione opposta, osserviamo prima che ogni successione limitata in R ha una sottosuccessione convergente.

Per vedere ciò si fissi R positivo tale che -R < x_n < R. Scomponendo (-R,R)=(_R,0) U 0 U (0,R) si osservi che la successione ha infiniti termini in uno degli intervalli. Se x_n=0 per infiniti n abbiamo già la nostra sottosuccessione convergente. Altrimenti scegliamo fra i due restanti intervalli uno che contenga infiniti termini e scegliamo il termin x_n con indice più basso all'interno dell'intervallo. Iterando il procedimento otteniamo una successione di intervalli incapsulati (a_n,b_n) e una sottosuccesione di x_n tale che x_n_k è in (a_k,b_k). Per il teorema dei carabinieri x_n_k converge.

Osserviamo anche che una successione di Cauchy è limitata: per vedere ciò si scelga N tale che |x_n - x_m| < 1 per ogni n,m > N. Allora la successione è compresa tra il minimo dei primi N elementi - 1 e il massimo dei primi N elementi +1.

D'altra parte ogni due sottosuccessioni convergenti hanno lo stesso limite a causa della proprietà di Cauchy.

Concludiamo: la successione di Cauchy è limitata. Quindi ogni sottosuccessione è limitata. Quindi ogni sottosuccessione ha una sottosottosuccessione convergente. Tali sottosottosuccessioni convergono sempre a x.

Si ricordi questo post. La proprietà precedente vuol dire che la nostra succesione di Cauchy converge a x!

Nel secondo passo, che rimando ad un post successivo, osserveremo come la proprietà di Cauchy suggerisca una maniera algoritmica di verificare la convergenza di una successione, a differenza della definizione di limite.

Ps: per qualche motivo, blogger non mi accetta più i link di texify.com... qualcuno ne sa qualcosa?

venerdì, gennaio 18, 2008

Suriettività

Per D.M. da me e R.N.

È vero che il duale di c={successioni convergenti} è isomorfo a $\ell^1$ . Però l'isomorfismo non è quello che uno si aspetta. Infatti sarebbe portato a definire per un funzonale r in c* una successione sommabile come $x(r)=(r(e_i))_{i \in \mathbb N}$ , dove e_i

sono i vettori della base canonica di c00={successioni finite}. Tuttavia questa applicazione f:r --> x(r) non è quella giusta.

Si prenda per mostrarlo il funzionale lineare r, continuo su c che ad una successione y associa il suo limite, i.e. r(y)=lim(y). Ovviamente r(e_i)=0

. Quindi l'applicazione f ha come immagine una succesione sommabile, cioè (0,0,...). Ma questa successione sommabile non è quella giusta, perchè applicata ad una successione di c non restituisce il suo limite.

Detto in altre parole, f non è surgettiva.

venerdì, ottobre 19, 2007

apologia

meglio tardi che mai

mio nonno

la matematica è una cosa strana: m si studia per anni e anni un argomento, e non si capisce mai quale ne sia il senso, e lo si disprezza, e ci si dice "si, dovrei studiare anche questo", ma non se ne ha voglia e si cerca di evitare.

fino a quando, un giorno, d'improvviso, mentre si cerca di dimostrare un risultato per la densità spettrale di sequenze di potenziali d'azioni, si viene fulminati dal vero significato della vita.

in questo caso, delle variabili aleatorie.

consideriamo un insieme finito di numeri reali A=(a_1, ... , a_k). si definisca adesso una successione tramite

$x_n:= a_{n{\rm mod}k}, \qquad n \in \mathbb N$

in pratica percorriamo tutti gli a_j dal primo all'ultimo, e poi ricominciamo. è evidente che tale successione non converge: ha esattamente k punti di accumulazione. tuttavia, se consideriamo il limite secondo cesaro, di cui ho parlato anche l'ultima volta, allora si vede subito che

$\lim^C_{n\to \infty} x_n= \frac{1}{k}\sum_{j=1}^k a_j$

in realtà, si vede subito che non è necessario definire la successione in tale maniera artificiosa. come prima generalizzazione si scelga ad ogni "giro" un nuovo ordine in cui vengono assunti i valori. si vede, quindi, che è possibile definirla in una maniera arbitraria, purchè la densità relativa che i valori valori a_j sia uguale. se le densità sono diverse (si noti che non ho ancora definito cos'è questa densità e che non lo farò), allora il limite secondo cesaro altro non sarà che una media pesata, dove il peso altro non è che la densità del valore in questione.

ora, supponiamo di non volerci fissare su una specifica, per quanto arbitraria, scelta dell'ordine dei valori assunti dalla successione. vogliamo lasciare la massima libertà, e scegliere una successione in maniera in parte algoritmica cioè deterministica, e in parte casuale, cioè stocastica.

per ogni n scegliamo un numero a caso fra gli elementi di A, purchè alla fine (per n grande) siano rispettate le densità relative. cosa abbiamo fatto? non abbiamo fatto altro che definire una successione indipendente di variabili aleatorie X, ognuna di esse avente la seguente distribuzione: con probabilità p_j pari alla densità del numero in questione, viene assunto il valore a_j.

per capire la connessione tra limite secondo cesaro e il valore atteso si consideri ogni successione scelta secondo tale algoritmo come una particolare realizzazione di questa successione di variabili aleatorie. il limite secondo cesaro di tale realizzazione esiste ed è uguale al valore atteso della variabile aleatoria. cioè, indicando con X tale variabile aleatoria,

$\lim^C_{n\to \infty} x_n=E(X)$

qua si vede il vantaggio dell'approccio stocastico: non è necessario fermarsi a variabili aleatorie a valori in un insieme finito, o numerabile. si può assumere che la variabile aleatoria abbia valori reali. e mentre nel caso numerabile sarebbe possibile definire la successione in questione in maniera algoritmica, dato che è possibile assegnare ad ogni valore che può assumere X una densità finita maggiore di 0, ciò diventa impossibile nel caso continuo, rendendo necessario il ricorso al concetto di variabile aleatoria.

prima o poi devo spiegare cosa ha che fare tutto ciò con la densità spettrale di una popolazione neuronale.

martedì, ottobre 16, 2007

sinapsi, catene di markov multiple e limiti secondo cesaro

i have never done anything 'useful'. no discovery of mine has made, or is likely to make, directly or indirectly, for good or ill, the least difference to the amenity of the world

g. h. hardy

in questi giorni discutevo con un ragazzo di friburgo, che sta studiando un modello di sinapsi per il riconoscimento locale di correlazioni. fra gli altri problemi che deve risolvere, me ne ha presentato uno, per lui statistico, per me di analisi funzionale, che vi presento in una forma lievemente modificata.

il nostro scenario è il seguente: ci sono una certa quantità di particelle che si muovono in uno spazio-tempo discreto. ad ogni step temporale si muovono dallo stato i allo stato j con probabilità a_{ij}. con questi a_{ij} si può formare una matrice, detta matrice di transizione. la nostra situazione è però un po' più complicata. ad ogni step temporale, si sceglie la matrice di transizione da un insieme di M matrici transizione, secondo un certo vettore di probabilità p=(p_k). per comodità diamo un nome a queste matrici di transizione

$A_k:=(a^k_{ij})_{i,j=1,\ldots,N}, \qquad k=1,\ldots,M$

la domanda che ci poniamo: esiste, ed in che senso, una distribuzione limite delle particelle? più precisamente ci si chiede se il limite

$\lim_{t \to \infty}{\mathrm Prob_t}(x \in j)$

esista ed a che condizioni.

se avessimo a che fare con una singola matrice di transizione, assumendo che essa sia primitiva, cioè che le sue potenze convergano ad una proiezione unidimensionale, cioè che l'unico autovalore sul cerchio unitario sia 1 e che abbia dimensione dell'autospazio relativo pari a 1, allora si dimostra facilmente che la probabilità che una particella x si trovi nello stato j converge verso

${\mathrm Prob}_\infty (x \in j)= \frac{v_j}{||v||_1}$

qui v è uno qualsiasi degli autovettori nell'autospazio relativo all'autovalore 1. si potrebbe dunque pensare che nel caso di M matrici di transizione il tutto si comporti come se la matrice di transizione fosse

$A:= \sum_{k=1}^M p_k A_k$

qui p è il vettore di probabilità le cui componenti p_k sono le probabilità con cui A_k viene scelta in uno step temporale.

simulando al computer (per un numero alto ma fisso di particelle e di iterazioni) questo sistema dinamico discreto abbiamo subito notato che non erà così, ma che lo era solo se si faceva la media di varie simulazioni. mentro ero in bicicletta ho capito perchè: facendo la media su varie simulazioni non facevamo altro che passare dal limite della distribuzione di probabilità, che evidentemente non esiste a a causa delle oscillazioni dovute al passare da una catena di markov all'altra, al limite secondo cesaro che, altrettanto ovviamente, esiste.

la cosa più divertente è che quando ho tentato di spiegare al mio collega, fisico, che stavamo tentando di calcolare un limite che non esiste, lui non riusciva a capacitarsi di questo fenomeno...

lunedì, luglio 30, 2007

basi, parentesi e successioni

il meglio è nemico del bene

mio nonno

mi sento di dissentire da mio nonno, una volta tanto. talvolta, il meglio è amico del bene. in particolare quando si vuole capire meglio certi concetti matematici, senza accontentarsi di capirli bene.

questo a proposito di una mia opinione, già espressa in questa discussione, dove ho spiegato quale è il motivo per cui è male rappresentare successioni all'interno di parentesi graffe.

il casus belli è il seguente: è corretto rappresentare una successione come {x_n : n\in N}, o è necessario rappresentarla come (x_n)_n \in N? sembra una question allemande, ma, come ho già detto, il meglio è amico del bene.

partiamo dal presupposto che la rappresentazione tramite parentesi graffe, che in matematica denotano solitamente insiemi è sbagliata. tuttavia, molti si sentono autorizzati ad usare lo stesso tale notazione.

quello che è accaduto, a mio parere, è una sorta di back propagation dalla notazione per le basi a quella per le successioni. quasi tutti, e fra poco spiegherò perchè, scrivono le basi in parentesi graffe, pur intendendole come insiemi ordinati. dato, quindi, che è accettato lo scrivere le basi in parentesi graffe, avrà pensato qualcuno, allora deve essere possibile scrivere anche le successioni all'interno di parentesi graffe. d'altra parte, il concetto di base e quello di successione sono imparentati - nel senso che vivono nella stessa aerea della matematica.

perchè, allora, qualcuno si sente autorizzato a scrivere le basi in parentesi graffe? il motivo è semplice, e dipende da come viene insegnata l'algebra lineare. come si spiega il concetto di base? prima si introduce il concetto di un insieme di vettori linearmente indipendenti, poi quello di sottospazio generato da un insieme di vettori, per poi concludere, trionfalmente, che se un insieme di vettori genera l'intero spazio, allora è una base dello spazio in questione.

a questo punto bisogna purtroppo scegliere. se si desidera introdurre la rappresentazione matriciale degli operatori lineari su spazi vettoriali, allora è necessario che l'insieme di vettori linearmente indipendenti generanti lo spazio venga ordinato, a formare quella che viene solitamente definita una base - da cui, peraltro, il termine "matrice del cambiamento di base".

se invece, si desidera mantenere la consistenza della definizione di una base come insieme di vettori linearmente indipendenti generanti lo spazio ambiente, allora bisogna rinunciare alla rappresentazione matriciale - o considerarla modulo permutazioni dei vettori della base.

domenica, giugno 17, 2007

successioni convergenti

das ist absurd!

un uomo alla stazione di ulma

sabato mi trovavo in quel di blaubeuren per seguire un seminario; quando, all'improvviso, durante la relazione di una ragazza peraltro brava, si materializza quanto io piú temo e abborro: un'unutile dimostrazione per assurdo. abbiamo discusso un po', e alla fine ci siamo pacificamente accordati sull'eliminazione dell'inutile assunzione.

il passo falso in questione riguardava un argomento contenente una divertente caratterizzazione delle successioni convergenti:

Teorema

Una successione ha L come limite se, e solo se, ogni sua sottosuccessione possiede una sottosuccessione che converge a L.

osservato che una direzione dell'equivalenza é banale, andando a casa mi sono chiesto come si dimostra l'altra direzione, e, mentre aspettavo il treno, ho prodotto il primo tentativo.

Dimostrazione 1 (per assurdo)

Si supponga che (x_n) non converga verso L, cioé che ci sia un ulteriore punto di accumulazione della successione, che chiamo L', diverso da L, eventualmente piú o meno infinito. Allora esiste una sottosuccessione (x_p(n))che converge verso L'. Considero adesso una sottosuccessione (x_q(p(n))) di (x_p(n)) che abbia come limite L. Dato che (x_p(n)) converge verso L', allora anche (x_q(p(n))), ma questo é assurdo, qed.

mi sono immediatamente vergognato di aver prodotto una tale dimostrazione per assurdo, dopo aver polemizzato durante il seminario, e quindi mi sono rimesso a leggere racconti notturni di hoffmann, ma con l'idea di espiare le mie colpe appena arrivato a casa, con l'utilizzo dell'ultimo ritrovato tecnologico per matematici: un pezzo di carta.

Dimostrazione 1 (astratta)

Si chiami A l'insieme dei punti di accumulazione di (x_n). Bisogna dimostrare che A={L}. si scriva A come l'unione U degli insiemi dei punti di accumulazione di (x_p(n)), al variare di p successioni strettamente crescenti di numeri naturali. É evidente che L é in U. Sia L' un elemento di U. Allora esiste p tali che (x_p(n)) converge verso L'. Si consideri una sottosuccessione (x_q(p(n))) di (x_p(n)) convergente verso L, che esiste per ipotesi. Per l'unicitá del limite, L=L', qed.

non appena ho finito di scrivere questa dimostrazione bourbakistika e barocca ero poco soddisfatto, per la sua intutile complessitá. dopo pochi secondi, fortunatamente, mi sono accorto della dimostrazione "vera".

Dimostrazione 1 (vera)

Si chiami A l'insieme dei punti di accumulazione di (x_n). Sia L' in A. Si consideri (x_p(n)))convergente verso L'. Dato (x_p(n)) ha per ipotesi una sottosuccessione convergente verso L, per l'unicitá del limite si ha che L=L', qed.

oggi arrivo all'universitá per scrivere questo giuoco sul blog, e trovo il mio compagno di stanza, r.n.. gli racconto questo divertissement, e lui, subito: "allora certo puoi rispondere ad una mia domanda! vale la caratterizzazione in spazi di hausdorff?"

supponiamo che non valga...

PS: comunque si, si dimostra (senza assurdi) che vale in ogni spazio di hausdorff.

Lap(l)aciano