lunedì, marzo 31, 2008

Teoremi di Baire (II)

Passo alla dimostrazione del teorema enunciato qui.

Quello che dobbiamo dimostrare è che uno spazio metrico completo non può essere espresso come unione numerabile di insiemi chiusi mai densi. Prima di cominciare la dimostrazione, chiediamoci cosa vuol dire. Un esempio facile si ottiene scegliendo il piano come spazio metrico completo; come distanza si scelga la distanza euclidea. Cos'è un insieme mai denso (vedi post precedente!) nel piano? Un tale insieme non può contenere una palla; intuitivamente, gli insiemi mai densi del piano sono varietà monodimensionali; ce ne ovviamente qualcuno in più, ma non molti. Quindi il teorema afferma che il piano non può essere decomposto, ad esempio, in un unione numerabile di segmenti; sembra banale, ma si pensi che non è necessario che i segmenti siano paralleli. Il teorema di Baire-Hausdorff assicura che non importa come si orientano i segmenti: non si riuscirà a ricoprire il piano con una quantità numerabile di essi.


Teorema di Baire-Haudorff

Uno spazio metrico completo non vuoto è di seconda categoria.

Dimostrazione

Dobbiamo dimostrare che non esiste una successione di insiemi chiusi e mai densi che ricopramo lo sapzio topologico completo X.

Come in tutte le dimostrazioni di inesistenza, l'unica possibilità risiede in una dimostrazione per assurdo (io e wiki).

Consideriamo allora una successione di insiemi chiusi mai densi M_n e assumiamo che la loro unione sia il nostro spazio topologico X.

La prima osservazione è che il complemento di M_1, che denotiamo C(M_1), è aperto e che quindi contiene una palla chiusa B_1 di centro x_1 e raggio r_1. Dato che M_1 è mai denso, il suo complemento è denso in X e quindi x_1 può essere scelto arbitrariamente vicino ad ogni punto di X. Questo sarà importante nel secondo passo! Il raggio lo scegliamo più piccolo di 0.5.

Come secondo passo notiamo che anche il complemento di M_2 è aperto e denso e quindi contiene una palla chiusa B_2, che per densità può essere scelta come avente centro x_2 all'interno di B_1. Il suo raggio lo scegliamo pari a (r_1)^2. Si noti che dato che r_1<0.5, tale sfera sarà contenuta nella precedente.

Ripetiamo quindi lo stesso ragionamento per ogni n e otteniamo una serie di palle, contenute l'una nell'altra. Per la disuguaglianza triangolare per la distanza di due centri x_p, x_q (per semplicità scegliamo p < q) vale

d(x_p,x_q) \leq \sum_{k=p}^q \frac{1}{2^{k}}

Dato che la serie converge, la distanza diventa piccola a piacere se p va a infinito, quindi i centri formano una successione di Cauchy.

Ora usiamo la completezza dello spazio e otteniamo che la successione dei centri converge verso un limite x.

Dato che ogni palla B_n è contenuta nella precedente B_{n-1}, se ne deduce che il limite x è in tutte le palle. Per vedere che vale questa affermazione si usi la disuguaglianza triangolare per osservare che

d(x,x_m) \leq d(x,x_n) + d(x_n,x_m) \leq r_m + \epsilon

Dato che epsilon può essere scelto arbitrariamente piccolo mandando n a infinito, dato che le palle sono chiuse, e data l'arbitrarietà di m, se ne deduce che x è contenuto in ogni palla.

Adesso concludiamo: le palle erano contenute nei complementi C(M_n), quindi il limite x è contenuto in tutti i complementi C(M_n), in quanto elemento di ogni palla. Dunque non è contenuto in nessun M_n. Quindi abbiamo trovato un elemento di X che non è contenuto in nessun M_n.

Dato che però avevamo assunto che X è un unione degli M_n, abbiamo un assurdo!


Wow, finito... la dimostrazione è adatta da quella di Yosida in "Functional Analysis". A dire il vero non so come sia la dimostrazione originale di Baire. Mi riprometto di cercarlo, prima o poi.

venerdì, marzo 28, 2008

Teoremi di Baire (I)

Sto ristudiando un po' di analisi funzionale per rinfrescarmi la memoria. Una delle cose fantastiche sono i teoremi di Baire, che sono veramente entusiasmanti.
Come al solito, consiglio di dare almeno uno sguardo alla biografia di Baire, la cui vita sembra un romanzo di Flaubert.

Per prima cosa, ci servono alcuni concetti. Quello che ci serve è esprimere la piccolezza relativa di un insieme in una maniera puramente topologica: cioè non vogliamo usare ne` una misura, ne`una dimensione algebrica, ma solo il concetto di insieme aperto.

Definizione 1

Sia X uno spazio topologico. Un sottoinsieme M di X è mai denso se non contiene alcun aperto non vuoto.

Un insieme di questo genere è piccolo nel senso che la sua chiusura non contiene alcuna palla di raggio finito!

Il secondo concetto che ci serve è una lieve estensione del precedente.

Definizione 2

Un sottoinsieme M di X è di prima categoria se è l'unione numerabile di insiemi mai densi. M è di seconda categoria se non è di prima categoria.

Si noti che ogni spazio topologico è sottoinsieme di se stesso. Così si può parlare di uno spazio topologico di prima o seconda categoria. Ora possiamo formulare il teorema di Baire-Hausdorff.

Teorema di Baire-Haudorff

Uno spazio metrico completo non vuoto è di seconda categoria.

La dimostrazione sarà in un post successivo. Faccio solo notare che ho già parlato di spazi metrici qui. Ricordo che uno spazio metrico è completo se esiste il limite di ogni successione che sia di Cauchy rispetto alla metrica.

mercoledì, marzo 26, 2008

Spazi metrici

Mi sto ripassando un po' di topologia in questo periodo, e quindi ho pensato di scrivere un post sull'oggetto più facile da "vedere" nella topologia: lo spazio metrico.

Quello che vogliamo fare in uno spazio metrico è misurare distanze fra elementi di un insieme X: per fare questo utilizziamo una funzione a valori reali positivi, la distanza. Questa distanza associa ad ogni due elementi di X un numero reale maggiore o uguale a 0. In formule

d: X \times X \to [0,\infty)

Ovviamente, non tutte le funzioni di questo genere sono accettabili.
Richiediamo, infatti, qualche proprietà ulteriore. In primis, vogliamo che la distanza fra due elementi sia sempre maggiore di 0, se gli elementi sono distinti. In formule,

d(x,y)= 0 \Leftrightarrow x=y

Questa richiesta (detta positiva definitezza) non è arbitraria come sembra; se infatti ci fossero elementi che hanno fra loro distanza 0, allora essi non possono essere distinti tramite questa funzione; essi rappresentano lo stesso punto dello spazio metrico che si ottiene identificando fra loro tutti i punti che hanno distanza 0.
La seconda richiesta è una richiesta di simmetria: la distanza percorsa da x verso y deve essere la stessa di quella da y verso x. In formule

d(x,y)=d(y,x), \qquad x,y \in X

In ultimo, richiediamo che il valore d(x,y) rappresenti la distanza minima fra x e y. Cioè che non esistano scorciatoie ottenute passando per un punto z. In altre parole,

d(x,y) \leq d(x,z) + d(z,y), \qquad x,y,z \in X

Questa proprietà si chiama disuguaglianza triangolare.

Una funzione che soddisfi tutte le quattro richieste di cui sopra è detta una distanza; la coppia (X,d) è detta uno spazio metrico.
Già con questi pochissimi ingredienti, si può ottenere un divertente risultato.

Lemma

Sia d una metrica su X e f una funzione continua sui reali positivi cresecente, invertibile e concava, cioè tale che

f(x+y) \leq f(x)+f(y), \qquad x,y \geq 0

Allora la composizione f \circ d è una metrica su X.

Dimostrazione
Dato che f è invertibile e monotona crescente, vale f(0)=0 e f(x) > 0 per ogni x > 0. Quindi f(d(x,y)) = 0 se e solo se d(x,y)=0 se e solo se x=y. L'uguaglianza f(d(x,y))=f(d(y,x)) vale perchè d(x,y)=d(y,x).
Per mostrare che vale la disuguaglianza triangolare utilizziamo prima la monotonia e otteniamo

f \circ d (x,y) = f(d(x,y)) \leq f(d(x,z)+d(z,y))

Quindi, grazie alla concavità

f(d(x,z)+d(z,y)) \leq f(d(x,z)) + f(d(z,y))

Q.e.d.

venerdì, marzo 21, 2008

Marte

Oggi ho finito la versione tedesca di blade runner.

Pensavo che il film fosse preso pari pari dal libro, e invece le due storie sono diverse in molte parti essenziali. Per cui, ignoravo che Marte avesse un ruolo importante anche in questo libro.

Che posso dire: contanto anche questo, mi sono fatto 10 giorni di full-immersion nell'atmosfera marziana.

giovedì, marzo 20, 2008

wildnis

bel film, l'altroieri.

mi ha fatto tornare in mente un'osservazione banale - che non c'entra niente col film che è un meraviglioso inno alla libertà.

osservo: le conoscenze dell'umanità si accumulano, ma si perdono anche.

mi chiedo: cosa ci siamo persi per strada?

ps: e non venitevene col fatto che tutte le conoscenze sono scritte da qualche parte e guardatevi il film.

pps: fra un po' esco di casa e vado a consegnare la tesi.

martedì, marzo 18, 2008

Servizio Pubblico - Catene di Markov (II)

In risposta ad un commento, esplicito come si ottiene l'ultima formula in questo post.

Allora, quello che abbiamo a disposizione è una serie di numeri P(t,k) parametrizzati da t (il "tempo") e k (lo "stato"). P(t,k) rappresenta la probabilità che la nostra particella si trovi nello stato k al momento t. In altre parole P(t,k)=P(x(t)=k).

Vogliamo adesso che questa proabilità dipenda solamente dallo stato precedente del sistema, cioè da x(t-1). Ritradotto in formule

P(t,k)=P((x(t)=k)=f(x(t-1)).

Ancora non è preciso, perchè la funzione f non è quantificata*! Quello che vogliamo è che esista una certa funzione f: R --> R tale che P(t,k)=f(x(t-1)).

Nemmeno adesso è preciso, infatti nemmeno lo stato k è quantificato. In realtà vogliamo che per ogni stato k esista una funzione f (che in generale dipende da k!) tale che P(t,k)=f(x(t-1)).

Adesso abbiamo un problema; per ogni k esiste in generale una diversa funzione f. È comodo allora dare a ogni diversa f il nome f_k per specificare di quale delle funzioni stiamo parlando.

Quindi, scrivendo in maniera migliore l'ultima formula del post precedente, abbiamo

P(x(t+1)=k \mid x(t)=h )= f_{k}(h)

Nella formula, P(x(t+1=k | x(t)=h) è la probablità che x sia in k al momento t+1 supposto che si trovava in h al momento t.

*: «non è quantificata» vuol dire che non è specificato se deve esistere una funzione f con tali proprietà, o se tale proprietà deve valere per tutte le funzioni f in una certa classe.

venerdì, marzo 14, 2008

la mia religione, la mia scienza (I)

Non passa giorno che non leggo su qualche blog o giornale online opinioni poco qualificate sul rapporto fra religione e scienza. Poco qualificate vuol dire, nel mio linguaggio, espresse da persone che sono o solo credenti, o solo scienziati, o nessuno dei due, e si buttano nel dibattito per puro amore di polemica.

Dato che io credo e sono uno scienziato mi sento autorizzato a parlarne.

Quelle che seguono sono alcune delle mie personali riflessioni;per così dire: il mio kit di sopravvivenza in questo mondo dualistico.

1. Notazione

Dato che è l'unica realà che conosco bene, denoterò col termine crdente tutti e soli gli appartenenti alla religione cattolica. Tale denotazione non esprime alcun giudizio di valore, ma solo la mia maggiore conoscenza di essa rispetto ad altre religioni.

Per prima cosa, una premessa. Non sono certo il primo a riflettere su queste domande. In particolare, non sono (evidentemente) il primo scienziato-credente della storia. Due esempi che amo molto, si parva licet componere magnis, sono: Gregor Mendel, monaco agostiniano e George Lemaitre, sacerdote gesuita.

2. Premessa

Molti affermano che è impossibile conciliare l'essere scienziato razionale e credente. Tale affermazione è falsa. Non falsa in senso filosofico, cioè nel senso che la sua falsità viene dimostrata con un ragionamento basato su assunzioni generali. Ma falsa in senso scientifico: esistono infatti in natura dei credenti-scienziati con tutte le caratteristiche di ambedue le tipologie espresse al massimo livello; due esempi sono Mendel e Lemaitre.

La chiave logica per capire come si fa a conciliare due approcci alla realtà che sembrano contraddittori è sufficientemente semplice e si basa su una questione di principio. Per un credente Egli è tutto il bene, cioè tutto il vero. Fin qui abbiamo solo due parole senza una definizione di esse, e su questo non si può fare scienza. Sicuramente, però, tutta la realtà osservabile è, per se stessa, parte del vero. Precisamente la parte più toccabile con mano. Non parlo solo delle leggi e degli esperimenti fisici, ma anche della storia delle nazioni, dei rapporti fra persone, etc... Insomma: di tutto il percepibile. Quindi, la teologia in quanto "scienza della divinità" è una teoria del tutto. Ora, dato che creare una teoria del tutto è un compito arduo, è necessario lasciare tutti i parametri liberi, in questa teoria. Spiego subito cosa intendo con "tutti i parametri".

Semplificando: nella teoria Newtoniana si può dire che l'unico parametro libero sia la costante di gravitazione universale. Determinato quello con precisione, la teoria Newtoniana è chiusa. Nella teologia ogni parametro è possibile, ed inizialmente non possiede un valore. Esso va determinato in una lunga e faticosa ricerca. Dato però che i possibili parametri sono infiniti, se ne deduce che questa ricerca non può in principio avere fine. Si noti che qui i parametri sono metaparametri: ad esempio, la teoria Newtoniana stessa è un parametro della teologia.

Concludendo: data la quantità di parametri liberi, non esiste un esperimento (fisico, biologico, cognitivo, sociologico) in grado di eliminare la teologia, per il semplice motivo che il risultato di questo esperimento può semplicemente essere utilizzato come valore di un parametro del quale, fino ad allora, non si conosceva l'esistenza (non del valore, ma del parametro stesso!).

3. Lemma

La teologia, in quanto teoria filosofica del tutto, è ineliminabile. Ogni esperimento volto a eliminare la teologia dal mondo, può essere integrato nella stessa, utilizzandolo come valore di un parametro sconosciuto.

P.S.: si può vedere il tutto anche dal punto di vista dell'indecidibilità Gödeliana. La teologia è l'insieme infinito di assiomi che rendono una teoria matematica allo stesso tempo completa e consistente, ed è per questo vera ed indecidibile in tempo finito.

mercoledì, marzo 12, 2008

Servizio Pubblico - Catene di Markov (I)

Per qualche motivo a me ancora ignoto (o meglio: probabilmente per questo motivo), la maggior parte dei visitatori del blog provenienti da motori di ricerca erano alla ricerca di informazioni su "catene di markov". Per non deludere ulteriormente questi visitatori, ecco un post sulle catene di Markov.

Premetto che Andrey Markov è stato un matematico russo della fine del 1800, membro dell'accademia di San Pietroburgo, allievo di Chebyshev, e con alcuni discendenti abbastanza famosi, come Lebiscovitsch, Sacks e Zygmund. Non entro nei dettagli storici e biografici, che possono essere trovati qui.

Cos'è una catena di Markov? Il caso che considero è quello di una catena a stati finiti.
Supponiamo di avere un oggetto (una particella, una persona, un ente divino) che può trovarsi in diversi stati, che chiameremo k, con k che varia fra 1 e n. Ad esempio, Se l'oggetto in considerazione è una persona, e l'unica informazione che ci interessè la sua età, allora i diversi stati sono numeri naturali, e per andare sul sicuro poniamo n=130.

Quello che vogliamo descrivere è l'evoluzione di questo oggetto: cioè come passa da uno stato all'altro; nelle catene di Markov questi cambiamenti di stato avvengono in step temporali discreti (che chiamiamo t e che è un numero naturale) e in maniera probabilistica. Per tornare al nostro esempio precedente: se fissiamo lo step temporale ad un anno, allora la persona in osservazione passa in ogni step temporale dallo stato k allo stato k+1 con probabilità 1. Se chiamiamo x(t) lo stato del nostro oggetto al tempo t, allora

x(t)=k \quad \Rightarrow \quad x(t+1)=k+1

per ogni t e per ogni k.

Ciò non è veramente probabilitstico (e per altro non si capisce che succede quando x(t)=130 per qualche t, si veda sotto), ma permette di evidenziare un aspetto importante: la probabilità che l'oggetto si trovi in un qualche stato nello step temporale t+1 deve essere 1: gli oggetti non possono essere distrutti in questa descrizione (e anche se lo potessero, si potrebbe correggere il tutto aggiungendo lo stato: oggetto distrutto - questo serve per correggere l'esempio precedente con le età sopra i 130 anni).

Riassumendo: quello che dobbiamo specificare per determinare l'evoluzione temporale di x, è la probabilità P(x(t)=k) che l'oggetto si trovi nello stato k al tempo t.

Introduciamo adesso il concetto fondamentale per una catena di Markov; supponiamo che per k=1, ... , n e t=1,2,... sia definita una famiglia di numeri 0 < P(x(t)=k) < 1 con la proprietà

\left[\sum_{k=1}^n P(x(t)=k)\right] = 1

per ogni t.

Allora la famiglia P(x(t)=k) definisce una catena di Markov omogenea se e solo se esiste una famiglia di vettori f_k=(f_k(1), ... , f_k(n)) tale che

P(x(t+1)=k) = f_k(P(x(t)=h)

Parlando in italiano, questo vuol dire che la probabilità che x si trovi in k al tempo t+1 dipende solamente da dove x si trovava al tempo t, e non dipende ne dal tempo t, ne' dalla storia di x fino al tempo t-1.

[La prossima volta che ho un po' di tempo, cerco di spiegare il rapporto fra catene di Markov e sistemi dinamici discreti, e poi fra questi e i random walks su grafi].

lunedì, marzo 10, 2008

Weit weg


Se si pensa che cinque secoli fa l'uomo credeva Marte una scheggia di luce eterna, infissa in un cielo di cristallo ruotante in silenzio attorno alla terra, e che fra pochi decenni lo stesso uomo stamperà le proprie orme nella polvere dei deserti del pianeta, non si può non restare ammirati di fronte all'immenso cammino percorso.

Guido Ruggieri, 1971


Sto leggendo "La scoperta del pianeta Marte" di G. Ruggieri. È molto interessante come documento di storia della scienza; sono ancora alla parte iniziale dove spiega la storia delle osservazioni di Marte; è ben scritto, anche se un po' leibniziano nella sua fede nelle magnifiche sorti e progressive.

Inoltre, trovo interessante il fatto che, se il programma Aurora funziona come deve, allora prima del 2030 avremo uomini su Marte.

Che dire, una delle poche volte in cui una previsione scientifica viene azzeccata...

venerdì, marzo 07, 2008

Stendhal

Bisogna affrettarsi a vedere le cerimonie di una religione che o si modificherà o si spegnerà

Stendhal nel 1827


L'altro ieri ho finito di leggere (grazie alla mia dolce metà che si è portata per sbaglio a Stoccarda il mio Dorian Gray, privandomi della mia lettura da autobus) un piccolo opuscolo di Stendhal, scritto nel 1827 dal titolo "La basilica di San Pietro in Vaticano".

È una brevissima guida, di circa 22 pagine, su San Pietro: lo consiglio perchè Stendhal scrive di arte in maniera vivace e acuta. A parte le sue considerazioni sull'arte, mi hanno colpito molte delle sue osservazioni sulla religione (cattolica e non). Ed ho avuto la forte impressione che parlasse di cose che non esistono più nella forma e con lo spirito che lui descrive.

Quando poi ha pagina 10 scrive la frase che ho riportato sopra, ho avuto la forte coscienza della distanza che separa un credente di oggi da uno di 180 anni fa.