Pubblichiamo la seconda parte dell'articolo di G. T. HQ. Hoare e N. J. Lord, già comparso su The Mathematical Gazette (che ringraziamo, insieme all'autore, per la cortese autorizzazione).

Avevamo presentato la prima parte con il titolo L’Integrale di Lebesgue
compie cento anni


Sull'integrale di Lebesgue e la sua storia si può vedere anche il contributo di J.P. Kahane "Nascita e sviluppi dell'integrale di Lebesgue" sul n. 44 di lettera matematica pristem

 

 

La traduzione è
a cura di
Susanna De Maron

 

 

 

 

Il lavoro di Lebesgue sull'integrazione

 

Se tutto va bene, alla fine di un corso di Matematica del primo anno di Università, gli studenti raggiungono, senza particolari approfondimenti, un livello di conoscenza dell'integrazione praticamente simile a quello di un matematico della fine del 18° secolo, vale a dire:
  1.  "l'integrazione è l'operazione inversa della derivazione”, nel senso di quanto affermato dai due teoremi fondamentali del Calcolo:
    d/dt( )= f(x);
  2. se esiste una funzione primitiva F di f,
    allora =
    F(b) - F(a);
  3. "l'integrazione sistematica è più difficile e meno meccanica della derivazione”: ci sono sorprese quali quelle di per n = -1 ed è più difficile costruire una "tattica d’attacco" per calcolare gli integrali;
  4.  "l'integrazione può essere utilizzata per calcolare aree sottese da grafici, ecc." Effettivamente la notazione di Leibnitz rimanda costantemente a quest’idea e, quando anche tutto sembra fallire, un integrale definito può essere valutato numericamente approssimando l'area sottesa al grafico della funzione.
H.Léon Lebesgue

La ricerca di funzioni primitive è essenzialmente la richiesta di un algoritmo per determinare quali funzioni elementari siano delle primitive (una funzione elementare è una qualunque funzione che può essere ottenuta premendo una sequenza finita di tasti su un calcolatore scientifico). Tale algoritmo, costruito sulle vecchie indagini di Liouville degli anni 1830, fu trovato da Risch attorno al 1960;  versioni ridotte sono utilizzate negli attuali pacchetti applicativi della Computer Algebra. Come risultato, si può affermare categoricamente che una primitiva elementare non esiste per exp(-x2), ma la teoria è subdola: per esempio
e x sinx hanno entrambe tali primitive ma e x tanx no.



Liouville


Hardy

Per alcuni studenti ciò comporta un'estrema insoddisfazione. Così scriveva Hardy nella sua Gibbs Lecture del 1928: scrive a tal proposito: " ad una più attenta riflessione, non sempre una questione naturale non sempre risulta essere di facile soluzione. E' naturale cercare una formula finita per
. Però, se si fallisce, non è a causa della nostra stupidità, ma perché le cose vanno diversamente da come uno si aspetta".


Se non esiste una primitiva, qualunque definizione di integrale è motivata dall'idea di area sottesa da una curva. Tale definizione necessita comunque di qualche giustificazione.
La definizione di Riemann del 1854, per una funzione limitata su un intervallo [a,b], influenzò tutti gli studi successivi del 19° secolo. La costruzione procede così:
si operi una partizione P di [a,b] in un numero finito di intervalli disgiunti I1, ..., In di lunghezza massima ||P||; si indichino con mi = inf {f(x): xÎIi} e Mi = sup {f(x): xÎIi} e si denoti la lunghezza di Ii con |Ii|. Allora:


            supsu tutto P
= lim ||P|| ®0 ;

supsu tutto P = lim ||P|| ®0 .La funzione  f è integrabile secondo Riemann se questi due limiti sono uguali. In questo caso, i limiti sono anche uguali a lim ||P||®0 , dove xi è un qualunque elemento di Ii.
Riemann mostrò successivamente che la sua condizione per l'integrabilità può essere riformulata chiedendo che, per ogni d > 0, l'insieme Sd dei punti per cui l'oscillazione di f supera d abbia "misura esterna nulla", cioè possa essere ricoperto da un numero finito di intervalli di lunghezza totale arbitrariamente piccola.

L'audacia della definizione di Riemann fu di fornire un criterio per l'integrabilità di una qualunque funzione . La sua audacia meravigliò i contemporanei come Weierstrass, che la considerò "la definizione più generale concepibile (...) dell'area definita dai valori di f(x)".
Il moderno concetto di funzione (come un'arbitraria corrispondenza di valori, piuttosto che basato su una formula) e il conseguente cambiamento di atteggiamento, da intuizioni meramente geometriche degli argomenti alla esplorazione dell'importanza soprattutto logica delle definizioni, emersero lentamente seguendo scoperte controverse (che videro protagonisti, rispettivamente, Daniel Bernoulli e Fourier ) quando le soluzioni delle equazioni di onda e calore, con condizioni iniziali arbitrarie,  poterono essere espresse tramite serie di Fourier. In effetti, su [-
p,p], dopo aver scritto:

f(x) = 1/2 a0 +

Fourier fu in grado di calcolare il coefficiente bm (per esempio):

= +
+ (
= 0 +
(an cos nx sin mx + bn sin nx sin mx) dx

            = pbm ,

poichè tutti questi integrali,  tranne uno, sono nulli.


D. Bernoulli

Fourier

Divenne gradualmente evidente, comunque, che la questione  della convergenza della serie di Fourier, l'esistenza di integrali significativi e la validità dello scambio tra serie e l'integrazione richiedevano sempre spiegazioni attente.
Riemann introdusse il suo integrale, quasi "a lato" del lavoro sulle serie trigonometriche. E' stato detto - a ragione che fu condotto alla condizione di integrabilità in termini di oscillazione dal desiderio di avere la convergenza an, bn
®0 nella precedente serie di Fourier: infatti, la condizione di integrabilità garantisce che, a parte un insieme arbitrariamente piccolo di punti dove f oscilla significativamente, le sempre più rapide oscillazioni di sin mx per m ®µ travolgono le variazioni di f .


Poichè i punti di continuità sono proprio quelli di oscillazione zero, qualunque funzione continua è integrabile secondo Riemann, come anche qualunque funzione monotona. Ma, sebbene lo stesso Riemann abbia dato un elegante esempio di una funzione integrabile che è discontinua su un insieme denso di razionali, sembrò che qualunque funzione discontinua come la funzione di Dirichlet (che assume valore 1 o 0, a seconda che x sia razionale o irrazionale) sarebbe stata sempre fuori gioco. L'attenzione si focalizzò allora sull'insieme dei punti discontinui, Èd>0Sd e si pensò che la vera questione fosse "come avrebbero dovuto essere gli insiemi Sd in modo inequivocabile perchè una funzione fosse automaticamente integrabile?".
Finchè non si chiarirono, nei primi anni del 20° secolo, le differenze tra le nozioni contrastanti di piccolezza in termini di topologia, di teoria della misura e di cardinalità, ci fu considerevole confusione sull’argomento in questione. Tale confusione è forse comprensibile pensando anche ad alcune suggestive analogie che esistono. Per lungo tempo si fecero così studi sul concetto di "topologicamente piccolo" (in alcun luogo,denso) pensando che fosse la chiave di volta. Certamente, per la condizione di integrabilità di Riemann, ciascun S
d deve essere in alcun luogo denso, ma la proposizione inversa risultò falsa dopo la scoperta di H.J.S. Smith (nel 1875) di quelli che più tardi divennero noti come insiemi di Cantor.



Dirichlet

H.J.S. Smith

Un insieme di Cantor è costruito da [0,1] rimuovendo dapprima l'intervallo centrale aperto, di ampiezza 1/3; procedendo successivamente, se rimuovono gl'intervalli aperti centrali di ampiezza 1/9 nei rimanenti due sottointervalli, e così via. L'insieme che alla fine rimane consiste di quei numeri che hanno 0, 2 nel loro sviluppo ternario. E' un insieme non numerabile chiuso, in alcun luogo denso, ma con misura esterna non nulla. La sua funzione caratteristica non è allora integrabile secondo Riemann. Nella « sua » condizione di integrabilità, Sd (con 0<d<1) non può essere ricoperto da intervalli di lunghezza totale minore di 1/2 ,nonostante tale insieme sia in alcun luogo denso.

Sia
pure gradualmente, la prospettiva teorica corretta della misura cominciò così ad emergere. Nel corso delle sue indagini sul prolungamento analitica e gli insiemi di convergenza di serie quali
å
2-n (x - an) -1 (con {an} denso in [a,b]), Borel cominciò ad apprezzare l'utilità di assegnare "misura zero" all'insieme di divergenza quando questi può essere ricoperto da una famiglia numerabile di intervalli di lunghezza totale arbitrariamente piccola, anche se, paradossalmente, contiene {an} ed è quindi denso (e quindi ‘largo’ secondo il significato topologico). Cominciando ad assegnare ad un intervallo la sua lunghezza, sempre Borel mostrò anche come assegnare la misura agli insiemi di Borel - quelli che possono essere formati dai sottointervalli aperti di [a,b] mediante il complementare e l'unione numerabile. (Poichè ogni insieme aperto può essere visto come unione numerabile di suoi intervalli, l'additività numerabile era una richiesta quasi obbligata).
 

Il punto di partenza di Lebesgue fu di assegnare una misura esterna ad ogni sottoinsieme E di [a,b] come m0(E) =
inf { |In|: E ÍÈIn, In intervalli}, una misura interna grazie al complementare , mi(E) = b – a – m0(E’) dove appunto E’ è il complementare di E rispetto ad [a,b], e dichiarare E misurabile (secondo Lebesgue) con misura m(E) se m0(E) = mi(E) = m(E).
La collezione M di tutti questi insiemi misurabili è chiusa rispetto al complementare e all’unione misurabile e la misura m(E) assegnata a questi insiemi è numerabilmente additiva. Inoltre M contiene tutti gli insiemi misurabili secondo  Jordan - questo precursore della misura di Borel,finitamente additivi; assegna la stessa misura all’insieme e alla sua chiusura - e, meno ovviamente, è una classe più ampia di insiemi rispetto alla classe degli insiemi di Borel. Per provarlo, Lebesgue mostrò che, dato un qualunque insieme misurabile E, ci sono due insiemi di Borel B1 e B2 aventi la stessa misura di E con B1
Í E Í B2, così che B2 – E e E-B1 hanno entrambi misura nulla. Ad un  primo approccio, quindi, la differenza tra insiemi di Borel e insiemi misurabili secondo Lebesgue non sembra essere rilevante (a proposito della misura). Ma in realtà si giunge così al punto cruciale. Poiché tutti i sottoinsiemi di insiemi di misura nulla hanno la stessa misura - la misura di Lebesgue è detta essere completa - e poiché l’insieme di Cantor ha cardinalità c, segue che M ha cardinalità 2c (la stessa di quella della classe di tutti i sottoinsiemi di [a,b]) mentre, la cardinalità della classe degli insiemi di Borel è solamente c.
Sorge allora l’interessante questione se tutti i sottoinsiemi di numeri reali siano misurabili. Utilizzando l’assioma della scelta, Vitali nel 1905 costruì un insieme non-misurabile. Ironicamentepensando alle opinioni fondazionali di Lebesgue (a proposito dell’assioma della scelta) -  Solovay nel 1970 dimostrò che l’uso di questo assioma non può essere in questo caso evitato.

Armati del concetto di misura (che generalizza quello di lunghezza), possono ora seguire  tre modi per definire l’integrale di una funzione limitata :
  1. Ripetere la precedente costruzione per definire ora sottoinsiemi misurabili del piano e definire poi òab f = m(E+) – m(E-), dove
    E+ è l’insieme {(x, f(x)): f(x) >=0} ecc.
  2. Adottare la definizione dell’integrale di Riemann : òab f =
    = inf
    å m(Ei) sup Ei f = sup å m(Ei) inf Ei f (dove gli estremi superiore e inferiore sono presi su tutte le partizioni finite misurabili di [a,b]).
  3. Considerare la partizione (P) dell’immagine f[a,b] con a0<a1<…<an e definire òab f = lim ||P|| ® 0 å ai m (f -1[ai,ai+1]). 
Si può dimostrare che, quando queste definizioni sono utilizzabili, allora individuano la stessa classe di funzioni: erano queste le definizioni attese all’inizio del secolo scorso!
La genialità di Lebesgue fu di scegliere la terza e - fatto non inevitabile - accorgersi velocemente che conduceva a molte applicazioni e a dimostrazioni eleganti, semplici e potenti di teoremi che spazzavano via molte delle difficoltà accumulatesi con l’integrale di Riemann. Non è un caso che W.H.Young (che invece utilizzò la seconda definizione) non riuscì nella dimostrazione di nessuno dei teoremi di Lebesgue.
Implicita nella strategia seguita da Lebesgue  è l’assunzione che f sia misurabile, cioè che f-1(I) sia un insieme misurabile per tutti gli intervalli I. L’individuazione di questa proprietà (che ovviamente generalizza quella di funzione continua) costituì la chiave del successo di Lebesgue. Lebesgue dimostrò immediatamente che, se fn(x)
® f(x), con fn misurabile, allora anche f è misurabile. Dimostrò anche facilmente che ogni funzione integrabile secondo Riemann è integrabile secondo Lebesgue ed è caratterizzata come continua quasi ovunque ; la chiarezza di questa caratterizzazione, rispetto alla precedente confusione impressionò specialmente Vitali e Young. Ancora, gli insiemi di misura nulla sono precisamente quelli che sono trascurabili per l’integrazione: se due funzioni integrabili secondo Lebesgue coincidono eccetto che su un tale insieme, allora esse hanno lo stesso integrale. Così la funzione di Dirichlet fu ammessa nel gruppo, essendo zero quasi ovunque. E Lebesgue estese facilmente le sue definizioni all’integrale di una funzione non limitata su un sottoinsieme misurabile di R; le somme definite nella terza definizione sono allora infinite e devono essere assolutamente convergenti. Una conseguenza inevitabile è che, se f è Lebesgue-integrabile, allora lo è anche |f| con |ò f| ≤ò |f|.

L’integrale di Lebesgue ha tutte le “ovvie” proprietà che un integrale dovrebbe avere e, come Lebesgue dimostrò, garantite queste proprietà, la sua definizione è sostanzialmente inevitabile. E’ anche decisamemente superiore all’integrale di Riemann per la forza e la portata  dei suoi teoremi di convergenza. Al Teorema della convergenza limitata della sua tesi:

Siano fn: [a,b] ® Â funzioni integrabili, uniformemente limitate (ovvero sia  |fn(x)| ≤ B per tutti gli x  e tutti gli n) e sia fn(x) ® f(x). Allora f è integrabile e

òab f = lim òab fn ,

Lebesgue più tardi aggiunse il Teorema della convergenza dominata :

Siano fn integrabili e limitate da g funzione integrabile (|fn(x)| ≤ g(x) per tutti gli x e per tutti gli n) e sia fn(x) ®f(x) . Allora f è integrabile e òf = lim ò fn

e B. Levi, nel 1906, aggiunse il Teorema della convergenza monotona:

Siano fn integrabili con {fn(x)} crescente per ogni x e ò fn ≤ B per tutti gli n. Allora f = lim fn è integrabile e ò f = lim ò fn

con tutte le ovvie modifiche per le serie di funzioni.

Se si confrontano le condizioni estranee e contorte, necessarie per giustificare lo scambio con il passaggio al limite in situazioni che coinvolgono l’integrale di Riemann, si ha un’idea di come queste teoremi rappresentarono vere e proprie ventate di novità e, in molti casi, favorirono il formarsi di ipotesi naturali, di dimostrazioni altrettanto naturali e di facili applicazioni.
Illustriamo questa situazione presentando la dimostrazione di Lebesgue del precedente primo teorema di convergenza.
Sia e>0 e definiamo En = Èk³n {|fk – f|>e} cosicchè En+1 Í En. Poichè fn(x) ® f(x), abbiamo ÇEn = Æ e quindi m(En) < e per tutti gli n ³ N. Per tale n, poichè |fn-f|£ 2B su En, un insieme di misura minore di e, e |fn-f| < e fuori da En, un insieme di misura non superiore a b-a, abbiamo :

| òab fn - òab f | £òEn|fn-f| + òEn’ | fn-f| £e.2B + e(b-a),

e quindi la tesi.

Nella sua Tesi, Lebesgue ottenne risultati prestigiosi sulla reciprocità tra differenziazione e integrazione. Essi furono poi migliorati con  analisi che richiedono un grande tecnicismo virtuoso, sebbene alcune dimostrazioni particolarmente delicate furono completate e integrate da lavori di altri matematici quali Vitali e B. Levi.
Che la teoria sia acuta, lo dimostra la funzione f definita da Lebesgue sull’insieme di Cantor e resa  costante sui sottointervalli rimossi tra i punti dell’insieme di Cantor. Essa ha la singolare proprietà che è f’=0 quasi ovunque e quindi 0 =
ò01 f’ ¹ 1 = f(1) – f(0). Per Lebesgue abbiamo allora i Fondamentali Teoremi del Calcolo differenziale nella forma:

Se f: [a,b]®Â è integrabile e F(x) = òax f, allora non solo F è continua (anzi, assolutamente continua) ma F’(x) esiste quasi ovunque ed è uguale a f(x). (Una funzione assolutamente continua è una funzionenecessariamente a variazione limitata – per cui il singolo intervallo |x – x0| < d nella e-d definizione di continuità è sostituito da una qualunque collezione finita di intervalli di lunghezza totale minore di d).

Se F è assolutamente continua, allora F’ esiste quasi ovunque,
è integrabile e
òab F’ = F(b) – F(a).

In particolare, il primo teorema è proprio quanto si desiderava. Una sua simpatica applicazione è quella di scegliere per f la funzione caratteristica di un insieme misurabile E e dedurre che :

(F(x+d) – F(x-d))/2d = m[EÇ(x-d,x+d)]/2d®1quasi ovunque su E.


Questo
è il teorema di densità di Lebesgue, che può essere parafrasato dicendo che gli insiemi misurabili non possono essere troppo cattivi giacchè possono distribuirsi sopra tutti gli intervalli!
Il secondo teorema fondamentale del calcolo, se è sostanzialmente più pulito di ogni altro risultato ottenuto con l’integrale di Riemann, lascia aperta la seccante e spinosa questione se è possibile ricostruire qualunque funzione, ovunque differenziabile, dalle sue derivate. L’integrale di Lebesgue non può garantire questo risultato - esempio, d/dt (x2sin(1/x2))non è integrabile su (0,1] -  ma lo possono garantire alcune sue generalizzazioni, quali gli integrali di Denjoy e Perron, che pure hanno un costo  tecnico notevole.


Denjoy

Perron

Da queste analisi seguirono due memorabili risultati:

  1. Ogni funzione monotona ha derivata quasi ovunque
  2. Una curva continua rettificabile, parametrizzata da (x(s),y(s)), ha una tangente quasi ovunque e la lunghezza dell’arco è data ds.
Lebesgue effettivamente stabilì il primo risultato sotto l’ulteriore ipotesi che la funzione fosse continua, ma l’asserzione più generale è comunque vera. Fu, infatti, condotto al primo dal secondo. Ripristina così le intuizioni geometriche di precedenti generazioni di matematici. Dimostrazioni del fatto che una funzione continua ha una derivata “in generale” apparvero nei testi di introduzione al Calcolo verso il 1870,nonostante che a quella data Wierstrass avesse già costruito le funzioni continue e mai derivabili  e insinuato, sbagliando, che tale mostro esistesse persino monotono! Ancora, nell’ultimo quarto del diciannovesimo secolo, un acceso dibattito si sviluppò attorno alle restrizioni necessarie per convalidare la formula della lunghezza dell’arco ò dx ,dedotto dalla definizione di una curva rettificabile come limite superiore delle lunghezze di tutti i poligoni inscritti. Jordan aveva mostrato che quest’ultima questione è equivalente a supporre f a variazione limitata cioè della forma f = g – h, dove g e h sono monotone crescenti. I teoremi di Lebesgue riconciliano opinioni opposte. Queste modo di procede piaceva a Lebesgue: “una generalizzazione fatta non per il vano piacere di generalizzare, ma per risolvere problemi esistenti, è sempre una generalizzazione che dà frutti”.

La definizione dell’integrale doppio, nel contesto dell’integrazione di Lebesgue prende a questo punto una forma ovvia ma il problema di valutare se sia equivalente a un integrale ripetuto, quale ò(òf(x,y)dx)dy, è più fastidioso poiché le funzioni “sezioni ”, quali x ®f(x,y) non sono necessariamente misurabili per ogni y (come richiedono gli integrali ripetuti). Ispirato dal teorema prototipo di Lebesgue (equivalente a quello di Fubini per le funzioni limitate), Fubini fu in grado di assicurare l’integrabilità delle funzioni-sezione per quasi tutti gli y e stabilì l’uguaglianza tra l’integrale doppio e quello ripetuto : un vero trionfo per l’integrale di Lebesgue in un campo, dove, a parte che per le funzioni continue e definite su regioni “fatte bene”, l’integrazione secondo Riemann presentava parecchi problemi.


Fubini

Fatou

La successiva spettacolare applicazione della nuova teoria dell’integrazione fu alle serie trigonometriche. 
Lebesgue voleva convalidare l’intuizione di Fourier nel senso che, se la serie
½ a0 +
 (an cos nx + bn sin nx) converge ad una  funzione limitata f(x), allora an e bn sono effettivamente dati dalle formule quali  pbm = òab f(x) sin mx dx. Inversamente, per una funzione integrabile, si possono formare le somme parziali   Snf della serie di Fourier e Lebesgue fornì una dimostrazione della loro convergenza, che include le precedenti condizioni di Dini e di Jordan. Metodi più raffinati di sommazione diedero risultati puntualmente migliori: per f integrabile, i metodi di Cesàro per Snf comportano la convergenza quasi ovunque; per f ÎL2 si ha la convergenza quasi ovunque con i metodi di Abel. Quest’ultimo risultato – dovuto a Fatou – ebbe come corollario l’uguaglianza di Parseval, ½ a0 +  (an2 + bn2)= f2. Che l’integrale domini la somma deriva dalla disequaglianza 0 <= (f-Snf)2. F. Riesz e Fischer dimostrarono inversamente che, per ogni serie convergente
½ a0 +
 (an2 + bn2) , esiste una funzione di L2 che verifica l’uguaglianza di Parseval. Questo risultato è falso per ogni concezione dell’integrale più debole di quella di Lebesgue. Non è particolarmente fantasioso considerare quello di Parseval come un tipo di Teorema di Pitagora in infinite dimensioni (per lo spazio L2 ). Collegando questo risultato alla tesi del 1906 di Fréchet sugli spazi metrici astratti, Riesz trovò che d(f,g) = [ò |f-g|2]1/2 fornisce una metrica per cui L2 è completo. Così questo spazio divenne l’ambiente ideale per il lavoro di Hilbert sulle equazioni integrali.



F. Riesz

Fischer

F. Riesz fu uno tra i più importanti matematici del ventesimo secolo. Nessuno fece più di lui per assicurare all’integrazione di Lebesgue un posto nel nuovissimo ed emergente campo dell’Analisi funzionale. In molti modi, il suo lavoro epocale del 1910 sugli
spazi Lp e i loro duali segna il passaggio della teoria dell’integrazione di Lebesgue dalla fase inizialmente oscurata dal sospetto di Hermite di riferirsi insanamente alle funzioni patologicamente discontinue a quella in cui è valutata come