Distribuce (matematika)

Tento článek je o zobecněných funkcích. Další významy jsou uvedeny na stránce distribuce.

Zobecněné funkce, neboli distribuce, představují velmi užitečný nástroj nejen v matematice, ale především v pokročilých partiích moderní fyziky. Jedná se o spojité lineární funkcionály definované na speciálních množinách funkcí. Na těchto funkcionálech jsou dále zavedeny dodatečné operace jako derivace, konvoluce či Fourierova transformace.

Teorii zobecněných funkcí vytvořil a rozvinul francouzský matematik Laurent Schwartz. Již předtím se ale objevily intuitivní koncepty objektů s vlastnostmi zobecněných funkcí. Typickým příkladem je Diracova -funkce.

Motivace zavedení pojmu[editovat | editovat zdroj]

V první polovině dvacátého století zavedl anglický teoretický fyzik Paul Dirac formálně funkci s následujícími vlastnostmi

Aby mohl být integrál nenulový, tak se formálně "definuje" . Pojem -funkce Dirac zavedl více méně intuitivně. Výborně se hodil pro popis fyzikálních jevů, se kterými pracoval. Ve skutečnosti ale žádná taková funkce , která by splňovala výše uvedené vlastnosti, neexistuje. Až později toto intuitivní chápání upřesnil L. Schwartz, jenž rozvinul teorii zobecněných funkcí. V rámci jeho teorie lze postavit pojem -funkce na pevný matematický základ. Je ale nutné zavést jakousi "mezivrstvu" mezi definičním oborem funkce a jejími hodnotami. Zatímco intuitivně chápaná -funkce je definovaná na množině reálných čísel a její hodnoty jsou (více méně) opět reálná čísla, matematicky korektně definovaná -funkce zobrazuje z množiny jistých "pěkně se chovajících funkcí" do reálných čísel. Zmíněné "pěkné" funkce samotné jsou pak definovány na "původní" množině . Nemůžeme už tak dále mluvit o hodnotě -funkce v nějakém reálném bodě, nanejvýš o její hodnotě na nějaké konkrétní "pěkné" funkci.

Definice zobecněné funkce a související pojmy[editovat | editovat zdroj]

Než budeme moci přikročit k definici zobecněné funkce, musíme zavést několik průvodních pojmů. Zobecněná funkce bude jistý funkcionál definovaný na jisté množině funkcí. Specifikujme nyní, jakou množinu funkcí máme přesně na mysli.

Testovací funkce[editovat | editovat zdroj]

Mějme přirozené číslo . Označme množinu všech hladkých funkcí s kompaktním nosičem definovaných na jako a nazývejme ji prostor testovacích funkcí (každou funkci z tohoto prostoru tedy nazýváme testovací funkce). Uvažujme na tomto prostoru takovou topologii, v níž posloupnost testovacích funkcí konverguje k testovací funkci na prostoru , právě když mají funkce stejnoměrně omezené nosiče a pro každý multiindex je pro splněno

kde symbol značí stejnoměrnou konvergenci a symbol označuje parciální derivaci funkce podle proměnných, jejichž index leží v multiindexu . Neboli

kde a , .

V dalším je užitečné neuvažovat zobecněné funkce definované na celém prostoru, ale jen na jeho podmnožině. K tomu si zaveďme následující pojem.

Nechť je otevřená podmnožina . Definujme prostor jako množinu těch testovacích funkcí z , jejichž nosič leží v . Obdobně jako u si na zaveďme konvergenci posloupnosti testovacích funkcí. O posloupnosti testovacích funkcí z řekneme, že konverguje k v prostoru , právě když platí současně:

Symbolem označujeme nosič funkce .

Zobecněné funkce[editovat | editovat zdroj]

Definujeme, že lineární zobrazení , popř. , je spojité, právě když toto zobrazení zobrazuje každou posloupnost, která konverguje v , opět na konvergentní posloupnost. Lineární funkcionál na prostoru testovacích funkcí , který je spojitý ve smyslu předchozí věty, nazveme zobecněnou funkcí neboli distribucí. Množinu všech těchto zobecněných funkcí označíme , pro budeme pro odpovídající množinu zobecněných funkcí používat označení . Hodnotu funkcionálu na testovací funkci budeme (namísto obvyklého ) značit . Toto značení nepřipomíná značení skalárního součinu náhodně, pro analogii viz regulární zobecněné funkce níže.

Linearita zobecněné funkce znamená, že

Navíc na množině lze klasickým způsobem zavést operace sčítání dvou zobecněných funkcí a jejich násobení komplexním číslem. A sice

Je snadné ukázat, že množina zobecněných funkcí s výše zavedenými operacemi sčítání a násobení číslem tvoří vektorový prostor. Budeme-li navíc uvažovat výraz , kde a , jako hodnotu zobrazení dvou proměnných s argumenty a , tak je toto zobrazení bilineární.

Definujme nyní konvergenci posloupnosti zobecněných funkcí. Řekneme, že posloupnost zobecněných funkcí konverguje k v prostoru , právě když pro každou testovací funkci existuje limita číselné posloupnosti funkčních hodnot funkcí na a tato posloupnost konverguje k . V symbolech

Konvergence na prostoru je tedy zavedena ve slabém smyslu.

Reálné a komplexní zobecněné funkce[editovat | editovat zdroj]

O zobecněné funkci řekneme, že je reálná, právě když zobrazuje každou reálnou testovací funkci na reálné číslo. Lze definovat i komplexně sdruženou zobecněnou funkci k zobecněné funkci vztahem

V tuto chvíli lze zavést i reálnou a imaginární část zobecněné funkce vztahy

Zobecněná funkce je zjevně reálná, právě když je rovna své reálné části.

Nosič zobecněné funkce[editovat | editovat zdroj]

Ačkoli, jak již bylo zmíněno, nemůžeme hovořit o hodnotě zobecněné funkce v bodě, lze zavést pojem nosiče zobecněné funkce. Než tak učiníme, řekněme si, co chápeme pod tím, že je někde zobecněná funkce nulová. Mějme otevřenou množinu a zobecněnou funkci . Pak řekneme, že je rovna nule na množině , právě když

Navíc, řekneme, že je rovna nule lokálně na množině , právě když

Je jasné, že pokud je rovna nule na , tak je rovna nule i na každé její podmnožině . Lze ukázat i opačné tvrzení, tj. je-li zobecněná funkce lokálně rovna nule na otevřené množině, tak je na této množině rovna nule ve smyslu definic výše. Nyní už můžeme přikročit k definici nosiče zobecněné funkce.

Uvažujme všechny coby otevřené podmnožiny , na kterých je zobecněná funkce rovna nule. Označme si sjednocení všech takových množin jako . Tato množina je zřejmě největší otevřená množina, na níž je rovna nule. Její doplněk, tj. množinu pak nazýváme nosič zobecněné funkce a značíme .

Pokud má zobecněná funkce omezený nosič, tak řekneme, že je finitní.

Regulární zobecněné funkce[editovat | editovat zdroj]

Mějme otevřenou množinu v vybavenou Lebesgueovou mírou. O měřitelné funkci definované na řekneme, že je lokálně integrovatelná, právě když je splněno

Podobně jako u p-integrabilních funkcí i zde uvažujme množinu všech lokálně integrovatelných funkcí na , kterou vyfaktorizujeme podle množiny lokálně integrovatelných funkcí nenulových na množině míry nula. Jinými slovy, uvažujme množinu integrabilních funkcí faktorizovanou podle množiny těch lokálně integrovatelných funkcí , pro něž . Vzniklý faktorprostor označíme , popř. jen , a nazveme prostor lokálně integrovatelných funkcí. Správně tedy prvky tohoto prostoru nejsou funkce samotné, ale jejich třídy ekvivalence. Jak je ale obvyklé, budeme dále považovat za prvky prostoru lokálně integrovatelných funkcí funkce samotné, ne jejich třídy ekvivalence.

Je též dobré si uvědomit, že funkce je lokálně integrovatelná na , právě když pro každou kompaktní podmnožinu je zúžení z prostoru .

Buď nyní a definujme funkcionál na jako

Integrál výše je konečný, protože ve skutečnosti neintegruji přes celou množinu , ale pro každou konkrétní testovací funkci integruji vždy jen přes její nosič , což je kompaktní množina (viz poznámku před vzorcem výše). Díky linearitě integrálu je funkcionál též lineární. Navíc je i spojitý (ve smyslu konvergence zavedené výše). Mějme posloupnost konvergující v k funkci . Všechny nosiče jsou tedy podmnožinou nějaké kompaktní množiny a pro limitu hodnot integrálu platí

Nyní využijeme toho, že posloupnost konverguje na stejnoměrně (viz definici konvergence na prostoru testovacích funkcí), abychom mohli zaměnit limitu s integrálem. Dostáváme tedy

O funkcionálu jsme tedy právě ukázali, že je dobře definovaný (integrál je pro každou testovací funkci konečný), lineární a spojitý. Jedná se tedy o zobecněnou funkci.

Dále definujeme, že obecná zobecněná funkce je regulární zobecněná funkce, právě když existuje lokálně integrovatelná funkce taková, že

Operace nad zobecněnými funkcemi[editovat | editovat zdroj]

Na prostoru zobecněných funkcí lze definovat zobrazení, jež lze chápat jako zobecnění operací nad klasickými funkcemi. Jedná se např. o násobení hladkou funkcí, derivování či Fourierovu transformaci. Vzhledem k tomu, že zobecněné funkce tvoří vektorový prostor, je výhodné, aby zobrazení definovaná na této množině byla lineární.

Operace nad přitom zavádíme tak, že udáme, jak se zobecněná funkce vzniklá působením takové operace chová na testovacích funkcích. Tento postup lze chápat i tak, že když chceme definovat operaci , tak se v podstatě snažíme najít k ní duální operaci působící na prostoru testovacích funkcí . Přesněji, pro dané udáme tak, aby

Od zobrazení přitom požadujeme, aby přirozeným způsobem zobecňovalo operace definované na obyčejných funkcích (viz oddíly Motivace zavedení u každé operace níže). Vyjdeme z regulárních zobecněných funkcí, jimž lze přiřadit "obyčejnou" funkci, zjistíme jak se na nich diskutovaná operace chová a podle toho definujeme danou operaci pro všechny zobecněné funkce.

Mějme nyní zobecněnou funkci. Platí, že spojitost zobrazení již vynucuje spojitost funkcionálu . Mějme posloupnost jdoucí k nule v prostoru . Dále nechť je spojité zobrazení na prostoru testovacích funkcí. To znamená, že posloupnost též konverguje k nule v . Ze spojitosti plyne

Ukažme ještě, že operátor zavedený pomocí pomocného zobrazení způsobem výše je nutně spojitý. Buď posloupnost zobecněných funkcí konvergující k nule v prostoru . Pak

Afinní transformace souřadnic[editovat | editovat zdroj]

Afinní transformace na vektorovém prostoru je obecně transformace tvaru , kde je lineární zobrazení a je vektor posunutí. Zaveďme nyní afinní transformaci pro zobecněné funkce.

Motivace zavedení[editovat | editovat zdroj]

Aby byl pochopitelný způsob, jakým je afinní transformace pro zobecněné funkce zavedena, uveďme si příklad, na kterém demonstrujeme vlastnosti, které od transformace budeme požadovat. Mějme regulární matici , kde , vektor (resp. uspořádanou -tici) , lokálně integrabilní funkci a funkci definovanou předpisem

Uvažujme dále libovolnou testovací funkci . Klasickými úpravami a větou o substituci v integrálu dostáváme

Díky tomuto vztahu je zřejmá podoba následující definice.

Definice[editovat | editovat zdroj]

Mějme zobecněnou funkci . Afinní transformaci pro tuto funkci s maticí a vektorem posunutí definujeme vztahem

Zde je třeba chápat výraz jako nedělitelný. Jak bylo uvedeno výše a jak vyplývá z definice zobecněné funkce, nelze hovořit o hodnotě funkce v nějakém bodě z . Symbol představuje novou zobecněnou funkci. Výraz v závorce "pouze" označuje, jaké souřadnice na jsme si zvolili a se kterými zrovna pracujeme.

Korektnost definice[editovat | editovat zdroj]

Ověřme, že výše uvedená definice je konzistentní s dosavadními definicemi. Zobrazení je zřejmě funkcionál na testovacích funkcích, který je navíc lineární. Ověřme tedy jeho spojitost (ve smyslu konvergence). Mějme tedy libovolnou posloupnost testovacích funkcí , která konverguje k jisté testovací funkci . Zde je dobré si uvědomit, že testovací funkce tvoří lineární prostor a proto stačí uvažovat případ . Kdybychom totiž měli posloupnost konvergující k , tak dostaneme

Položíme-li , platí

Máme tedy bez újmy na obecnosti posloupnost konvergující v prostoru k nule. Ověřme nejdříve spojitost zobrazení , které každé testovací funkci přiřadí jinou testovací funkci předpisem

Funkce je skutečně testovací funkce. Je totiž hladká (jedná se o složení dvou hladkých zobrazení) a má kompaktní nosič (samotná transformace je difeomorfizmus a tedy převádí kompaktní množinu opět na kompaktní množinu). Zobrazení je tedy dobře definované.

Jak je to s jeho spojitostí? Uvědomíme-li si, jakým způsobem se derivují složené funkce, je zjevné, že pro každý multiindex je parciální derivace nějakou lineární kombinací funkcí , kde multiindexy splňují . Jestliže nyní máme posloupnost konvergující v prostoru k nule, má posloupnost stejnoměrné omezené nosiče a konverguje zjevně včetně všech svých derivací stejnoměrně k nulové funkci. Tím jsme dokázali, že zobrazení je spojité.

Definujme si nyní pomocnou posloupnost testovacích funkci , kde . Tato posloupnosti konverguje v prostoru k nule a navíc podle definice afinní transformace platí

Pravá strana rovnice jde pro k nule, což plyne ze spojitosti zobecněné funkce . Takto jsme ověřili zatím jen spojitost funkcionálu . Tj. ukázali jsme, že obraz zobecněné funkce při afinní transformaci je opět zobecněná funkce. Ukažme ještě, že samotná afinní transformace jako zobrazení na zobecněných funkcích je spojitá. Uvažujme tedy zobrazení takové, že . Toto zobrazení je lineární. Chceme o něm ukázat, že je spojité. Za tímto účelem si tedy vezměme posloupnost zobecněných funkcí konvergující v prostoru k nulové zobecněné funkci. Pak

Tím pádem je tedy splněn i vztah dokazující spojitost , protože

Násobení hladkou funkcí[editovat | editovat zdroj]

Definujme si nyní násobení zobecněné funkce "obyčejnou" hladkou funkcí. (Definovat násobení zobecněné funkce zobecněnou funkcí naráží na problémy a obecně takové násobení definovat nelze.)

Motivace zavedení[editovat | editovat zdroj]

Mějme otevřenou množinu , hladkou funkci a testovací funkci . Mějme dále funkci . Je zřejmé, že i . Potom

Definice[editovat | editovat zdroj]

Nechť . Mějme dále a . Pak

Korektnost definice[editovat | editovat zdroj]

Pravá strana rovnice výše je dobře definovaná, neboť . Násobek zobecněné funkce je tak dobře definovaný funkcionál na prostoru testovacích funkcí. Je zřejmě i lineární. Ověřme, že je spojitý, tj. že násobek zobecněné funkce hladkou funkcí je opět zobecněná funkce. Mějme nejprve posloupnost testovacích funkcí takovou, že v prostoru . Pak v tomto prostoru k nulové funkci konverguje zřejmě i posloupnost . Vynásobením funkcí jsme totiž nosiče jednotlivých funkcí nezvětšili, a jsou tedy stále stejnoměrně omezené. Navíc jdou všechny derivace stejnoměrně k nule, protože z Leibnizova pravidla plyne, že lze funkci vyjádřit pomocí derivací a pro jisté multiindexy . Ty první jsou hladké funkce, ty druhé pak z předpokladu konvergence posloupnosti v prostoru konvergují stejnoměrně k nule. Máme tedy

což dokazuje spojitost funkcionálu (ve druhé rovnosti jsme využili spojitosti funkcionálu ).

Ověřili jsme tak, že násobek zobecněné funkce hladkou funkcí je opět zobecněná funkce. Ukažme nyní, že samotné násobení, coby zobrazení na prostoru zobecněných funkcí, je spojité (to, že je lineární, je zřejmé). Označme si toto zobrazení jako . Buď posloupnost zobecněných funkcí jdoucí k nule, tj. . Pak ale , což dokazuje spojitost.

Derivování zobecněných funkcí[editovat | editovat zdroj]

Na prostoru zobecněných funkcí lze i korektně zavést operaci derivování. Od této zobecněné derivace požadujeme, aby se pro "pěkné" funkce redukovala na běžnou derivaci. Přesněji, chceme, aby zobecněná derivace dávala na funkcích ze třídy téže výsledky jako derivace obyčejná. (Platí inkluze .)

Motivace zavedení[editovat | editovat zdroj]

Nechť je otevřená podmnožina v , a . Ukotvěme si navíc jistý index . Platí tedy, že a navíc . Upravíme-li integrál v definici regulární zobecněné funkce metodou per partes, obdržíme

Tento vztah vezmeme za definici zobecněné derivace.

Definice[editovat | editovat zdroj]

Nechť je otevřená, a . Pak

Přitom v případě jde o běžnou derivaci testovací funkce a výraz je definován právě vzorcem výše ( je nyní již libovolná zobecněná funkce, ne obecně regulární). Derivaci zavedené tímto způsobem říkáme zobecněná derivace či derivace v zobecněném smyslu.

Korektnost definice[editovat | editovat zdroj]

Za prvé, definice výše má dobrý smysl. To lze snadno nahlédnout z toho, že zobrazení pro každý multiindex je spojité a lineární (platí ). Takže zobrazení je spojité a zobrazení je spojitý funkcionál definovaný na . Derivace je spojitá i v zobecněném smyslu. Mějme a posloupnost jdoucí k nule v . Platí

Pro zderivované zobecněné funkce také platí

Abychom ukázali vztah výše, nechť je testovací funkce, jejíž nosič leží v doplňku nosiče zobecněné funkce . Neboli , kde . Pak a

To znamená, že na . Neboli a tedy .

Leibnizovo pravidlo[editovat | editovat zdroj]

Ačkoli nelze obecně zavést násobení dvou zobecněných funkcí, můžeme uvažovat násobek zobecněné funkce hladkou funkcí a její derivaci. Pro takovouto derivaci platí, stejně jako pro klasické funkce, Leibnizovo pravidlo, tj.

Výraz výše lze dokázat matematickou indukcí, ukažme nyní její první část pro . Buď , pak

Neboli

Tenzorový součin zobecněných funkcí[editovat | editovat zdroj]

Stejně jako u klasických funkcí můžeme i v případě zobecněných funkcí definovat jejich tenzorový součin. Toto zobrazení je přímým zobecněním tenzorového součinu klasických funkcí.

Motivace zavedení[editovat | editovat zdroj]

V případě klasických funkcí je tenzorový součin definován následovně. Buď , , pak jejich tenzorový součin je definován jako funkce působící způsobem

Takto definované zobrazení vytvářející ze dvou funkcí jejich tenzorový součin je mimo jiné aditivní v obou svých proměnných. Na tenzorový součin dvou jistých funkcí a můžeme nahlížet jako na regulární zobecněnou funkci na prostoru . Vezměme tedy funkci , pak

kde jsme využili Fubiniovy věty.

Rozšíříme-li platnost vztahu výše pro všechny zobecněné funkce a , dostáváme následující definici, jejíž korektnost však musí být ještě dokázána.

Definice[editovat | editovat zdroj]

Nechť a . Pak symbolem rozumíme zobecněnou funkci z prostoru působící na libovolnou následujícím způsobem

Tuto zobecněnou funkci nazýváme tenzorový součin zobecněných funkcí a .

Korektnost definice[editovat | editovat zdroj]

Lze dokázat, že je-li a , pak je funkce prvkem prostoru . Pravá strana definiční rovnosti výše má tedy dobrý smysl. Dá se též dokázat, že tenzorový součin definovaný vztahem výše je spojitý funkcionál.

Vlastnosti[editovat | editovat zdroj]

Uveďme některé důležité vlastnosti tenzorového součinu ve smyslu zobrazení . Pokud nebude uvedeno jinak, tak budeme uvažovat , , a funkci vždy libovolnou testovací funkci z odpovídajícího prostoru testovacích funkcí.

  • bilinearita
  • asociativita
  • komutativita
  • spojitost v obou argumentech - Mějme posloupnost zobecněných funkcí konvergujících k v prostoru . Pak posloupnost konverguje k . Podobně, pokud posloupnost konverguje k v , tak konverguje k .
  • derivace - Pro libovolný multiindex platí (pro derivace podle proměnné obdobně)