Viazané extrémy

Pri praktických aplikáciách často potrebujeme stanoviť maximálnu a minimálnu hodnotu nejakej funkcie nie na celom jej definičnom obore, ale len na nejakej jeho časti (napr. na nejakej rovinnej krivke alebo na priestorovej ploche). Najjednoduchším predstaviteľom problémov uvedeného typu je nasledujúca úloha:

Úloha o viazaných extrémoch v rovine je nájsť najmenšiu a najväčšiu hodnotu funkcie $z=f(x,y)$ pre tie body $(x,y)$, ktoré ležia na krivke určenej rovnicou $g(x,y)=0$. (Stručne povedané, hľadáme extrémy funkcie $f(x,y)$ na krivke $g(x,y)=0$, alebo s väzbou $g(x,y)=0$.)

Ak rovnica $g(x,y)=0$ je rozumne jednoduchá, tak z nej možno vypočítať jednu z premenných $x,\ y$, dosadiť výsledok do funkcie $f$ a tým previesť problém na výpočet extrému funkcie jednej premennej. Toto však nie je vždy možné, alebo to nemusí byť výhodné. Preto si v ďalšom vysvetlíme inú, univerzálnejšiu metódu založenú na jednoduchej geometrickej úvahe.

Predstavme si, že v rovine máme nakreslenú krivku určenú rovnicou $g(x,y)=0$, a že v bodoch tejto krivky hľadáme napr. najmenšiu hodnotu funkcie $z=f(x,y)$, t.j. najmenšiu "výšku" plochy $z=f(x,y)$ nad krivkou $g(x,y)=0$. Predstierajme na chvíľu, že túto najmenšiu hodnotu (výšku) poznáme; nech je to $c_0$. Teda, pre $c<c_0$ na krivke $g(x,y)=0$ neexistujú žiadne body, pre ktoré by platilo $f(x,y)=c$. Spomeňme si, že krivky s rovnicou $f(x,y)=c$ sme nazvali vrstevnicami. Predchádzajúci fakt preložený do reči geometrie teda znamená, že pre $c<c_0$ sa vrstevnice $f(x,y)=c$ nepretínajú s krivkou $g(x,y)=0$. Navyše, ak sa $c$ "blíži"ku $c_0$ zľava, tak sa príslušné vrstevnice $f(x,y)=c$ "približujú"v rovine $xy$ ku krivke $g(x,y)=0$. Hodnota $c_0$ je potom najmenšou hodnotou parametra $c$, pre ktorú "pohybujúce sa"vrstevnice "dosiahnu"krivku $g(x,y)=0$, a to v nejakom bode $B=(x_0,y_0)$. Intuitívne sa dá nahliadnuť (a aj exaktne dokázať), že v bode $B$ dôjde k dotyku vrstevnice $f(x,y)=c_0$ s krivkou $g(x,y)=0$. To znamená, že v bode $B$ majú krivky $f(x,y)=c_0$ a $g(x,y)=0$ spoločnú dotyčnicu, a teda aj rovnobežné normálové vektory. Ako vieme z podkapitoly 4.2.4, normálový vektor k vrstevnici $f(x,y)=c_0$ v bode $B$ je práve vektor gradientu v danom bode, čiže $\nabla f_B$. Podobne, normálový vektor v tom istom bode ku krivke $g(x,y)=0$ je $\nabla g_B$. Keďže sme zistili, že tieto vektory musia byť rovnobežné, musia byť jeden násobkom druhého, t.j. existuje nejaké číslo $\lambda$ také, že $\nabla f_B=\lambda\nabla g_B$.

Podobné závery platia aj pre určovanie najväčšej hodnoty funkcie $z=f(x,y)$ na krivke $g(x,y)=0$. Uvedená metóda lokalizovania extrémov sa nazýva Lagrangeova metóda hľadania viazaných extrémov; uvedieme jej zhrnutie.

Lagrangeova metóda. Nech funkcie $f(x,y)$ a $g(x,y)$ majú spojité parciálne derivácie na nejakej oblasti v rovine. Nech na krivke $g(x,y)=0$ funkcia $z=f(x,y)$ nadobúda svoju najmenšiu, resp. najväčšiu hodnotu v bode $(x_0,y_0)$. Potom súradnice $(x_0,y_0)$ spolu s nejakým číslom $\lambda$ spĺňajú nasledujúcu sústavu rovníc:

\begin{displaymath}
\nabla f = \lambda\nabla g\ \ \ \ {\rm a}\ \ \ \ g(x,y)=0\ .\end{displaymath} (4.15)

Keďže gradient je vektor, ktorého zložky sú parciálne derivácie, môžme prvú z uvedených rovníc napísať v tvare $f_x{\bf i}+f_y{\bf j}=\lambda(g_x{\bf i}
+g_y{\bf j})$. Sústava rovníc (4.15) je teda ekvivalentná so sústavou troch rovníc s tromi neznámymi:

\begin{displaymath}
f_x=\lambda g_x\ \ ,\ \ \ f_y=\lambda g_y\ \ ,\ \ \ g(x,y)=0\ .\end{displaymath} (4.16)

Poznamenajme, že Lagrangeova metóda má tvar implikácie, a teda s jej pomocou dostaneme len body $(x_0,y_0)$, ktoré sú kandidátmi na to, aby v nich funkcia $f$ mala najmenšiu alebo najväčšiu hodnotu. O tom, či sa v danom bode nejaký extrém vôbec nadobudne, musíme rozhodnúť inak. Spravidla sa pritom opierame o geometrické úvahy a o fakt, že spojitá funkcia na uzavretej a ohraničenej množine $M$ vždy nadobudne svoju najmenšiu, resp. najväčšiu hodnotu v niektorom bode množiny $M$.

-


Príklad 1. Nájdite najmenšiu a najväčšiu hodnotu funkcie $f(x,y)=xy$ na krivke $x^2+4y^2=8$.


Riešenie: Lagrangeova metóda pracuje pre krivky s rovnicou $g(x,y)=0$, preto v našom prípade je $g(x,y)=
x^2+4y^2-8$. Najprv vyriešime sústavu rovníc (4.16), teda:

\begin{displaymath}y=\lambda\cdot 2x\ ,\ \ x=\lambda\cdot 8y\ ,\ \
x^2+4y^2-8=0\ .\end{displaymath}

Z týchto rovníc ihneď vidieť, že žiadna z neznámych $x,\ y$ nemôže byť rovná nule. Z prvých dvoch rovníc potom máme:

\begin{displaymath}\lambda = \frac{y}{2x}\ , \ \ \ \lambda=\frac{x}{8y}\ , \ \
{\rm a\ teda}\ \ \ \frac{y}{2x}=\frac{x}{8y}\ .\end{displaymath}

Odtiaľ máme $x^2=4y^2$, čo po dosadení do rovnice krivky $x^2+4y^2-8=0$ dáva $y=\pm 1$, a teda $x=\pm 2$. Tak dostávame štyri body, $B_1=(2,1)$, $B_2=(-2,-1)$, $B_3=(-2,1)$ a $B_4=(2,-1)$, ktoré sú kandidátmi na tie body, kde funkcia $f(x,y)=xy$ dosahuje najväčšiu, resp. najmenšiu hodnotu na krivke $x^2+4y^2-8=0$. Pre príslušné funkčné hodnoty máme: $f(B_1)=f(B_2)=2$, a $f(B_3)=f(B_4)=-2$. Keďže množina bodov určená rovnicou $x^2+4y^2-8=0$ je uzavretá a ohraničená (ide o elipsu so stredom v počiatku a poloosami $a=2\sqrt{2}$, $b=\sqrt{2}$), hodnoty $-2$ a $2$ sú naozaj najmenšou a najväčšou hodnotou funkcie $f$ na krivke $g(x,y)=0$. $\clubsuit$

Lagrangeova metóda pre lokalizovanie viazaných extrémov pre funkcie troch premenných je obdobná. Nech $f=f(x,y,z)$ a $g=g(x,y,z)$ sú funkcie, ktoré majú na nejakej oblasti v ${\cal R}^3$ spojité parciálne derivácie prvého rádu. Potom súradnice $(x_0,y_0,z_0)$ bodu, v ktorom funkcia $f$ nadobúda na ploche $g(x,y,z)=0$ svoju najmenšiu, resp. najväčšiu hodnotu, spĺňajú sústavu rovníc

\begin{displaymath}
\nabla f = \lambda\nabla g\ \ \ \ {\rm a}\ \ \ \ g(x,y,z)=0\ .\end{displaymath} (4.17)

Po rozpísaní gradientov na zložky dostávame z (4.17) ekvivalentný tvar
\begin{displaymath}
f_x=\lambda g_x\ , \ \ f_y=\lambda g_y \ , \ \ f_z=\lambda g_z\ ,
\ \ g(x,y)=0\ .\end{displaymath} (4.18)

-


Príklad 2. Na ploche $z^2=4+xy$ nájdite body, ktoré sú najbližšie k počiatku súradnicovej sústavy.


Riešenie: Vzdialenosť bodu $(x,y,z)$ od počiatku súradnicovej sústavy sa rovná $d(x,y,z)=\sqrt{x^2+y^2+z^2}$. Našou úlohou je nájsť body $(x_0,y_0,z_0)$ na ploche $z^2=4+xy$, v ktorých funkcia $d(x,y,z)$ nadobudne najmenšiu hodnotu; to nastane práve vtedy, keď za tých istých podmienok funkcia $f(x,y,z)=x^2+y^2+z^2$ nadobudne najmenšiu hodnotu. (Inak povedané, namiesto minimalizácie vzdialenosti minimalizujeme jej druhú mocninu, čím sa vyhneme výrazom s odmocninami.) Hľadáme teda body, v ktorých funkcia $f(x,y,z)=x^2+y^2+z^2$ nadobúda svoju najmenšiu hodnotu na ploche určenej rovnicou $4+xy-z^2=0$; naša väzbová funkcia je teda $g(x,y,z)=4+xy-z^2$. Postupujeme Lagrangeovou metódou, teda zostavíme sústavu rovníc podľa (4.18):

\begin{displaymath}2x=\lambda\cdot y\ ,\ \ 2y=\lambda\cdot x\ ,\ \
2z=\lambda\cdot (-2z)\ ,\ \ 4+xy-z^2=0\ .\end{displaymath}

Nasledujúce dva odstavce budú venované riešeniu tejto sústavy. Z tretej rovnice máme $(1+\lambda)z=0$, a teda $z=0$ alebo $\lambda=-1$. Ak $z=0$, tak zo štvrtej rovnice máme $xy=-4$. Vyjadrením $\lambda$ z prvých dvoch rovníc dostávame $2x/y=2y/x$, čiže $\vert x\vert=\vert y\vert$. To v kombinácii s $xy=-4$ napokon dáva dve riešenia: $x = 2$ a $y=-2$, alebo $x=-2$ a $y = 2$. Pamätajme, že to všetko bolo v prípade $z=0$; tak dostávame súradnice dvoch bodov, ktoré spĺňajú Lagrangeove rovnice (4.18): $B_1=(2,-2,0)$ a $B_2=(-2,2,0)$.

Zostáva vyšetriť prípad, keď $z\ne 0$, a teda $\lambda=-1$. Potom z prvých dvoch rovníc dostávame $2x=-y$ a $2y=-x$, čo je možné iba vtedy, ak $x=y=0$. Zo štvrtej rovnice potom máme $z^2=4$, a teda $z=\pm 2$. Tak dostávame súradnice ďalších dvoch bodov spĺňajúcich Lagrangeove rovnice: $B_3=(0,0,2)$ a $B_4=(0,0,-2)$.

Body $B_1$$B_4$ sú teda kandidátmi na tie body, v ktorých funkcia $f(x,y,z)=x^2+y^2+z^2$ nadobudne svoju najmenšiu hodnotu na ploche $4+xy-z^2=0$. Pre hodnoty funkcie $f$ v týchto bodoch máme: $f(B_1)=f(B_2)=8$, a $f(B_3)=f(B_4)=4$. Z geometrickej úvahy (vrstvové plochy funkcie $f$ sú guľové plochy so stredom v počiatku) vyplýva, že hodnota $4$ je naozaj najmenšou hodnotou funkcie $f$ na ploche $4+xy-z^2=0$, a nadobúda sa v bodoch $(0,0,\pm 2)$.

Hľadaná najmenšia vzdialenosť plochy $z^2=4+xy$ od počiaktu súradnicovej sústavy je teda $\sqrt{4}=2$ a realizuje sa v bodoch $(0,0,2)$ a $(0,0,-2)$. $\clubsuit$

Na záver uvedieme príklad, kedy o existencii extrémov pri použití Lagrangeovej metódy musíme rozhodnúť neštandardne.

-


Príklad 3. Určte najmenšiu a najväčšiu hodnotu funkcie $f(x,y,z)=xyz$ na ploche určenej rovnicou $2x+y+2z-6=0$.


Riešenie: Postupujeme opäť Lagrangeovou metódou, čiže zostavíme sústavu rovníc podľa (4.18):

\begin{displaymath}yz=\lambda\cdot 2\ ,\ \ xz=\lambda\cdot 1\ ,\ \
xy=\lambda\cdot 2\ ,\ \ 2x+y+2z-6=0\ .\end{displaymath}

Ak $\lambda=0$, tak z prvých troch rovníc vidíme, že aspoň dve z premenných $x,y,z$ sú rovné nule, a potom zo štvrtej rovnice máme tri "kandidátske" body: $B_1=(0,0,3)$, $B_2=(0,6,0)$ a $B_3=(3,0,0)$. Ak $\lambda\ne 0$, tak žiadna z premenných $x,y,z$ sa nemôže rovnať nule (prečo?). V tomto prípade z prvých troch rovníc dostaneme $2x=y=2z$, a pomocou štvrtej rovnice máme posledný bod $B_4=(1,2,1)$.

Vidíme, že $f(B_1)=f(B_2)=f(B_3)=0$ a $f(B_4)=2$ Môžme teraz tvrdiť, že hodnoty $0$ a $2$najmenšou a najväčšou hodnotou funkcie $f$ na danej ploche? Nuž, ak by naša plocha určená rovnicou $2x+y+2z-6=0$ bola uzavretá a ohraničená, tak áno. Žiaľ, táto plocha je rovina v priestore, a teda je neohraničená, a uvedený princíp nemožno použiť.

Pomôžeme si nasledovne: Vyjadríme $z=3-x-y/2$ z rovnice roviny a dosadíme do našej funkcie $f$, čím dostávame funkciu dvoch premenných $g(x,y)=xy(3-x-y/2)$. Ak teraz napr. $y = 2$, tak máme $g(x,2)=2x(2-x)$, a táto funkcia pre $x\to\infty$ má limitu $-\infty$. To znamená, že naša funkcia nemá najmenšiu hodnotu! Podobne, ak napr. $y=-2$, tak $g(x,-2)=-2x(4-x)$, a táto funkcia má pre $x\to\infty$ pre zmenu limitu $+\infty$, t.j. funkcia $f$ nemá ani najväčšiu hodnotu! Vidíme, že napriek existencii až 4 kandidátov na extrémy vyplývajúcich z Lagrangeovej metódy, funkcia $f$ v skutočnosti nemá ani najmenšiu, ani najväčšiu hodnotu na danej ploche (rovine). $\clubsuit$