Kettenregel < mehrere Veränderl. < reell < Analysis < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 13:12 Di 24.07.2012 | Autor: | Ciotic |
Aufgabe | Gegeben seien die Funktionen [mm] f:\IR^{2}\to\IR^{3} [/mm] und [mm] g:\IR^{3}\to\IR^{2} [/mm] mit
[mm] f(u,v)=\vektor{uv \\ u+v \\ sin(u+v)}, g(x_{1},x_{2},x_{3})=\vektor{x_{1}+x_{2} \\ x_{2}+x_{3}}.
[/mm]
Berechnen Sie mit der Kettenregel [mm] h'(x_{1},x_{2},x_{3}) [/mm] für [mm] h(x_{1},x_{2},x_{3})=f(g(x_{1},x_{2},x_{3})) [/mm] |
Hallo, ich bin mir bei obiger Aufgabe nicht sicher.
Nach Definition ist die Kettenregel:
[mm] $\nabla f(g(x))*\nabla [/mm] g(x)$
Für [mm] \nabla [/mm] f(g(x)) komme ich auf:
[mm] \pmat{ x_{2}+x_{3} & x_{1}+2x_{2}+x_{3} & x_{1}+x_{2}\\ 1 & 2 & 1 \\ cos(x_{1}+2x_{2}+x_{3}) & 2cos(x_{1}+2x_{2}+x_{3}) & cos(x_{1}+2x_{2}+x_{3}) }
[/mm]
Doch wie berechne ich [mm] \nabla [/mm] g(x) bei 3 Variablen, aber 2 Dimensionen?
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 13:15 Di 24.07.2012 | Autor: | fred97 |
$ [mm] \nabla [/mm] $ g(x) ist die jacobimatrix von g, also eine 2x3 - Matrix.
FRED
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 13:20 Di 24.07.2012 | Autor: | Ciotic |
Danke!
Das wäre dann also:
[mm] \nabla [/mm] g(x)= [mm] \pmat{ 1 & 1 & 0\\ 0 & 1 & 1}.
[/mm]
Doch wie kann ich das nun mit [mm] \nabla [/mm] f(g(x)) multiplizieren. Das wäre dann ja eine 3x3 Matrix multipliziert mit einer 2x3 Matrix, was nicht funktioniert.
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 13:27 Di 24.07.2012 | Autor: | fred97 |
> Danke!
>
> Das wäre dann also:
>
> [mm]\nabla[/mm] g(x)= [mm]\pmat{ 1 & 1 & 0\\ 0 & 1 & 1}.[/mm]
>
> Doch wie kann ich das nun mit [mm]\nabla[/mm] f(g(x))
> multiplizieren. Das wäre dann ja eine 3x3 Matrix
> multipliziert mit einer 2x3 Matrix, was nicht funktioniert.
Das habe ich oben ganz übersehen: $ [mm] \nabla [/mm] $ f(g(x)) ist keine 3x3 - Matrix !!! Sondern eine 3x2 _ Matrix.
FRED
>
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 01:02 Mi 25.07.2012 | Autor: | Marcel |
Hallo Fred,
> > Danke!
> >
> > Das wäre dann also:
> >
> > [mm]\nabla[/mm] g(x)= [mm]\pmat{ 1 & 1 & 0\\ 0 & 1 & 1}.[/mm]
> >
> > Doch wie kann ich das nun mit [mm]\nabla[/mm] f(g(x))
> > multiplizieren. Das wäre dann ja eine 3x3 Matrix
> > multipliziert mit einer 2x3 Matrix, was nicht funktioniert.
>
> Das habe ich oben ganz übersehen: [mm]\nabla[/mm] f(g(x)) ist keine
> 3x3 - Matrix !!! Sondern eine 3x2 _ Matrix.
die Symbolik hier ist echt unschön - ich schreibe es für Ciotic mal in Worten:
[mm] $$\nabla [/mm] f(g(x))$$
bedeutet hier die Ableitung von [mm] $f\,$ [/mm] ausgewertet an der Stelle [mm] $g(x)\,,$ [/mm] anders gesagt:
[mm] $$J_f(g(x))\,.$$
[/mm]
Das ist eine $3 [mm] \times [/mm] 2$-Matrix.
Hätte Fred die Ableitung von $f [mm] \circ [/mm] g$ an der Stelle [mm] $x\,$ [/mm] gemeint, so hätte er [mm] $\nabla [/mm] (f [mm] \circ [/mm] g)(x)$ geschrieben. Bitte immer aufpassen, dass [mm] $\nabla [/mm] f(g(x))$ nicht [mm] $\nabla [/mm] (f [mm] \circ [/mm] g)(x)$ meint.
Wenn man hier dieses komische [mm] $\nabla$ [/mm] unbedingt verwenden will, dann schreibt man vielleicht besser [mm] $\nabla_f [/mm] f(x)$ bzw. [mm] $\nabla_f [/mm] f(g(x)) $ bzw. [mm] $\nabla_g [/mm] g(x)$ bzw. [mm] $\nabla_{f \circ g} [/mm] (f [mm] \circ [/mm] g)(x)$ (oder damit letzteres ein wenig mehr Sinn macht: [mm] $\nabla_{f \circ g}f(g(x))$ [/mm] soll dann das gleiche bedeuten wie [mm] $\nabla_{f \circ g} [/mm] (f [mm] \circ g)(x)\,,$ [/mm] während [mm] $\nabla_{f} [/mm] f(g(x))$ dann das eben gesagte meint!) wenngleich das sicher auch keiner macht - weil man solche Notationen auch in einem anderen Sinn verwendet, wobei das unten indizierte [mm] $f\,$ [/mm] ein Teil der Komponenten des Vektors ist, nach dem man dann ableitet (also teilweise partielle Ableitungen bildet). So bedeutet etwa [mm] $\nabla_x f(x,t)\,,$ [/mm] dass man nicht den Gradienten von [mm] $f\,$ [/mm] bzgl. [mm] $(x,t)\,,$ [/mm] sondern nur bzgl. [mm] $x\,$ [/mm] berechnet. Aber das nur nebenbei.
Tipp:
Notationswirrwarr läßt sich schnell vermeiden, wenn man die Jacobimatrizen [mm] $J\,$ [/mm] nennt und entsprechend indiziert, bzgl. was die gebildet wurden...
P.S.
Bei meiner oben vorgeschlagenen Notation schreibe ich immer unten an [mm] $\nabla$ [/mm] dran, bzgl. welcher Funktion wir eigentlich die Ableitung berechnet haben. Natürlich kann man auch das anders machen, und zwar konsistent zur "formalen 1D-Beschreibung der Kettenregel":
In 1D schreibt man ja meist einfach für $h(x)=(f [mm] \circ g)(x)\,,$ [/mm] dass $f=f(g)$ und $g=g(x)$ ist und kann sich dann die Kettenregel mittels Bruchrechnung formal jedenfalls hinschreiben:
[mm] $$\frac{dh(x)}{dx}=\frac{df(g)}{dx}=\frac{df(g)}{dg}*\frac{dg(x)}{dx}\,.$$
[/mm]
Die Funktion [mm] $g=g(x)\,$ [/mm] bekommt also formal die Bedeutung einer Variablen, nach der man ableitet.
Ähnlich könnte man nun oben sagen: [mm] $\nabla_{x} [/mm] (f [mm] \circ g)(x)=\nabla_g [/mm] f(g(x)) [mm] \cdot \nabla_x g(x)\,.$
[/mm]
Und hier hat dann die "Variable" [mm] $g\,$ [/mm] die Bedeutung einer Variablen mit so vielen Komponenten, wie es sich aus dem Zielbereich von [mm] $g\,$ [/mm] ergibt. (Anders gesagt: Die "Variable" [mm] $g\,$ [/mm] hat so viele Komoponenten, wie die Funktion [mm] $g\,$ [/mm] Komponentenfunktionen hat.) Das wäre eine vielleicht konsistentere Notation für die Kettenregel - zumal man nicht ständig Funktionsnamen wiederholt, wie es bei meinem Vorschlag gewesen wäre...
Gruß,
Marcel
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 13:27 Di 24.07.2012 | Autor: | fred97 |
> Gegeben seien die Funktionen [mm]f:\IR^{2}\to\IR^{3}[/mm] und
> [mm]g:\IR^{3}\to\IR^{2}[/mm] mit
>
> [mm]f(u,v)=\vektor{uv \\ u+v \\ sin(u+v)}, g(x_{1},x_{2},x_{3})=\vektor{x_{1}+x_{2} \\ x_{2}+x_{3}}.[/mm]
>
> Berechnen Sie mit der Kettenregel [mm]h'(x_{1},x_{2},x_{3})[/mm]
> für [mm]h(x_{1},x_{2},x_{3})=f(g(x_{1},x_{2},x_{3}))[/mm]
> Hallo, ich bin mir bei obiger Aufgabe nicht sicher.
>
> Nach Definition ist die Kettenregel:
>
> [mm]\nabla f(g(x))*\nabla g(x)[/mm]
>
> Für [mm]\nabla[/mm] f(g(x)) komme ich auf:
>
> [mm]\pmat{ x_{2}+x_{3} & x_{1}+2x_{2}+x_{3} & x_{1}+x_{2}\\ 1 & 2 & 1 \\ cos(x_{1}+2x_{2}+x_{3}) & 2cos(x_{1}+2x_{2}+x_{3}) & cos(x_{1}+2x_{2}+x_{3}) }[/mm]
Das stimmt nicht
FRED
>
> Doch wie berechne ich [mm]\nabla[/mm] g(x) bei 3 Variablen, aber 2
> Dimensionen?
>
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 15:03 Di 24.07.2012 | Autor: | Ciotic |
Stimmt meine Funktion [mm] f(g(x_{1},x_{2},x_{3}))=\vektor{x_{1}x_{2}+x_{1}x_{3}+x_{2}^{2}+x_{2}x_{3} \\ x_{1}+2x_{2}+x_{3} \\ sin(x_{1}+2x_{2}+x_{3}})
[/mm]
überhaupt?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 15:21 Di 24.07.2012 | Autor: | fred97 |
> Stimmt meine Funktion
> [mm]f(g(x_{1},x_{2},x_{3}))=\vektor{x_{1}x_{2}+x_{1}x_{3}+x_{2}^{2}+x_{2}x_{3} \\ x_{1}+2x_{2}+x_{3} \\ sin(x_{1}+2x_{2}+x_{3}})[/mm]
>
> überhaupt?
Ja
FRED
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 15:32 Di 24.07.2012 | Autor: | Ciotic |
Wenn man davon jetzt den Gradienten bildet, würde man doch die erste Zeile nach [mm] x_{1}, x_{2} [/mm] und [mm] x_{3} [/mm] ableiten, das selbe dann mit der zweiten und der dritten Zeile. Wäre doch eigentlich eine 3x3 Matrix.
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 00:28 Mi 25.07.2012 | Autor: | Marcel |
Hallo,
> Wenn man davon jetzt den Gradienten bildet, würde man doch
> die erste Zeile nach [mm]x_{1}, x_{2}[/mm] und [mm]x_{3}[/mm] ableiten, das
> selbe dann mit der zweiten und der dritten Zeile. Wäre
> doch eigentlich eine 3x3 Matrix.
rechne lieber die Jacobimatrix aus. Gradientenberechnung macht doch erstmal nur Sinn bei Funktionen [mm] $\IR^n \to \IR\,.$ [/mm] Natürlich findet man in der Jacobimatrix komponentenweise auch wieder Gradienten (oder deren transponiertes - je nach der Definition der Jacobimatrix bzw. des Gradienten) wieder - und insbesondere ist im Falle von Funktionen [mm] $\IR^n \to \IR$ [/mm] die Jacobimatrix nichts anderes als der Gradient (oder dessen transponiertes - wie gesagt: Je nach Euren vorliegenden Definitionen).
P.S.
Die Kettenregel, so, wie Du sie geschrieben hast, kannst Du so nicht schreiben. Eine richtige Version findest Du etwa hier in Satz 19.15, 2.:
Die klare(re) Bedeutung der Formel findest Du in der Klammer mit "andere Schreibweise".
Anders gesagt: Man berechnet die Jacobimatrix der Verkettung $f [mm] \circ [/mm] g$ an der Stelle [mm] $x^{(0)}\,,$ [/mm] in dem man
1. Die Jacobimatrix von [mm] $f\,$ [/mm] berechnet und diese an der Stelle [mm] $g(x^{(0)})\,$ [/mm] auswertet.
2. Die Jacobimatrix von [mm] $g\,$ [/mm] an der Stelle [mm] $x^{(0)}\,$ [/mm] auswertet.
3. Das Matrixprodukt der beiden Matrizen aus 1. und 2. (Multiplikation in dieser Reihenfolge) bildet!
P.S.
Beachte, dass im Skript [mm] $f\,$ [/mm] und [mm] $g\,$ [/mm] gerade die vertauschten Rollen bzgl. Deiner Aufgabe haben. D.h. das [mm] $f\,$ [/mm] im Skript hat eigentlich die Rolle Deines [mm] $g\,$'s, [/mm] und das [mm] $g\,$ [/mm] im Skript die Rolle Deines [mm] $f\,$'s.
[/mm]
(Das oben in Worten beschriebende ist schon auf die Rollen in Deiner Aufgabe zugeschnitten!)
Gruß,
Marcel
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 00:52 Mi 25.07.2012 | Autor: | Marcel |
Hallo,
> Wenn man davon jetzt den Gradienten bildet, würde man doch
> die erste Zeile nach [mm]x_{1}, x_{2}[/mm] und [mm]x_{3}[/mm] ableiten, das
> selbe dann mit der zweiten und der dritten Zeile. Wäre
> doch eigentlich eine 3x3 Matrix.
um auf Deine Aufgabe/Frage nochmal einzugehen:
Ja. Wenn Du [mm] J_{f \circ g} [/mm] direkt berechnest, ist das eine $3 [mm] \times [/mm] 3$ Matrix - ist ja auch klar:
$$f [mm] \circ [/mm] g$$
ist doch eine Abbildung [mm] $\IR^3 \to\IR^3\,.$
[/mm]
[mm] $f\,$ [/mm] ist aber eine Abbildung [mm] $\IR^2 \to \IR^3\,,$ [/mm] also wird [mm] $J_f$ [/mm] eine $3 [mm] \times [/mm] 2$-Matrix(funktion) sein (wenn ihr die Jacobimatrix so definiert habt, wie ich es kenne) - diese wertest Du an der Stelle $g(x) [mm] \in \IR^2$ [/mm] für $x [mm] \in \IR^3$ [/mm] aus!
Und $g: [mm] \IR^3 \to \IR^2$ [/mm] hat eine Jacobimatrix(funktion) der Bauart $2 [mm] \times 3\,,$ [/mm] diese wertest Du an der Stelle $x [mm] \in \IR^3$ [/mm] aus.
Und toll: [mm] $J_f(g(x))$ [/mm] ist eine $3 [mm] \times [/mm] 2$-Matrix, diese wird mit [mm] $J_g(x)\,,$ [/mm] einer $2 [mm] \times [/mm] 3$-Matrix, multipliziert, und das Ergebnis ist eine $3 [mm] \times [/mm] 3$-Matrix. Zumindest von der Matrixdimension also das, was man erwartet, wenn man $f [mm] \circ [/mm] g: [mm] \IR^3 \to \IR^3$ [/mm] ableitet...
Gruß,
Marcel
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 08:58 Mi 25.07.2012 | Autor: | Ciotic |
Tausend Dank für die sehr gute Erklärung, jetzt habe ich es endlich verstanden. :)
Also mal Schritt für Schritt:
[mm] J_{f}(u,v)=\pmat{ v & u \\ 1 & 1 \\ cos(u+v) & cos(u+v) } \in \IR^{3x2}
[/mm]
[mm] J_{f(g(x_{1},x_{2},x_{3}))}(u,v)=\pmat{ x_{2}+x_{3} & x_{1}+x_{2} \\ 1 & 1 \\ cos(x_{1}+2x_{2}+x_{3}) & cos(x_{1}+2x_{2}+x_{3}) } \in \IR^{3x2}
[/mm]
Ist die Notation für die Jacobimatrix an g korrekt?
[mm] J_{g}(x_{1},x_{2},x_{3})=\pmat{ 1 & 1 & 0 \\ 0 & 1 & 1 } \in \IR^{2x3}
[/mm]
[mm] J_{f(g(x_{1},x_{2},x_{3}))}(u,v)*J_{g}(x_{1},x_{2},x_{3})=
[/mm]
[mm] \pmat{ x_{2}+x_{3} & x_{1}+x_{2} \\ 1 & 1 \\ cos(x_{1}+2x_{2}+x_{3}) & cos(x_{1}+2x_{2}+x_{3}) }*\pmat{ 1 & 1 & 0 \\ 0 & 1 & 1 } [/mm] =
[mm] \pmat{ x_{2}+x_{3} & x_{1}+2x_{2}+x_{3} & x_{1}+x_{2} \\ 1 & 2 & 1 \\ cos(x_{1}+2x_{2}+x_{3}) & 2cos(x_{1}+2x_{2}+x_{3}) & cos(x_{1}+2x_{2}+x_{3})}= h'(x_{1},x_{2},x_{3})
[/mm]
|
|
|
|
|
Hallo Ciotic,
> Tausend Dank für die sehr gute Erklärung, jetzt habe ich
> es endlich verstanden. :)
>
> Also mal Schritt für Schritt:
>
> [mm]J_{f}(u,v)=\pmat{ v & u \\ 1 & 1 \\ cos(u+v) & cos(u+v) } \in \IR^{3x2}[/mm]
>
> [mm]J_{f(g(x_{1},x_{2},x_{3}))}(u,v)=\pmat{ x_{2}+x_{3} & x_{1}+x_{2} \\ 1 & 1 \\ cos(x_{1}+2x_{2}+x_{3}) & cos(x_{1}+2x_{2}+x_{3}) } \in \IR^{3x2}[/mm]
>
> Ist die Notation für die Jacobimatrix an g korrekt?
>
Die korrekte Notation der Jacobimatrix lautet:
[mm]J_{f}( \ g(x_{1},x_{2},x_{3}) \ )=\pmat{ x_{2}+x_{3} & x_{1}+x_{2} \\ 1 & 1 \\ cos(x_{1}+2x_{2}+x_{3}) & cos(x_{1}+2x_{2}+x_{3}) } \in \IR^{3x2}[/mm]
> [mm]J_{g}(x_{1},x_{2},x_{3})=\pmat{ 1 & 1 & 0 \\ 0 & 1 & 1 } \in \IR^{2x3}[/mm]
>
> [mm]J_{f(g(x_{1},x_{2},x_{3}))}(u,v)*J_{g}(x_{1},x_{2},x_{3})=[/mm]
>
> [mm]\pmat{ x_{2}+x_{3} & x_{1}+x_{2} \\ 1 & 1 \\ cos(x_{1}+2x_{2}+x_{3}) & cos(x_{1}+2x_{2}+x_{3}) }*\pmat{ 1 & 1 & 0 \\ 0 & 1 & 1 }[/mm]
> =
>
> [mm]\pmat{ x_{2}+x_{3} & x_{1}+2x_{2}+x_{3} & x_{1}+x_{2} \\ 1 & 2 & 1 \\ cos(x_{1}+2x_{2}+x_{3}) & 2cos(x_{1}+2x_{2}+x_{3}) & cos(x_{1}+2x_{2}+x_{3})}= h'(x_{1},x_{2},x_{3})[/mm]
>
Gruss
MathePower
|
|
|
|