In der Analysis heißt eine Funktion f von einem Intervall I (oder allgemeiner einer konvexen Teilmenge C eines reellen Vektorraums) nach
konvex, wenn für alle x, y aus I (bzw. aus C) und t zwischen 0 und 1 gilt:

Anschaulich bedeutet die Definition: Die Funktionswerte zwischen zwei Werten x,y liegen unterhalb der Verbindungsgeraden der beiden Funktionswerte an x und y.
Gilt das Ungleichheitszeichen in die umgekehrte Richtung, also

für alle x, y aus I und t zwischen 0 und 1 gilt, so wird die Funktion als konkav bezeichnet.[1] Vereinzelt wird der hier verwendete Begriff "konvex" als "konvex von unten" und im Gegensatz dazu "konkav" als "konvex von oben" bezeichnet.[2]
Eine Funktion heißt streng konvex, wenn für alle x,y aus I (bzw. C) und t echt zwischen 0 und 1 gilt:
Analog heißt eine Funktion streng konkav, wenn für alle x,y aus I (bzw. C) und t echt zwischen 0 und 1 gilt:
Die besondere Bedeutung konvexer bzw. konkaver Funktionen liegt darin, dass sie allgemeiner als lineare Funktionen sind, aber einfach zu untersuchende Eigenschaften haben, die viele Aussagen über nichtlineare Systeme, insbesondere über nichtlineare Optimierungsprobleme ermöglichen.
Inhaltsverzeichnis
|
Wesentliche Aussagen zu konvexen und konkaven Funktionen finden sich bereits 1889 bei Otto Hölder, wobei er aber die Bezeichnungen konvex und konkav noch nicht verwendete.[3] Die Bezeichnungen konvex und konkav für Funktionen wurden 1905 von Johann Ludwig Jensen eingeführt.[4] Jensen verwendete allerdings die schwächere Definition

und zeigte, dass daraus für stetige Funktionen

für alle t zwischen 0 und 1 folgt.[5] Für Details siehe Jensensche Ungleichung.
Gelegentlich findet sich vor allem in älteren Werken noch diese schwächere Definition.[6]
Der Graph einer konvexen Funktion ist so gewölbt, dass die Menge der Punkte oberhalb des Graphen, der sogenannte Epigraph, eine konvexe Menge ist. Der Graph einer konkaven Funktion ist so gewölbt, dass die Menge der Punkte unterhalb des Graphen, der sogenannte Hypograph, eine konvexe Menge ist. Zu beachten ist, dass eine nicht-konvexe Funktion nicht automatisch konkav sein muss, d.h. konvex und konkav sind hier nicht das exakte Gegenteil voneinander. Jede lineare Funktion ist sowohl konkav als auch konvex, und die Sinusfunktion ist keins von beiden (weder die Menge der Punkte oberhalb des Graphen noch die der Punkte unterhalb des Graphen ist eine konvexe Menge).
Eine Funktion f ist genau dann konvex (konkav), wenn die Funktion -f konkav (konvex) ist.
Ist
invertierbar und setzt man
, so erhält man für eine konvexe Funktion
.Für eine monoton steigende Funktion gilt also
,für eine invertierbare monoton steigende und konvexe (konkave) Funktion hat daher die Umkehrfunktion die umgekehrte Art der Konvexität, ist also monoton steigend und konkav (konvex), siehe z.B. ex und lnx.
Für eine monoton fallende Funktion gilt hingegen
,für eine invertierbare monoton fallende und konvexe (konkave) Funktion hat daher die Umkehrfunktion die gleiche Art der Konvexität, ist also streng monoton steigend und konvex (konkav), siehe z.B. 1 / x auf
bzw.
.
Ist
differenzierbar, dann gilt
ist genau dann konvex, wenn ihre Ableitung
wachsend ist, und genau dann streng konvex, wenn
streng monoton wachsend ist.
ist genau dann konkav, wenn ihre Ableitung
fallend ist, und genau dann streng konkav, wenn
streng monoton fallend ist. Dieses Resultat findet sich im Wesentlichen schon 1889 bei Otto Hölder.[3]
, wobei für streng konvex
für
gilt. Aus dieser Beziehung folgt beispielsweise die Verallgemeinerung der Bernoullischen Ungleichung
für reelle r mit
oder
.
, wobei für streng konkav
für
gilt. Aus dieser Beziehung folgt beispielsweise die Verallgemeinerung der Bernoullischen Ungleichung
für reelle r mit
.Der Zusammenhang zwischen Konvexität und zweiter Ableitung wurde im Wesentlichen schon 1889 von Otto Hölder beschrieben.[3] Für zwei Mal stetig differenzierbare Funktionen
:
gilt
ist genau dann konvex, wenn
gilt. Ist
positiv, ist also
linksgekrümmt, so ist die Funktion streng konvex; bei streng konvexen Funktionen kann die zweite Ableitung aber einzelne Nullstellen haben, wie das Beispiel
für
zeigt.
ist genau dann konkav, wenn
gilt. Ist
negativ, also
rechtsgekrümmt, so ist die Funktion streng konkav; bei streng konkaven Funktionen kann die zweite Ableitung aber einzelne Nullstellen haben, wie das Beispiel
für
zeigt.Ist die Funktion f:
zweimal stetig differenzierbar, dann gilt
ist genau dann konvex, wenn die Hesse-Matrix von
positiv semidefinit ist. Ist die Hesse-Matrix von
positiv definit, so ist
strikt konvex.
ist genau dann konkav, wenn die Hesse-Matrix von
negativ semidefinit ist. Ist die Hesse-Matrix von
negativ definit, so ist
strikt konkav.
.
.Da konvexe bzw. konkave Funktionen die Eindeutigkeit von Extremwerten sicherstellen, spielen sie in der nicht-linearen Optimierung eine wichtige Rolle.
Sind f und g zwei konvexe (konkave) Funktionen, so ist auch jede Linearkombination af + bg mit nichtnegativen Koeffizienten a,b wieder konvex (konkav).
Der Grenzwert einer punktweise konvergenten Folge konvexer (konkaver) Funktionen ist auch wieder eine konvexe (konkave) Funktion. Ebenso ist die Summe einer punktweise konvergenten Reihe konvexer (konkaver) Funktionen auch wieder eine konvexe (konkave) Funktion.
Ist
eine Menge konvexer Funktionen, und existiert punktweise das Supremum

für alle x, so ist auch f eine konvexe Funktion.
Für das Infimum gilt das nicht, wie das Beispiel
,
zeigt.
Ist
eine Menge konkaver Funktionen, und existiert punktweise das Infimum

für alle x, so ist auch f eine konkave Funktion.
Für das Supremum gilt das nicht, wie das Beispiel
,
zeigt.
Für konvexe und konkave Funktionen gilt die Jensensche Ungleichung.
Für t < 0 oder t > 1 dreht sich das Ungleichheitszeichen um, für konvexe Funktionen gilt dann also

sofern u: = tx + (1 − t)y noch im Intervall I (bzw. in der konvexen Menge C) ist. Um das zu sehen sei beispielsweise t > 1, dann gilt
, wegen Konvexität also
, somit
.Jede auf einem offenen Intervall konvexe Funktion ist stetig. Setzt man umgekehrt Stetigkeit voraus, so reicht für Konvexität bereits die Bedingung, dass für alle x,y aus I gilt:
;es reicht sogar, dass für ein beliebiges, aber fixes
mit 

für alle x,y aus I gilt.
Setzt man Stetigkeit voraus, so reicht für Konvexität in einer konvexen Teilmenge C eines reellen topologischen Vektorraums bereits die Bedingung, dass ein beliebiges, aber fixes
mit
existiert, sodass für alle x,y aus C gilt:
.Um dies zu sehen, betrachtet man die Menge T aller "guten" t, die durch
![T=\lbrace t \in [0,1]: f(t x+(1-t)y) \le t f(x)+(1-t)f(y) \quad \forall x,y \in C\rbrace](/wikipedia.images/J/6fb67587a4f15f8b9b35b77e74ecded9.png)
definiert ist.
Seien nun
. Dann gilt auch
, denn



.Sein nun
eine beliebige reelle Zahl mit
. Dann lässt sich eine Intervallschachtelung
mit
konstruieren, die gegen
konvergiert: Sei
und
und
mit
.
Sei
.
Ist
, so setzt man
,
und es gilt
.
Ist
, so setzt man
,
und es gilt
.
sind ebenfalls aus
, es gilt
und
.
Die so konstruierte Intervallschachtelung konvergiert also gegen
; wegen der Stetigkeit von
gilt daher
. Da
beliebig gewählt war, folgt also
und
ist konvex.
Dass Stetigkeit für die schwächere Definition wirklich benötigt wird, lässt sich mit folgendem Gegenbeispiel zeigen: Ist bj
eine Hamelbasis des Vektorraums der reellen Zahlen über dem Körper der rationalen Zahlen, also eine über den rationalen Zahlen linear unabhängige Menge reeller Zahlen, in der jede reelle Zahl r eine Darstellung der Art
mit nur endlich vielen rationalen
hat, so erfüllt bei beliebiger Wahl von f(bj) die Funktion
zwar
ist aber nicht notwendigerweise konvex.
Setzt man für eine Funktion f zusätzlich zur Bedingung dass für ein fixes
die Beziehung

für alle x,y aus einer konvexen Teilmenge C eines normierten Vektorraums gilt, noch voraus, dass f nach oben beschränkt ist, so folgt daraus bereits die Stetigkeit von f in den inneren Punkten von C. Anschaulich wird dies daraus klar, dass man an einer Unstetigkeitsstelle eine beliebig steile Verbindungsgerade zwischen zwei Funktionswerten ziehen kann, wobei die Funktion zwischen den beiden Werten unterhalb der Verbindungsgeraden und außerhalb der beiden Werte oberhalb der Verbindungsgerade liegen muss. Kann die Verbindungsgerade nun beliebig steil werden, so stößt man irgendwann über die obere Schranke der Funktion.
Formal ist der Beweis allerdings etwas komplizierter. Zunächst beachte man, dass aus den obigen Voraussetzungen für natürliche Zahlen n und

folgt, dass

bzw.
.Sei nun a ein beliebiger innerer Punkt von C und


eine zur Gänze in C enthaltene offene Kugel um a. Wäre nun f nicht stetig in a, so gäbe es ein
sodass für jedes δ > 0 ein x existiert, sodass zwar
aber
. Sein nun
so gewählt, dass
,wobei M eine obere Schranke für f sei. Wählt man nun
, so existiert also ein x mit

aber
.Angenommen, f(x) > f(a) + ε. Dann gilt für 
.Das kann aber nicht sein, da
. Daher liegt y in C und es muss f(y) < M gelten.
Sei daher f(x) < f(a) − ε. Dann gilt für 
.Das kann aber auch nicht sein, da
. Daher liegt auch z in C und es muss ebenfalls f(z) < M gelten.
f muss daher stetig in a sein.
Die Aussage, dass eine konvexe beschränkte Funktion stetig in den inneren Punkten ist, ist auch bedeutsam für das Lösen der Cauchyschen Funktionalgleichung

.Aus dieser Aussage folgt nämlich, dass diese Funktionalgleichung eine eindeutige Lösung hat, wenn zusätzlich gefordert wird, dass f beschränkt ist.
Im unendlichdimensionalen Fall brauchen konvexe Funktionen nicht stetig zu sein, da es lineare (also somit auch konvexe) Funktionale gibt, die nicht stetig sind. Allerdings gilt, dass beschränkte konvexe Funktionale eines normierten Vektorraums stetig sind.
Konvexe Funktionen f einer konvexen Teilmenge C des endlichdimensionalen reellen Vektorraums
sind stetig in den inneren Punkten. Um das zu sehen, betrachte man einen inneren Punkt
. Für diesen existiert ein Simplex
mit den Eckpunkten
, der a wieder als inneren Punkt enthält. Jeder Punkt
ist aber in der Form

mit
| ∑ | tj = 1 |
| j |
und
für alle j darstellbar. Nach der Jensenschen Ungleichung gilt nun
.f ist daher nach oben beschränkt und somit, wie oben gezeigt wurde, stetig im inneren Punkt a.
In Randpunkten können konvexe Funktionen unstetig sein, wie das Beispiel der Funktion
mit

zeigt, die zwar konvex ist, aber am Randpunkt x = 0 eine Unstetigkeit aufweist.
Brockhaus-1911: Zyklometrische Funktionen
Lueger-1904: Elliptische Integrale und Funktionen · Hyperelliptische Integrale und Funktionen · Bernoullische Zahlen und Funktionen · Abelsche Integrale und Abelsche Funktionen · Transzendente Funktionen · Lamésche Funktionen · Symmetrische Funktionen · Jacobische Funktionen · Besselsche Funktionen · Doppeltperiodische Funktionen · Funktionen
Meyers-1905: Zyklometrische Funktionen · Invérse Funktionen · Abelsche Funktionen