Вариационное исчисление

Вариацио́нное исчисле́ние — раздел анализа, в котором изучаются вариации функционалов. Наиболее типичная задача — найти функцию, на которой заданный функционал достигает экстремального значения.

Методы вариационного исчисления широко применяются в различных областях математики. Например, в дифференциальной геометрии с их помощью ищут геодезические линии и минимальные поверхности. В физике вариационный метод — один из мощнейших инструментов получения уравнений движения (см. например Принцип наименьшего действия), как для дискретных, так и для распределённых систем, в том числе и для физических полей. Методы вариационного исчисления применимы и в статике (см. Вариационные принципы).

Никак не связана с вариационным вычислением совпадающая по названию вариация функции в анализе.

Термин варьирование (варьировать) — применяется в вариационном исчислении для обозначения нахождения вариации или вариационной производной (это аналог термина дифференцирование для случая бесконечномерного аргумента, являющегося предметом вариационного исчисления). Также нередко для краткости (особенно в приложениях) термин варьирование применяется для обозначения решения вариационной задачи, сводимой к нахождению вариационной производной и приравнивания её нулю.

Вариационная задача означает, как правило, нахождение функции (в рамках вариационного исчисления — уравнения на функцию), удовлетворяющей условию стационарности некоторого заданного функционала, то есть такой функции, (бесконечно малые) возмущения которой не вызывают изменения функционала по крайней мере в первом порядке малости. Также вариационной задачей называют тесно связанную с этим задачу нахождения функции (уравнения на функцию), на которой данный функционал достигает локального экстремума (во многом эта задача сводится к первой, иногда практически полностью). Обычно при таком употреблении терминов подразумевается, что задача решается методами вариационного исчисления.

Типичными примерами вариационной задачи являются изопериметрические задачи в геометрии и механике; в физике — задача нахождения уравнений поля из заданного вида действия для этого поля.

Ещё в античные времена появились первые вариационные проблемы, относящиеся к категории изопериметрических задач — например, задача Дидоны. Древнегреческим математикам уже было известно[1]:

Первый вариационный принцип сформулировал для траекторий отражённых световых лучей Герон Александрийский в работе «Катоптрика» (I век н. э.)[2].

В средневековой Европе изопериметрическими задачами занимались И. Сакробоско (XIII век) и Т. Брадвардин (XIV век). После разработки анализа появились новые типы вариационных задач, в основном механического характера. Ньютон в «Математических началах натуральной философии» (1687) решает задачу: найти форму тела вращения, обеспечивающую наименьшее сопротивление при движении в газе или жидкости (при заданных размерах). Важной исторической задачей, давшей толчок к развитию современного варианта вариационного исчисления, стала задача о брахистохроне (1696). Её быстрое решение сразу несколькими математиками показало огромные возможности новых методов. Среди других задач стоит отметить определение формы цепной линии (то есть формы равновесия тяжёлой однородной нити, 1690 год). Общих методов решения вариационных задач в этот период ещё не существовало, каждая задача решалась с помощью остроумных (и не всегда безупречных) геометрических рассуждений.

Пьер Ферма сформулировал основной принцип геометрической оптики, в силу которого свет в неоднородной среде выбирает путь, занимающий наименьшее время. В 1746 году Мопертюи обобщил это правило, введя в науку первый принцип наименьшего действия.

Решающий вклад в развитие вариационного исчисления внесли Леонард Эйлер и Жозеф Лагранж. Эйлеру принадлежит первое систематическое изложение вариационного исчисления и сам термин (1766 год). Лагранж независимо получил (с 1755 года) многие основополагающие результаты и ввёл понятие вариации.

На этом этапе были выведены уравнения Эйлера — Лагранжа. Они представляют собой необходимое условие экстремума, ставшее аналитическим фундаментом вариационных методов. Вскоре, однако, выяснилось, что решения этих уравнений не во всех случаях дают реальный экстремум, и встала задача найти достаточные условия, гарантирующие экстремум. Первое глубокое исследование (второй вариации) предпринял Лежандр, однако Лагранж обнаружил в его работе ошибку. Результаты Лежандра уточнил и дополнил Якоби (1837), затем его ученик Гессе (1857) и позднее Вейерштрасс. Сейчас эти достаточные условия называются уравнениями Якоби[3].

Содержанием вариационного исчисления является обобщение понятия дифференциала и производной функции конечномерного векторного аргумента на случай функционала — функции, областью определения которой служит некое множество или пространство функций, а значения лежат в множестве вещественных, либо комплексных чисел.

Нетрудно написать для функционала аналоги дифференциала и производной по направлению.

Аналогом дифференциала (первого дифференциала) является в вариационном исчислении вариация (первая вариация):

Таким образом, это — в применении к функционалам — прямой аналог дифференциала функции конечномерного (в том числе одномерного) аргумента:

(Здесь не вводится специальных обозначений для производной по направлению.)

Для интегральных функционалов, которые являются очень важным для математики и приложений случаем, можно ввести не только аналог дифференциала и производную по направлению, но и производную Фреше — аналог конечномерного градиента, называемую вариационной производной.

Так же легко обобщается понятие вариационной производной на случай функционалов от нескольких аргументов[4]:

Выражая бесконечно малую разность функции нескольких аргументов как полный дифференциал, получим:

Для функционалов, зависящих от нескольких функций, можно также ввести понятие смешанных вариационных производных разного порядка, например:

Здесь мы не будем останавливаться на этом подробно, всё делается полностью аналогично введению соответствующих дифференциалов и производных для функции конечномерного аргумента.

Функционал вблизи конкретной точки в пространстве функций раскладывается в ряд Тейлора, если, конечно, вариационные производные всех порядков существуют. Как и в конечномерных случаях, сумма конечного числа членов этого ряда даёт значение функционала с определённой точностью (соответствующего порядка малости) лишь при небольших отклонениях его аргумента (при бесконечно малых). Кроме того, как и в случае функций конечномерного аргумента, ряд Тейлора (сумма всех членов) может не сходиться к функционалу, в него разложенному, при любых ненулевых конечных смещениях, хотя такие случаи достаточно редки в приложениях.

Хотя задачи, к которым применимо вариационное исчисление, заметно шире, в приложениях они главным образом сводятся к двум основным задачам:

Очевидно, обе задачи тесно связаны, и решение второй сводится (при должной гладкости функционала) к решению первой, а затем проверке, действительно ли достигается локальный экстремум (что делается независимо вручную, или — более систематически — исследованием вариационных производных второго и, если все они одного знака и хотя бы одна из них равна нулю, то и более высокого порядка). В описанном процессе выясняется и тип экстремума. Нередко (например, когда функция стационарного функционала единственная, а все изменения функционала при любом большом возмущении имеют один и тот же знак) решение вопроса, экстремум ли это и какого он типа, заранее очевидно.

При этом очень часто задача (1) оказывается не менее или даже более важной, чем задача (2), даже когда классификация стационарной точки неопределённа (то есть она может оказаться минимумом, максимумом или седловой точкой, а также слабым экстремумом, точкой, вблизи которой функционал точно постоянен или отличается от постоянного в более высоком порядке, чем второй). Например, в механике (и вообще в физике) кривая или поверхность стационарной потенциальной энергии означает равновесие, а вопрос, является ли она экстремалью, связан лишь с вопросом об устойчивости этого равновесия (который далеко не всегда важен). Траектории стационарного действия отвечают возможному движению, независимо от того, минимально действие на такой траектории, максимально, или седловидно. То же можно сказать о геометрической оптике, где любая линия стационарного времени (а не только минимального, как в простой формулировке принципа наименьшего времени Ферма) соответствует возможному движению светового луча неоднородной оптической среде. Есть системы, где вообще нет экстремалей, но стационарные точки существуют.

Способы нахождения условных экстремумов и условных стационарных точек (см. ниже) делают вариационное исчисление ещё более мощным орудием решения обеих задач.

Граничный член можно приравнять нулю[6], решив тем самым задачу нахождения вариационной производной (действительно, она по определению есть то, что стоит под интегралом в больших скобках, соответствовать определению мешает только граничный член). Объяснение факта равенства нулю граничного члена не слишком строго (см. примечание[6]), но ограничимся им, чтобы сосредоточить внимание на главном.

Пример в более общей записи: Пусть требуется найти вариационную производную функционала (предыдущий пример есть частный случай этого и может служить к нему иллюстрацией):

оставив граничный член стоящим отдельно. Граничный член можно приравнять нулю, как это описано и объяснено в частном примере выше, а также — более аккуратно — в отдельных параграфах ниже, посвященных отдельно вопросам, связанным с граничным членом.

В этом разделе рассматривается такой частный, но практически важный, случай применения обобщённых функций при решении вариационных задач, как использование дельта-функции Дирака.

Условным экстремумом называется экстремум не на всей области определения функции (функционала), а на определённом её подмножестве, выделяемом специально наложенным условием (или условиями). Обычно, речь идёт о выделении этим условием (условиями) подмножества области определения с меньшей размерностью, что для конечномерных областей имеет определённый наглядный смысл, но для бесконечномерных (каковы обычно области определения функционалов) налагаемые условия приходится рассматривать лишь абстрактно (что теоретически не мешает иметь в виду полезную аналогию с конечномерным случаем).

Рассмотрения заслуживает случай, когда налагаемое в виде равенства нулю (в общем случае, константе) неких других функционалов (одного или нескольких), или наложение на искомую функцию уравнения, которому она должна удовлетворять.

Основные виды задачи на условный экстремум, которые имеет смысл рассмотреть, таковы:

(Третий тип условия выписан здесь не в самом общем виде, но для наших целей этого достаточно.)

Таким образом, ключевой момент с точки зрения вариационного исчисления в нахождении условного экстремума третьего типа сводится к

Одним из основных классических результатов вариационного исчисления, имеющих огромное практическое значение, являются уравнения Эйлера — Лагранжа — дифференциальные уравнения, которым должна удовлетворять функция, являющаяся стационарной для довольно общего в своем классе и очень важного вида интегрального функционала (а значит и функция, на которой такой функционал достигает локального экстремума, также должна удовлетворять этим уравнениям).

Достаточно стандартным для получения уравнений Эйлера — Лагранжа является обычный путь с нахождением вариационной производной и приравнивании её нулю или практически совпадающий с ним способ выписывания вариации с использованием стандартных обозначений, как это описано выше.

Здесь же для расширения типов примеров приводится вывод уравнений Эйлера — Лагранжа с использованием производной функционала по направлению.

Для гладких функций вещественной переменной или конечномерного векторного аргумента максимум и минимум заданной функции может быть найден путём нахождения точек, в которых производная обращается в нуль (по крайней мере, это необходимое условие экстремума). Аналогично решение гладких задач вариационного исчисления может быть получено путём решения соответствующего уравнения Эйлера — Лагранжа.

Таким образом, экстремумом в нашей задаче являются отрезки прямых линий.

Уравнение Эйлера — Лагранжа является необходимым, но не достаточным условием наличия экстремума. Дополнительные условия формулируются отдельно.