сформулируй основную лемму вариационного исчисления, почему для функций множителей требуется гладкость как минимум второго порядка, для какого типа локального минимума (сильного или слабого) применимо необходимое условие первого порядка в задачах вар.исчисления, запиши само это условие, объясни конкретно почему
답변
Ниже — в классической постановке вариационного исчисления (интегральные функционалы и гладкие допустимые функции).
1) Основная (фундаментальная) лемма вариационного исчисления
Фундаментальная лемма (Дю Буа–Реймона / “основная лемма”).
Пусть g∈C([a,b]). Если
Почему это верно (конкретно): если бы существовала точка x0 с g(x0)>0, то по непрерывности g>0 в некоторой окрестности x0. Берём неотрицательную “бугорок”-функцию η≥0, поддержка которой лежит в этой окрестности, и η≡0. Тогда ∫gη>0, противоречие. Аналогично исключается g(x0)<0. Значит g≡0.
2) Почему нужна гладкость минимум второго порядка (и при чём тут множители)
Рассмотрим стандартный функционал первого порядка:
J[y]=∫abF(x,y(x),y′(x))dx,y(a)=A,y(b)=B.
При выводе условия 1-го порядка берут вариацию yε=y+εη и считают производную:
dεdJ[y+εη]ε=0=∫ab(Fyη+Fy′η′)dx.
Дальше делают интегрирование по частям:
∫abFy′η′dx=[Fy′η]ab−∫abdxd(Fy′)ηdx.
Граничный член исчезает из-за η(a)=η(b)=0. Остаётся интеграл с dxd(Fy′).
Где появляется «второй порядок»
Так как Fy′=Fy′(x,y(x),y′(x)), то по цепному правилу
dxd(Fy′)=Fxy′+Fyy′y′+Fy′y′y′′,
то есть появляется y′′. Чтобы всё это было обычными (классическими) функциями и чтобы интегрирование по частям было корректным в “гладком” смысле, часто требуют y∈C2 (минимально можно ослаблять до абсолютной непрерывности и т.п., но в классической теории — C2).
А почему “функции-множители” требуют такой же гладкости
В задачах с точечными/дифференциальными связями вводят функцию-множитель Лагранжаλ(x) и рассматривают расширенный интегранд, например:
F~(x,y,y′,λ)=F(x,y,y′)+λ(x)g(x,y,y′).
Тогда в уравнении Эйлера–Лагранжа для y появляется
если задача высшего порядка (зависимость от y′′, интегрирование по частям делается два раза), то аналогично возникают λ′′ и требуется λ∈C2.
Идея одна: мы дифференцируем по x выражения, где сидит множитель, поэтому чтобы уравнения были “классическими” (без обобщённых производных), множитель должен быть достаточно гладким — обычно не ниже того порядка, который появляется после интегрирования по частям (для функционалов первого порядка в классическом виде обычно берут C2 для экстремали и аналогичную гладкость для функций-множителей, если они входят под производную).
3) Для какого типа локального минимума применимо условие 1-го порядка
Обычно формулируют так:
Слабый локальный минимум: минимум в окрестности по норме C1 (малость и функции, и её производной).
Сильный локальный минимум: минимум в окрестности по норме C0 (малость только по значению функции).
Необходимое условие первого порядка (нулевая первая вариация / Эйлер–Лагранж) гарантированно выводят для слабого локального минимума.
Почему конкретно: в доказательстве рассматривают семейство y+εη и надо, чтобы при малых ε оно оставалось в допустимом классе, где функционал определён и дифференцируем (обычно это C1). Контроль по C1 как раз и означает “малость вариации” в том смысле, в котором берётся производная функционала.
При этом сильный минимум обычно тоже влечёт то же условие (потому что если минимум верен для всех достаточно близких по C0 функций, то, в частности, верен и для близких по C1, а значит первая вариация тоже должна обращаться в нуль). Но “стандартная” теорема и техника — именно про слабый минимум.
4) Само необходимое условие 1-го порядка
В форме первой вариации
Если y∗ — слабый локальный минимум, то для любой вариации η с η(a)=η(b)=0:
δJ[y∗;η]:=dεdJ[y∗+εη]ε=0=0.
Эквивалентно: уравнение Эйлера–Лагранжа
Если F достаточно гладкая, то y∗ удовлетворяет на (a,b):
Fy(x,y∗(x),y∗′(x))−dxd(Fy′(x,y∗(x),y∗′(x)))=0.
Почему “именно так” (конкретно цепочка логики):
При минимуме функция ϕ(ε)=J[y∗+εη] имеет минимум в ε=0 ⇒ ϕ′(0)=0.
Интегрируем по частям, чтобы избавиться от η′, и используем η(a)=η(b)=0.
Получаем ∫(Fy−dxdFy′)ηdx=0 для всех η.
По фундаментальной лемме множитель при η обязан быть нулём ⇒ Эйлер–Лагранж.
Если хочешь, могу отдельно расписать тот же вывод для случая с ограничениями и функцией-множителем λ(x) (и показать, где именно появляются λ′ и при каких связях появляется λ′′).