В задаче QR разложения докажи что вектор b_i (полч...
Creato il: 20 marzo 2025
Creato il: 20 marzo 2025
В задаче QR разложения докажи что вектор b_i (полчены ортогонализацией грамма шмидта) имеют строго положительную норму
Ниже приведена стандартная идея доказательства того, что на каждом шаге ортогонализации Грама–Шмидта очередной вектор (до нормировки) не вырождается в ноль и, следовательно, имеет строго положительную норму.
Пусть дан набор линейно независимых векторов
(или из любого другого векторного пространства над полем , где определено скалярное произведение).
Последовательность векторов в классическом методе Грама–Шмидта строится по формулам:
Начинаем с
На -м шаге (при ) «вычитаем проекции» на уже построенные векторы :
Здесь — скалярное произведение (евклидово в ).
Затем в классической QR-факторизации вектор получается нормировкой :
Для того чтобы было определено, необходимо . Поэтому важно показать, что , то есть на каждом шаге.
Линейная независимость исходных векторов.
По условию задачи векторы — линейно независимы. Это означает, что если
(нулевой вектор), то все .
Если , тогда выражается через предыдущие векторы .
Предположим, что на -м шаге (где ) получилось . Из определения:
Это означает
Но каждый сам является линейной комбинацией (по построению на предыдущих шагах). Следовательно, оказался линейной комбинацией .
Однако по условию — линейно независимы. Прийти к тому, что выражается через предыдущие , значит противоречить этой независимости.
Вывод: .
Поскольку предположение привело к противоречию, заключаем, что на самом деле . А значит, (его норма строго положительна).
Нормировка и .
Таким образом, вектор корректно определён, и метод Грама–Шмидта завершается без вырождения на каждом шаге.
Если бы на -м шаге алгоритма Грама–Шмидта возник нулевой вектор , это означало бы, что является линейной комбинацией предыдущих векторов , что противоречит линейной независимости исходного набора.
Итог: Поскольку для всех , векторы имеют строго положительную норму и, следовательно, в методе Грама–Шмидта всегда можно корректно перейти к ортонормированным векторам .
В преобразовании хаусхолдера покажи, как могло случится что u* = 0 и что это значит геометрически. Здесь u* = x +- ||x||_2 e_1
Ниже кратко изложено, в каких обстоятельствах при построении преобразования Хаусхолдера может получиться вектор и что это означает с геометрической точки зрения.
Пусть мы хотим «отразить» (преобразовать) вектор так, чтобы он стал параллелен базисному вектору . Обычно выбирают
Затем задают
после чего строят матрицу Хаусхолдера
Это отражение в гиперплоскости, задаваемой ортогонально вектору , и оно переводит в .
Рассмотрим формулу
Случай .
Предположим, что уже совпадает по направлению (но не обязательно по знаку) с базисным вектором . Тогда:
Аналогично, если и мы выберем «» в формуле.
Таким образом, главная причина, почему может получиться, — это когда исходный вектор уже «лежит» на прямой, заданной , и мы берём неподходящий знак в .
Отсутствие необходимости «отражать».
Если уже параллелен и мы выбираем именно тот знак, который полностью компенсирует добавлением/вычитанием , это означает, что мы «пытались» построить отражение, которое… не нужно.
Геометрически это означает, что преобразование Хаусхолдера, предназначенное «сдвинуть» на ось, фактически вырождается в тождественное отображение (или не определено через данную формулу, так как нормировать нулевой вектор невозможно).
Отражение, которое превращается в тождественную матрицу.
Если , мы не сможем построить нужный . Формально «матрица Хаусхолдера» перестаёт иметь смысл, так как знаменатель равен нулю. Но в таком случае нам вообще и не нужно никакое отражение: вектор уже там, где мы хотели его получить (на оси, задаваемой ). Говоря проще, отражение «не нужно», и естественным преобразованием для «уже нужного» вектора является просто тождественное.
Таким образом, указывает на то, что вектор уже лежит по направлению (или строго противоположен направлению) выбранного эталонного вектора , и никакого «реального» отражения в данном шаге фактически не требуется.
Покажи, что в QR разложении выполнено равенство P_1^TP_2^TP_3^TP_4^TR*=QR, где A матрица 54, Q оьразовано первыми четырьмя столбцами матрицы P_1^TP_2^TP_3^TP_4^T, R оьразовано первыми четырьмя строками R
Ниже изложена стандартная схема (и идея её доказательства) того, что, если матрица имеет размер и мы последовательно строим четыре преобразования Хаусхолдера (каждое из них размера ), то в конечном итоге получается разложение вида
где:
Обычно для получения «стандартного» -разложения размером (то есть где имеет размер , а — ), делают так:
Нужно показать, что тогда
Именно это равенство означает, что если мы «урежем» справа произведение до первых четырёх столбцов (т. е. возьмём ) и «урежем» сверху до первых четырёх строк (т. е. возьмём ), то их произведение даёт тот же результат, что и умножение полноразмерных . Ниже — основной контур этого доказательства.
На каждом шаге отражения Хаусхолдера (скажем, , затем , и т. д.) умножаются слева на текущую матрицу:
причём и есть та самая «почти верхнетреугольная» матрица, которую мы обозначаем за .
Тогда ясно, что
Отсюда перепишем «справа»:
Обозначим для удобства
Тогда .
Каждая матрица ортогональна (так как это отражение Хаусхолдера), следовательно . Поэтому и ортогональна, но полная размерность её — .
Матрица . Берём первые четыре столбца из (то есть выбрасываем последний, 5-й столбец). Поскольку — -матрица, результат будет -матрица, что и нужно для искомого .
Матрица . Берём первые четыре строки из . Так как — -матрица, её верхние четыре строки образуют матрицу , что и есть искомое .
То есть:
Говоря формально,
где — 5-й столбец , а — 5-я строка .
Рассмотрим покомпонентно произведение
Умножение блоков здесь даёт:
Нужно показать, что второй блок на самом деле даёт вклад, который «зануляется» именно в тех местах, где могла бы быть разница (по сути, нижние строки и/или правые столбцы).
В классическом пошаговом построении (четырьмя отражениями) к моменту применения четвёртого отражения у нас уже обнулены нужные «поддиагональные» элементы, поэтому вектор либо является нулевым (если мы реально получили строго верхнетреугольную матрицу 5×4), либо таков, что при умножении эти «лишние» элементы не влияют на первые 4 строки и 4 столбца результирующего произведения.
Другими словами, в стандартном алгоритме Хаусхолдера после последнего шага «хвостовые» элементы (в пятой строке и за пределами первых 4 столбцов) уже не затрагивают блок , и в итоге
С учётом же полной размерности получается именно равенство матриц (правая часть есть произведение ).
Коротко: при умножении «лишний» пятый столбец и пятая строка даёт нулевой вклад там, где формируется «блок» размера . Именно поэтому можно свободно заменить (урезая один столбец) и (урезая одну строку), сохранив то же произведение.
Таким образом, мы получили, что
Фактически это и говорит, что
и есть искомое -разложение размера .
Докажи единственность QR разложения
Ниже сформулировано и доказано классическое утверждение о том, что QR-разложение матрицы (при некоторых стандартных соглашениях, например, о знаках диагональных элементов ) однозначно. Для упрощения будем рассматривать случай, когда имеет полный столбцовый ранг и размер ().
Пусть матрица имеет полный столбцовый ранг, то есть . Предположим, что существуют два разложения:
где
Тогда, если мы дополнительно наложим требование, что диагональные элементы и положительны (или, по крайней мере, неотрицательны) по диагонали, получаем, что
В частности, это показывает единственность разложения (при фиксированном выборе знаков или неотрицательности на диагонали ).
Без условия о знаках (или неотрицательности) диагональных элементов в возникает двусмысленность в виде диагональных матриц (см. ниже).
Пусть мы имеем два разложения одной и той же матрицы :
Тогда
Домножаем слева на .
Получим
Так как , то левая часть упрощается:
Итак,
Аналогично, можно домножить справа на (эта матрица обратима, поскольку верхнетреугольна с ненулевой диагональю — полный столбцовый ранг исключает нулевые диагональные элементы). Тогда
Итак,
Из (2) видно, что
Тогда
Отсюда:
Но — это -матрица, являющаяся ортогональной, так как и имеют ортонормированные столбцы. Значит,
Одновременно из (1) имеем:
Но и — обе верхние треугольные. Тогда и (или ) автоматически должна быть верхнетреугольной и ортогональной.
Матрица , будучи одновременно верхней треугольной и ортогональной, непременно должна быть диагональной. Действительно, рассмотрим любую нетривиальную верхнетреугольную матрицу . Если она ещё ортогональна, то все внедиагональные элементы должны обращаться в ноль. Иначе не соблюдалась бы норма столбцов/строк.
Значит,
и каждая , так как для ортогональной диагональной матрицы длина каждого столбца должна быть 1, следовательно .
Таким образом, мы находим
Аналогично, из получаем
Отсюда и следует, что без дополнительного условия (например, «диагональные элементы неотрицательны») QR-разложение определено с точностью до знаков на диагонали. То есть:
Но если мы оговариваем (как это принято в большинстве реализаций), что диагональные элементы матрицы строго положительны (или неотрицательны), то матрица вынужденно становится единичной (так как переключение знака на диагонали противоречило бы условию на ). В этом случае
Итак, при выбранном соглашении о знаке диагонали факторизация единственна.