Градиент функции от вектора - Курс школьной геометрии

Нахождение градиента вектор-функции

Дата публикации Oct 20, 2018

ВЧасть 1Нам поставили задачу: вычислить градиент этой функции потерь:

Чтобы найти градиент, мы должны найти производную функцию. ВЧасть 2мы научились вычислять частную производную функции по каждой переменной. Однако большинство переменных в этой функции потерь являются векторами. Возможность найти частную производную векторных переменных особенно важна, поскольку нейронная сеть работает с большими объемами данных. Векторные и матричные операции — это простой способ представления операций с таким большим количеством данных. Как именно вы можете найти градиент вектор-функции?

Содержание

Градиент скалярной функции
Представляющие функции
Градиент вектор-функции
Градиент функции идентичности
Градиент комбинаций вектор-векторных функций
Градиент векторных сумм
Градиент комбинаций векторных функций правила цепочки
Градиент функции онлайн
Производная по направлению, градиент функции: объяснение, примеры
Понятие производной по направлению
Примеры нахождения производной по направлению
Градиент функции

Градиент скалярной функции

Скажи, что у нас есть функция,f (x, y) = 3x²y, Наши частные производные:

Если мы организуем эти части в горизонтальный вектор, мы получимградиентизР (х, у), или∇ f (x, y):

6yxэто изменение вР (х, у)в отношении изменения вИкс, в то время как3x²это изменение вР (х, у)в отношении изменения вY,

Что происходит, когда у нас есть две функции? Давайте добавим еще одну функцию,g (x, y) = 2x + y⁸, Частные производные:

Таким образом, градиент g (x, y):

Представляющие функции

Когда у нас есть несколько функций с несколькими параметрами, часто полезно представлять их более простым способом. Мы можем объединить несколько параметров функций в один векторный аргумент,Иксэто выглядит следующим образом:

Следовательно,Р (х, у, г)станетF (x₁, x₂, x₃)который становитсяе (Икс).

Мы также можем объединить несколько функций в вектор, например так:

В настоящее время,у = F (X)гдеF (X)является вектором из [f₁ (Икс), f₂ (Икс), f₃ (Икс) . п (Икс)]

Для нашего предыдущего примера с двумя функциями,f (x, y) ⇒ f (Икс)а такжеg (x, y) ⇒ g (Икс).Здесь векторИкс= [x₁, x₂], гдеx₁ = х, а такжеx₂ = у, Чтобы упростить его еще больше, мы можем объединить наши функции: [f (Икс),г(Икс)] = [f₁ (Икс), f₂ (Иксзнак равноf (x) = y.

Зачастую количество функций и количество переменных будет одинаковым, поэтому для каждой переменной существует решение.

Градиент вектор-функции

Теперь, когда у нас есть две функции, как мы можем найти градиент обеих функций? Если мы организуем оба их градиента в одну матрицу, мы переместимся из векторного исчисления в матричное исчисление. Эта матрица и организация градиентов нескольких функций с несколькими переменными, известна какМатрица Якобиана,

Есть несколько способов представления якобиана. Этот макет, где мы укладываем градиенты по вертикали, известен какмакет числителя, но другие документы будут использоватьрасположение знаменателя, который просто переворачивает его по диагонали:

Градиент функции идентичности

Давайте возьмем функцию идентичности,у = ф (х) = х, гдеFi (Икс) = xiи найдите его градиент:

Так же, как мы создали наш предыдущий якобиан, мы можем найти градиенты каждой скалярной функции и сложить их вертикально, чтобы создать якобиан тождественной функции:

Поскольку это функция идентичности, f₁ (Икс) = x₁, f₂ (Икс) = х₂ и тд. Следовательно,

Частичная производная функции по переменной, которой нет в функции, равна нулю. Например, частная производная 2x² по y равна 0. Другими словами,

Поэтому все, что не на диагонали якобиана, становится равным нулю. Между тем, частная производная любой переменной по отношению к себе равна 1. Например, частная производнаяИксв отношенииИксравен 1. Следовательно, якобиан становится:

Градиент комбинаций вектор-векторных функций

Элементарные бинарные операторыявляются операциями (такими как сложениевес+Иксиливес>Икскоторый возвращает вектор единиц и нулей), который применяет оператор последовательно, начиная с первого элемента обоих векторов, чтобы получить первый элемент вывода, затем второго элемента обоих векторов, чтобы получить второй элемент вывода… и так далее.

Эта статья представляет поэлементные бинарные операции с такими обозначениями:

Здесь ◯ означает любой поэлементный оператор (например, +), а не композицию функций.

Итак, как вы находите градиент поэлементной операции двух векторов?

Поскольку у нас есть два набора функций, нам нужны два якобиана, один из которых представляет градиент относительноИкси один по отношению квес:

Большинство арифметических операций нам понадобятся простые, поэтомуе (ш)часто просто векторвес, Другими словами,Fi (Wi) = Wi, Например, операцияW + хподходит к этой категории, так как она может быть представлена каке (ж) + д (х)гдеfi (wi) + gi (xi) = wi + xi.

При этом условии каждый элемент в двух якобианах упрощается до:

На диагонали i = j, поэтому существует значение для частной производной. Вне диагонали, однако, i ≠ j, поэтому частные производные становятся равными нулю:

Мы можем представить это более кратко как:

Попробуем найти градиент функцииW + х, Мы знаем, что все вне диагонали равно 0. Значения частичных по диагонали относительновеса такжеИксявляются:

Итак, оба якобиана имеют диагональ 1. Это выглядит знакомо . это матрица тождеств!

Давайте попробуем это с умножением:ш * х, Значения частностей по диагонали относительновеса такжеИксявляются:

Следовательно, градиент по отношению квесизш * хявляетсяDiag (Икс)в то время как градиент по отношению кИксизш * хявляетсяDiag (вес).

Применяя те же шаги для вычитания и деления, мы можем суммировать все это:

Градиент векторных сумм

Одной из наиболее распространенных операций в глубоком обучении является операция суммирования. Как мы можем найти градиент функцииу = сумма (Икс)?

у = сумма (Икс)также может быть представлен как:

Следовательно, градиент может быть представлен как:

А так как частная производная функции по переменной, которой нет в функции, равна нулю, ее можно дополнительно упростить следующим образом:

Обратите внимание, что результатом является горизонтальный вектор.

Как насчет градиентау = сумма (Иксг)? Единственное отличие состоит в том, что мы умножаем каждый частный с константой, z:

Хотя это является производной по отношению кИкс, производная по скаляруZэто просто число:

Градиент комбинаций векторных функций правила цепочки

ВЧасть 2мы узнали о правилах цепей с несколькими переменными. Однако это работает только для скаляров. Давайте посмотрим, как мы можем интегрировать это в векторные вычисления!

Давайте возьмем векторную функцию,Yзнак равное(Икс)и найти градиент. Давайте определим функцию как:

И то и другоеf₁ (х)а такжеf₂ (х)являются составными функциями. Введем промежуточные переменные дляf₁ (х)а такжеf₂ (х)и переписать нашу функцию:

Теперь мы можем использовать наше правило цепочки переменных, чтобы вычислить производную вектораY, Просто вычислите производнуюf₁ (х)а такжеf₂ (х)и поместите их один над другим:

Вуаля! У нас есть наш градиент. Однако мы пришли к нашему решению со скалярными правилами, просто сгруппировав числа в вектор. Есть ли способ представить правило цепи с несколькими переменными для векторов?

Прямо сейчас наш градиент вычисляется с помощью:

Обратите внимание, что первый член градиентов обоихf₁ (х)а такжеf₂ (х)включает частичноеg₁надИкси второй член градиентов обоихf₁ (х)а такжеf₂ (х)включает частичноеg₂надИкс Это как умножение матриц! Поэтому мы можем представить это как:

Давайте проверим наше новое представление правила цепочки векторов:

Мы получаем тот же ответ, что и скалярный подход! Если вместо одного параметраИксу нас есть векторный параметрИкснам просто нужно немного изменить наше правило, чтобы получить полное правило цепочки векторов:

В нашем примере выше,еэто чисто функцияг; то есть,фиявляется функциейсолдатно нетGJ(каждая функцияесоответствует ровно 1 функцииг),В этом случае все вне диагонали становится равным нулю, и:

Теперь у нас есть все части, которые мы находим в градиенте нейронной сети, с которой мы начали нашу серию:

Проверять, выписыватьсяЧасть 4чтобы узнать, как вычислить его производную!

Если вы еще этого не сделали, прочитайте части 1 и 2:

ЧитатьЧасть 4для грандиозного финала!

Скачать оригинал статьиВот,

Если вам понравилась эта статья, не забудьте оставить несколько хлопков! Оставьте комментарий ниже, если у вас есть какие-либо вопросы или предложения 🙂

Градиент функции онлайн

Градиент функции — это вектор координатами которого являются частные производные этой функции по всем её переменным.

Градиент обозначается символом набла . Выражение градиента некоторой функции записывается следующим образом:

где , , — частные производные функции по переменным , , соответственно.

Вектор градиента указывает направление наискорейшего роста функции. Рассмотрим график функции .

Эта функция достигает своего единственного максимума в точке . График градиентного поля данной функции имеет вид:

Из данного градика видно, что в каждой точке вектор градиента направлен в сторону наискорейшего роста функции, т.е. в точку . При этом модуль вектора отражает скорость роста (крутизну подъёма) функции в этом направлении.

Задача вычисления градиента функции очень часто возникает при поиске эстремумов функции с использованием различных численных методов.

Наш онлайн калькулятор позволяет вычислить градиент практически любой функции как общем виде, так и в конкретной точке с описанием подробного хода решения на русском языке.

Производная по направлению, градиент функции: объяснение, примеры

Понятие производной по направлению

Понятие производной по направлению рассматривается для функций двух и трёх переменных. Чтобы понять смысл производной по направлению, нужно сравнить производные по определению

Рассматривая функцию одной переменной, мы выяснили, что на оси Oy отображается приращение функции f(x) , соответствующее приращению аргумента x . Если мы имеем дело с функцией трёх переменных, то приращения аргументов x , y , z отображаются на осях Оx , Оy , Оz . Сам собой напрашивается вопрос: а где можно отобразить приращение уже не аргументов, а функции трёх переменных?

И вот ответ на этот вопрос: приращение функции трёх переменных отображается на некоторой прямой, направление которой определяется вектором, произвольно заданным в задаче.

Если рассматривается функция двух или трёх переменных, то два или три измерения задают аргументы, а упомянутая прямая, на которой отображается приращение функции, — это ещё одно измерение и для его акцентирования назовём это измерение не третьим или четвёртым, а нулевым, следуя программистской традиции (в программировании отсчёт чаще начинается не с единицы, а с нуля).

Для того, чтобы перейти к строгому математическому определению производной по направлению, нужно рассмотреть:

1) функцию u = f(M) , определённую в окрестности точки M с координатами x , y , z ;

Через точку M проводим прямую, одно из двух возможных направлений которых совпадает с направлением вектора l . На получившейся прямой отметим точку M 1 , координаты которой образуют суммы координат точки M и приращений соответствующих аргументов функции трёх переменных:

Величину отрезка MM 1 можно обозначить .

Функция u = f(M) при этом получит приращение

Определение производной по направлению. Предел отношения при , если он существует, называется производной функции u = f(M) по направлению вектора l и обозначается , то есть

Формула, которой нужно пользоваться для нахождения производной по направлению, следующая:

Смысл этой формулы: производная по направлению является линейной комбинацией частных производных, причём направляющие косинусы показывают вклад в производную по направлению соответствующей частной производной.

Примеры нахождения производной по направлению

Пример 1. Найти производную функции в точке M 0 (1; 2; 3) по направлению вектора .

Найдём направляющие косинусы, пользуясь определением скалярного произведения векторов:

Теперь можем найти производную по направлению данной функции по её формуле:

А сейчас — домашнее задание. В нём дана функция не трёх, а лишь двух переменных, но несколько иначе задан направляющий вектор. Так что придётся вновь повторить векторную алгебру.

Пример 2. Найти производную функции в точке M 0 (1; 2) по направлению вектора , где M 1 — точка с координатами (3; 0) .

Вектор, задающий направление производной, может быть дан и в такой форме, как в следующем примере — в виде разложения по ортам координатных осей, но эта хорошо знакомая тема из самого начала векторной алгебры.

Пример 3. Найти производную функции в точке M 0 (1; 1; 1) по направлению вектора .

Решение. Найдём направляющие косинусы вектора

Найдём частные производные функции в точке M 0 :

Следовательно, можем найти производную по направлению данной функции по её формуле:

Градиент функции

Градиент функции нескольких переменных в точке M 0 характеризует направление максимального роста этой функции в точке M 0 и величину этого максимального роста.

Как найти градиент?

Нужно определить вектор, проекциями которого на оси координат являются значения частных производных , , этой функции в соответствующей точке:

То есть, должно получиться представление вектора по ортам координатных осей, в котором на каждый орт умножается соответствующая его оси частная производная.

Для градиента функции двух переменных формула короче:

Пример 4. Найти градиент функции в точке M 0 (2; 4;) .

Решение. Найдём частные производные функции в точке M 0 :

Следовательно, можем записать искомый градиент данной функции: