신경망에서는 학습 시 최적의 매개변수(가중치와 절편)를 찾아내야 한다. 여기서 최적이란 손실함수가 최솟값이 될 때를 말한다. 그러나 일반적인 문제의 손실함수는 매우 복잡하기에 어디가 최솟값이 되는 곳인지 짐작할 수 없다. 이때 기울기를 사용하는 것이 경사법(경사 하강법)이다. 그러나 기울기가 가리키는 곳에 정말 함수의 최솟값이 있는지는 보장할 수 없다. 실제로 복잡한 함수에서는 기울기가 가리키는 방향에 최솟값이 없는 경우가 대부분이다. 꼭 최솟값을 가리키지는 않지만 그 방향으로 가야 함수의 값을 줄일 수 있다. 그래서 기울기 정보가 필요한 것이다. # 경사법 경사법은 현 위치에서 기울어진 방향으로 일정 거리만큼 이동한다. 그런 다음 이동한 곳에서도 기울기를 구하고, 또 그 기울어진 방향으로 나아가기를 반..