Distribution shift
·
Study/ML | DL
보호되어 있는 글입니다.
Transformer
·
Study/ML | DL
보호되어 있는 글입니다.
CNN
·
Study/ML | DL
보호되어 있는 글입니다.
MLE vs MAP
·
Study/ML | DL
보호되어 있는 글입니다.
[CS231n 6강 정리본] Training Neural Networks I
·
Study/CS231n
Lecture 6 : Training Neural Networks I 0) Intro이번 강의에서는 Neural Networks의 학습에 대해 다룰 것이다. 목차는 다음과 같다.NN 학습을 시작할 때 필요한 기본 설정은 다음과 같다.1. One time setup : activation functions, preprocessing, weight initialization, regularization, gradient checking2. Training dynamics : babysitting the learning process, parameter updates, hyperparameter optimization3. Evaluation : model ensembles1) Activation Functio..
[CS231n 5강 정리본] Convolutional Neural Networks
·
Study/CS231n
Lecture 5 : Convolutional Neural Networks0) Intro이번 강의에서는 Convolutional Neural Network가 어떻게 작동하는지 살펴 볼 것이다.CNN이 어떻게 동작하는지에 대해서만 간단하게 언급할 예정지난 강의에서는, Fully Connected Layer를 다루었다.입력으로 32*32*3 크기의 이미지가 있을 때, 이 이미지를 길게 펼쳐서 3072 차원의 벡터로 만들고 가중치 W와 곱하였다.그러고 이 Layer의 출력인 activation을 얻었다. 1) Convolution LayerConvolution Layer와 기존의 FC Layer의 주된 차이점은, Convolution Layer는 기존의 구조를 보존시킨다는 것이다.기존의 FC Layer가 입력..
[CS231n 4강 정리본] Backpropagation and Neural Networks
·
Study/CS231n
Lecture 4 : Introduction to Neural Networks1) Backpropagation이번 강의에서는 임의의 복잡한 함수를 통해 어떻게 analytic gradient를 계산하는지에 대해 다룰 것이다.computational graph라고 부르는 프레임워크를 사용할 예정.그래프의 각 노드는 연산 단계를 나타냄Computational graph를 사용해서 함수를 표현하게 됨으로써, backpropagation이라고 부르는 기술을 사용할 수 있게 된다.backpropagation은 gradient를 얻기 위해 computational graph 내부의 모든 변수에 대해 chain rule을 재귀적으로 사용한다. 간단한 예시를 통해 이해해보자.강의에서는 위 예시에 대해 길게 설명하기도 ..
[CS231n 3강 정리본] Loss Functions and Optimization
·
Study/CS231n
Lecture 3 : Loss Functions and Optimization 0) Intro지난 강의에서는, 선형분류기에서 행렬 W를 어떻게 만드는지 언급하지 않았다.위와 같이 학습된 선형분류기의 경우, input image는 Cat이지만 Dog의 Score가 437.9로 가장 높았다. 즉 Cat 이미지를 보고 Dog일 것으로 판단하고 있다는 것이다. 이는 좋은 결과가 아니며, 이러한 문제를 개선하기 위해서는 현재 모델이 얼마나 training data에 대해 잘 학습하지 못했는지 정량화할 수 있는 기준이 필요하다. (Loss function) 기준을 정한 후에는, 그 기준을 바탕으로 '잘 학습하지 못한 정도'를 최소화해야 한다. 즉, 모델이 training data의 경향성을 가장 잘 나타내게 하는..
[CS231n 2강 정리본] Image Classification
·
Study/CS231n
Lecture 2 : Image Classification1) 이미지 분류는 왜 어려운가?컴퓨터 비전 분야에서 Image Classification은 가장 중심적인 과제이다. CS231n에서는 주로 이를 위주로 다룰 예정이다.컴퓨터가 할 일 : 이미지를 보고 그 이미지가 어떤 카테고리에 속할 지를 고르는 것. 인간의 시각체계로는 너무나 쉬운 일이지만, 컴퓨터에게는 쉬운 일이 아니다.컴퓨터는 이미지를 픽셀 값들의 거대한 숫자 배열로 볼 뿐이다. 고양이를 찍는 카메라의 각도가 살짝 달라지거나, 조명이 바뀌거나, 고양이가 자세를 조금만 바꾸어도 픽셀 값들은 완전히 달라진다. 하지만 우리는 여전히 이것이 '고양이'임을 알 수 있다.이처럼 기계에게는 픽셀 수준의 큰 변화가 의미적으로는 동일한 상황임을 이해하기 어..
[CS231n 1강 정리본] Introduction to CNN for Visual Recognition
·
Study/CS231n
CS231n은 스탠포드 대학에서 대학원생 대상으로 개설한 컴퓨터 비전 강의이다.내가 강의를 다시 시청하지 않고도 그 내용을 기억할 수 있도록, 강의를 수강 후 전반적인 내용을 이곳에 정리할 예정이다.일단 빠르게 강의의 큰 흐름을 이해하는 것이 목표이기 때문에 한국어 자막을 적극 활용하기로 했다. 추후 꼭 원어로 다시 시청하기로 다짐해본다. Lecture 1 : Introduction to Convolutional Neural Networks for Visual Recognition 1강은 워낙 쉬운 내용이고 introduction 느낌이 강해서.. 길게 주절주절 쓰기 보다는 llm을 이용해서 핵심 키워드만 간단하게 정리했다. 0) 핵심 요약왜 비전? 이미지·영상은 인터넷의 주요 데이터지만, 기계가 이..