인공지능/Deep Learning6 [DL] LSTM으로 전력 사용량 예측하기 (데이콘) - 단일 변수 https://uely.tistory.com/104 [EDA] 전력 사용량 시계열 데이터 분석하기 (데이콘) https://dacon.io/competitions/official/236125/data 2023 전력사용량 예측 AI 경진대회 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io 데이콘에서 진행한 전력 사용 uely.tistory.com EDA해보았던 데이콘 전력 사용량 예측에 LSTM을 적용해볼 것이다. 데이터셋과 가장 기본적인 구조를 갖춘 LSTM 모델 코드를 데이콘에서 제공하고 있다. 데이터 중에 전력 사용량만을 이용해서 예측하는 단일 변수 기반 시계열 예측을 수행해보겠다. (다변량은 다음 시간에) 우선 필요한 라이브러리를 impor.. 2023. 11. 26. [DL] LSTM(Long Short-Term Memory) LSTM이란? RNN은 결정적 단점이 있다. 가중치가 업데이트되는 과정에서 기울기가 1보다 작은 값이 계속 곱해지면 기울기가 사라지는 기울기 소멸 문제가 발생한다. 또한, 일반적으로 기본 순환층은 긴 시퀀스를 학습하기 어렵다. 시퀀스가 길수록 은닉 상태에 담긴 정보가 점차 희석되기 때문이다. 따라서 멀리 떨어져 있는 단어 정보를 인식하는 데 어려울 수 있다. 이러한 문제를 해결하기 위해 게이트 구조를 사용하여 정보를 장기간 기억하기 위해 고안되었다. LSTM에서 사용되는 각 게이트에 대해 알아보자. 망각 게이트 망각 게이트(forget gate)는 과거 정보를 어느 정도 기억할지 결정한다. 과거 정보와 현재 데이터를 입력받아 시그모이드를 취한 후 그 값을 과거 정보에 곱해준다. 따라서 시그모이드의 출력이.. 2023. 11. 12. [DL] RNN으로 IMDB 리뷰 분류하기+단어 임베딩 순환 신경망을 영화 리뷰 데이터셋에 적용해서 리뷰를 긍정과 부정으로 분류해 볼 것이다. 데이터셋을 단어 임베딩으로 변형하여 순환 신경망에 주입해볼 것이다. IMDB 리뷰 데이터셋은 imdb.com에서 수집한 리뷰를 감상평에 따라 긍정과 부정으로 분류해놓은 데이터셋이다. 총 50,000개의 샘플로 이루어져 있고 훈련 데이터와 테스트 데이터에 각각 25,000개씩 나누어져 있다. 텍스트 데이터의 경우, 단어를 숫자 데이터로 바꾸는 일반적인 방법은 데이터에 등장하는 단어마다 고유한 정수를 부여하는 것이다. 정숫값 사이에는 어떤 관계도 없다. 일반적으로 영어 문장은 모두 소문자로 바꾸고 구둣점을 삭제한 다음 공백을 기준으로 분리한다. 이렇게 분리된 단어는 토큰이라고 한다. (한글은 조사가 발달되어 있기에 공백이.. 2023. 11. 5. [DL] RNN(Recurrent Neural Network : 순환 신경망) RNN이란? 다층 신경망의 각 층의 출력이 자기 층의 입력으로 그대로 돌아오는 것처럼 자기 루프(self-loop)를 추가하는 것 위의 그림처럼, 어떤 샘플을 처리할 때 바로 이전에 사용했던 데이터를 재사용한다. A, B, C 3개의 샘플을 처리하는 순환 신경망이 있다고 가정할 때, O는 출력된 결과. 첫 번째 샘플 A를 처리하고 난 출력(OA)이 다시 뉴런으로 돌아간다. 이 출력에는 A에 대한 정보가 다분히 들어있다. 그 다음 B를 처리할 때 앞에서 A를 사용해 만든 출력 OA를 함께 사용한다. 따라서 OA와 B를 사용해서 만든 OB에는 A에 대한 정보가 어느 정도 포함되어 있을 것이다. 그다음 C를 처리할 때는 OB를 함께 사용한다. 이렇게 OC에는 B와 A에 대한 정보가 담겨 있고, A에 대한 정보.. 2023. 11. 3. [DL] CNN으로 CIFAR10 dataset 분류하기 CIFAR10에서 제공하는 컬러 이미지를 분류해 볼 것이다. dataset에 대한 내용은 아래를 참고하자. https://www.cs.toronto.edu/~kriz/cifar.html CIFAR-10 and CIFAR-100 datasets < Back to Alex Krizhevsky's home page The CIFAR-10 and CIFAR-100 are labeled subsets of the 80 million tiny images dataset. They were collected by Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton. The CIFAR-10 dataset The CIFAR-10 dataset consists of 60000 www.c.. 2023. 9. 21. [DL] CNN(Convolutional Neural Network : 합성곱 신경망) CNN이란? 주로 이미지나 영상 데이터를 처리할 때 사용되는 딥러닝 알고리즘이다. 영상 및 시계열 데이터에서 주요 특징을 찾아내고 학습하기 위한 최적의 아키텍쳐를 제공한다. CNN은 이미지를 인식하는 분류기이다. 분류를 위해 특징 추출을 하는 부분과 분류기 부분으로 나뉜다. 특징 추출에서 CNN의 가장 큰 특징은 반복되는 합성곱 층과 풀링 층이다. Convolution Layer (합성곱 층) 합성곱 층이란 이미지에 커널(필터)를 적용해서 이미지의 특징을 추출하는 역할을 담당하는 층이다. 이해를 돕기 위해 입력 데이터와 커널이 다음과 같이 주어졌을 때의 움직임을 살펴봅시다. 특징맵은 왼쪽 윗부분부터 입력 데이터와 대응하는 커널의 요소끼리 곱셈한 결과의 총합으로 계산된다. 합성곱 층에서는 입력 데이터의 크.. 2023. 9. 18. 이전 1 다음