AWS/AWS 정보

AWS Forecast를 활용해 월마트 매출 예측해보기(1)

chamu 2022. 6. 2. 15:00

오늘 저는 Kaggle에서 진행했던 월마트의 Sales Forecasting 챌린지 데이터로 월마트의 매출을 예측해보도록 하겠습니다.  

 

AWS Forecast란?

라스베가스에서 열린 AWS re:Invent 2018에서 발표된 서비스입니다. 컨셉은 “머신러닝 지식이 없어도 누구나 프로그래밍 없이 미래 데이터를 예측할 수 있다”입니다. 또한, amazon.com에서 실제로 사용하고 있는 검증된 알고리즘을 사용할 수 있다는 장점이 있습니다. 

 

Forecast 사용방법은 아주 간단합니다. 아래 3단계만 수행하시면 됩니다

1. 데이터 준비   2. AI 가 학습   3. 미래를 예측

 

 저희는 문제와 답안이 적힌 문제집을 준비하고, AI가 이 문제집을 보면서 문제만 넣으면 답을 알려주는 model을 생성합니다. 저희는 이 모델로 새로운 문제를 넣었을 때 답안이 맞는지 확인하면 되는 것입니다.

 

AWS Forecast의 장점

1.      예측의 정확도를 높이기 위한 메타, 관련 데이터들을 추가적으로 넣을 수 있습니다. (하이퍼파라미터도 조정가능)

2.     계절, 공휴일, 할인행사, 브랜드와 같은 외부 요인 반영이 용이합니다.

3.     이전데이터가 없는 새로운 제품의 수요예측이 가능합니다.

4.     아마존 닷컴에서 사용하고 있는 알고리즘을 구현없이 사용 가능합니다.

 

 

그렇다면 무엇을 예측할 것인가?

 

 

미래 데이터를 예측하기 위해선 어떤 데이터가 필요할까요? 답은 과거 데이터일 것입니다. (100%는 아니겠지만요..) 과거를 보고 미래를 예측하기 때문이죠.  그렇기에 Forecast는 시계열 데이터만 예측이 가능합니다.

시계열데이터는 일정시간 간격으로 발생하는 데이터를 의미합니다. 옆의 그림은 시계열 데이터를 시간의 흐름에 따라 그린 그래프입니다. 육안으로 봐도 데이터의 패턴이 보입니다.  이처럼 시계열 데이터의 예측은 과거의 패턴을 기반으로 미래를 예측하게 됩니다.

 

 

그런데 중간중간 튀는 데이터들을 예측하는 것은 쉽지 않습니다. 프로모션이나 공휴일 같은 경우는 판매가 증가하게 되는데요. Forecast는 이런 영향인자를 고려한 최적의 모델을 제공합니다.

 

계열 데이터를 통해 AWS Forecast는 다음과 같은 예측을 할 수 있습니다.

 

 

- 웹사이트나 오프라인매장의 상품 수요 예측

- 공장이나 창고관리 시 원자재 재고 및 수요 예측

- 서버 트래픽, 홈페이지 웹트래픽, AWS 사용량 예측 

- 콜센터 직원 수, 매장 판매원, 계약직원 등 Human Resource 예측 

- 수익이나 판매같은 현금흐름 예측

 

자 이제 무엇을 예측할 지 정하셨나요?

다음장부터는 본격적으로 Forecast를 사용해보며 매출예측 해보겠습니다.