데이터 경진대회

LG aimers 3기 후기

wiojfe 2023. 8. 31. 05:19

   8월 1일부터 진행된 데이콘 대회에 참여했다. 오프라인 대회에 진출하려면 대략 상위 30팀에 속해야 하는데 내가 속한 팀은 50위권 밖이었다. 처음 나가보는 대회이기도 하고 시계열 데이터를 다뤄본 경험이 없어서 조금 막막했다. 팀은 총 5명으로 구성되었고 전부 모르는 사이었다가 이번 대회를 참가하기 위해 모이게 된 것이다. 사실 처음에 구성된 팀의 인원 중 3명이 팀을 만들고 나서 개인사정으로 모두 그만 두었다. 내용이 너무 어려워서 팀에 민폐가 될 거 같아서 포기했다. 애초에 수상을 노리고 구성된 팀도 아니고 같이 참여하면서 공부하고 배워나가고자 하는 목표로 구성된 팀이라 그냥 그대로 진행해도 되는데 아쉬웠다. 결국 새로 3명의 팀원을 구해서 총 5명이 한 팀이 되었다. 

   초반에는 데이터의 분석 및 EDA를 위주로 프로젝트를 진행했다. 2022년과 2023년 4월까지의 판매량 데이터와 판매 매출 데이터에 중점을 두고 분석했다. 요일별 판매량 변화, 월별 판매량 변화, 주별 판매량 변화를 알아보려고 노력했다. 대략적으로 파악한 바로는 생필품에 대한 판매량 데이터이라서 목,금요일에 제일 판매량이 높았고 주말과 월요일은 비교적 판매량이 적었다. 어떤 상품은 여름에 (더운 날에) 많이 팔리는 계절성을 띄기도 했고 연휴의 선물용도로 많이 알려진 품목들은 연휴 부근에 판매량이 높아지기도 했다. 

  

   아쉬운 점 : 

  •  매주 1번은 오프라인으로 만나기로 계획했었지만 하필 만나기로 계획한 첫 날에 태풍으로 인해 온라인으로 변경되었다. 그리고 나서 잘 친해지지 못 해서 그 이후로도 온라인 미팅만 진행되었다.  그 과정에서 팀원들도 계속 바뀌고 어수선하여 많이 친해지지 못 하고 얼굴도 보지 못하고 끝났다. 변명이라 느낄 수도 있지만 이 부분이 개선되었으면 더 좋은 성적을 얻을 수도 있었을 거 같다.
  •   머신러닝 환경 구축에 시간이 걸린 점이 아쉬웠다. 데이터 양이 많아서 모델 훈련을 위해서 성능이 어느정도 괜찮은 gpu가 필요했는데 괜찮은 컴퓨터를 갖추고 있었던 팀원이 2명이어서 초반에 여러 모델들을 적용할 시간을 흘려보냈다. 뒤늦게 내가 컴퓨터를 구매했으나 처음에 가상환경인 wsl을  이용해서 모델을 실행해보려다가 메모리 부족으로 인해서 다시 시간을 낭비했다. 그래서 나중에는 뒤늦게 리눅스 운영체제로 바꿔서 진행하게 되었다.