EDA
-
탐색적 데이터 분석(Exploratory data analysis, EDA) 알아보기Machine learning 2024. 2. 7. 00:53
머신러닝 프로젝트를 진행한다면, 탐색적 데이터 분석을 무조건 해야 한다. (보통 EDA라고 한다) 특히, 비정형보다 정형 데이터인 경우, 모델이 데이터 전처리의 영향을 많이 받으므로 더 중요한 편이다. 하지만 EDA는 데이터나 상황에 따라 방법이 달라지기 때문에 정해진 길이 없다. 다만 나름의 경험을 바탕으로 EDA의 필수요소들에 대한 글을 작성하려고 한다. EDA란 EDA란 데이터 이해를 위해 여러 측면에서 데이터를 확인하는 작업이다. 이러한 작업은 데이터에 대한 새로운 통찰을 주거나, 모델링 전략의 기초 정보가 된다. EDA의 목적 EDA의 목적은 아래 4가지 정도로 정리할 수 있다. 데이터 자체에 대한 이해 (프로젝트에 대한 감 잡기) 데이터 전처리를 위한 EDA (Target 예측에 방해되는 데이..