data transformation1 데이터를 샘플링(Sampling)하고 변환(Transformation)해보자 1. 데이터 샘플링이란? 샘플링은 대규모 데이터 집합에서 작은 샘플을 추출하는 과정으로, 전체 데이터를 대표할 수 있는 작은 집합을 얻는 것입니다. 이는 데이터 마이닝 알고리즘을 전체 데이터에 적용하는 것보다 훨씬 효율적인 방법입니다. 다양한 샘플링 기법이 있으며, 각각의 특징과 용도에 따라 선택되어야 합니다. 샘플링 방식 단순 무작위 추출 (Simple random sampling) 모집단의 각 항목이 동일한 확률로 선택됩니다. 이 방법은 샘플링 과정이 간단하고 이해하기 쉽지만, 데이터의 특성을 고려하지 않고 무작위로 샘플을 추출하기 때문에 특정 패턴이나 구조를 잡아내기 어려울 수 있습니다. 예를 들어, 학교에서 100명의 학생 중 20명을 선택하기 위해 동전을 던지듯이 무작위로 선택할 수 있습니다. .. 2024. 3. 23. 이전 1 다음