라벨링1 누락 데이터를 처리하는 방법과 약한 감독(Weak Supervision)에 대해 알아보자 1. 누락 데이터란? 누락된 데이터는 데이터 전처리 과정에서 매우 중요한 측면입니다. 누락된 데이터가 있는 경우 이를 처리하지 않으면 분석 결과에 영향을 미칠 수 있습니다. 따라서 누락된 데이터를 다루는 여러 가지 방법이 있습니다. 아래 방법 중에서 데이터의 특성과 분석 목적에 따라 가장 적합한 방법을 선택하여 누락된 데이터를 처리할 수 있습니다. 튜플 무시하기(Ignore the tuple) - 주로 분류(Classification) 작업을 수행할 때 클래스 레이블이 누락된 경우에 사용됩니다. 그러나 속성당 누락된 값의 비율이 상당히 다를 때 효과적이지 않을 수 있습니다. 수동으로 누락된 값 채우기 (Fill in the missing value manually) - 누락된 값을 직접 채우는 방법이지만.. 2024. 3. 17. 이전 1 다음