본문 바로가기

전체 글29

파일 시스템(File System)과 DBMS는 무엇일까? 1. 파일 시스템(File System)이란? 파일 시스템은 운영 체제(OS)의 일부로, 프로그램, 데이터, 문서 등을 디스크에 저장하는 시스템입니다. 초기에는 데이터베이스 응용 프로그램이 파일 시스템 위에 구축되었습니다. 그러나 파일 시스템을 사용하여 데이터를 저장하는 것에는 여러 가지 단점이 있습니다. 파일 시스템의 단점 데이터 중복과 일관성 파일 시스템에서는 데이터를 여러 파일에 중복해서 저장할 수 있으며, 이로 인해 동일한 정보가 여러 파일에 중복되어 저장될 수 있습니다. 이는 데이터의 일관성을 해칠 수 있습니다. 실제로 고객 정보가 회사의 여러 파일에 중복되어 저장되는 경우가 있습니다. 예를 들어, 고객의 이름과 주소가 고객 목록 파일과 주문 내역 파일에 모두 저장되는 경우가 있을 수 있습니다... 2024. 3. 20.
데이터(Data)와 데이터베이스(DB, Database)는 어떤 차이가 있을까? 데이터(Data)는 기록할 가치가 있는 엔터티, 이벤트, 현상 또는 아이디어의 형식적인 설명입니다. 데이터는 컴퓨터화된 정보 시스템의 다양한 프로그램들이 사용하는 정보를 나타내며, 일반적으로 프로그램들과는 분리되어 있습니다. 데이터는 거의 모든 산업과 분야에서 활용되며, 이를 효과적으로 관리하고 분석함으로써 가치를 창출할 수 있습니다. 1. 데이터의 예시 학생 정보: 학생의 이름, 학번, 성적, 출석 기록 등은 학교나 대학의 데이터베이스에 저장됩니다. 제품 인벤토리: 상품의 이름, 가격, 재고 수량, 제조사 정보 등은 상점이나 온라인 쇼핑몰의 데이터베이스에 저장됩니다. 고객 정보: 고객의 이름, 주소, 전화번호, 이메일 등은 기업이나 조직의 고객 관리 시스템에 저장됩니다. 금융 거래: 은행이나 금융 기관.. 2024. 3. 19.
피처 엔지니어링 (Feature Engineering)이란 무엇일까? 피처 엔지니어링은 머신러닝 알고리즘이 작동하기 위해 데이터에 대한 도메인 지식을 활용하여 특징(Feature)을 만들어내는 과정입니다. 기존 입력 데이터를 기반으로 새로운 입력 데이터를 생성하기 때문에 보통 학습 과정 전에 수행됩니다. 왜 중요할까? 올바른 피처 엔지니어링은 모델의 성능을 높이는 데 결정적인 역할을 합니다. 적절한 피처를 선택하고 생성함으로써 모델의 복잡성을 줄이고 예측력을 향상할 수 있습니다. 피처 엔지니어링은 모델이 데이터 패턴을 더 잘 이해하고 학습할 수 있도록 돕습니다. 핵심 개념 기본적으로 피처는 모델에 입력되는 데이터의 각각의 차원을 나타냅니다. 이러한 피처들은 모델이 학습하는 데 사용되며, 올바르게 구성되지 않으면 모델의 성능에 부정적인 영향을 미칠 수 있습니다. 피처 엔지니.. 2024. 3. 19.
데이터를 축소하는 전략에는 어떤 것들이 있을까? (Data Reduction Strategies) 1. 데이터 축소에 대해 알아보자 개요 데이터 축소는 데이터의 차원을 줄이는 과정으로, 원본 데이터의 특성을 보존하면서 불필요한 정보를 제거하여 데이터를 간결하고 효율적으로 만드는 과정입니다. 이는 머신러닝 및 데이터 분석에서 중요한 단계 중 하나로 모델의 성능을 향상하고 계산 비용을 절감하는 데 중요한 역할을 하며, 데이터의 특성과 목적에 맞게 적절한 축소 방법을 선택하는 것이 중요합니다. 필요성 데이터베이스나 데이터 웨어하우스는 테라바이트 단위의 데이터를 저장할 수 있습니다. 완전한 데이터 집합에 대해 복잡한 데이터 분석을 실행하는 데는 많은 시간이 소요될 수 있습니다. 데이터 축소 전략 종류 차원 축소(Dimensionality Reduction) 데이터의 차원을 줄이는 방법으로, 불필요한 속성을 .. 2024. 3. 18.