본문 바로가기

전체 글29

데이터베이스의 사용자와 관리자는 누구일까? 1. 데이터베이스 사용자(Database Users)에 대해 알아보자 데이터베이스 시스템은 다양한 사용자 그룹을 대상으로 설계되어 있으며, 이러한 사용자들은 시스템과 상호 작용하는 방식과 수준에 따라 구분됩니다. 각 사용자 유형은 데이터베이스 시스템과 상호 작용하는 방식과 수준에 따라 역할과 책임이 다릅니다. 이러한 다양한 사용자 그룹을 고려하여 데이터베이스 시스템은 다양한 기능과 인터페이스를 제공하여 각 사용자의 요구 사항을 최대한 충족시킵니다. 다양한 사용자들의 유형 응용 프로그래머(Application Programmers) 데이터베이스 시스템과 통합된 응용 프로그램을 개발하는 주체입니다. 이들은 주로 데이터베이스에 대한 조작을 위해 데이터 조작 언어(DML)을 사용하며, 데이터베이스의 구조를 변경.. 2024. 3. 26.
데이터베이스 언어(Database Languages)란 무엇인가요? 데이터베이스 언어는 데이터베이스 시스템과 상호 작용하기 위해 사용되는 특수한 언어입니다. 이 언어들은 데이터베이스를 정의하고 구축하며, 데이터를 검색, 조작, 관리하기 위한 명령을 제공합니다. 또한 데이터베이스 관리자, 응용 프로그래머 및 사용자가 데이터베이스를 효율적으로 관리하고 사용할 수 있도록 도와줍니다. 이러한 언어들은 데이터베이스 시스템의 핵심 구성 요소이며, 데이터베이스 시스템의 성능과 안정성에 큰 영향을 미칩니다. 주요 데이터베이스 언어로는 데이터 정의 언어(DDL), 데이터 조작 언어(DML), 쿼리(Query) 등이 있습니다. 1. 데이터베이스 언어 종류엔 어떤 것들이 있을까 데이터 정의 언어 (DDL - Data Definition Language) 데이터베이스의 구조를 정의하고 수정하.. 2024. 3. 25.
이산화(Discretization)에 대해 알아보자 1. 이산화란 무엇인가? 이산화(Discretization)는 데이터 전처리 과정 중 데이터 변환의 방법 중 하나로써 연속형 속성의 값 범위를 구간으로 나누는 과정입니다. 주어진 연속형 데이터를 일정한 간격의 구간으로 나누어 범주형 데이터로 변환함으로써 데이터의 복잡성을 줄이고 모델링 또는 분석에 활용하기 쉽도록 만듭니다. 데이터 속성의 종류 명목형(Nominal) 순서가 없는 범주에서 값을 가지는 속성입니다. 예를 들어, 색상이나 직업과 같은 속성이 여기에 해당됩니다. 서열형(Ordinal) 순서가 있는 범주에서 값을 가지는 속성으로, 군대나 학위와 같은 것이 여기에 속합니다. 숫자형(Numeric) 정수나 실수와 같은 실제 숫자 값을 가지는 속성입니다. 이산화 목적과 과정 연속형 속성의 값을 구간으로.. 2024. 3. 24.
데이터를 샘플링(Sampling)하고 변환(Transformation)해보자 1. 데이터 샘플링이란? 샘플링은 대규모 데이터 집합에서 작은 샘플을 추출하는 과정으로, 전체 데이터를 대표할 수 있는 작은 집합을 얻는 것입니다. 이는 데이터 마이닝 알고리즘을 전체 데이터에 적용하는 것보다 훨씬 효율적인 방법입니다. 다양한 샘플링 기법이 있으며, 각각의 특징과 용도에 따라 선택되어야 합니다. 샘플링 방식 단순 무작위 추출 (Simple random sampling) 모집단의 각 항목이 동일한 확률로 선택됩니다. 이 방법은 샘플링 과정이 간단하고 이해하기 쉽지만, 데이터의 특성을 고려하지 않고 무작위로 샘플을 추출하기 때문에 특정 패턴이나 구조를 잡아내기 어려울 수 있습니다. 예를 들어, 학교에서 100명의 학생 중 20명을 선택하기 위해 동전을 던지듯이 무작위로 선택할 수 있습니다. .. 2024. 3. 23.