🚀 이 주제를 선택한 이유 & 학습 목표
- 학습 목표:
- 데이터, 정보, 지식, 지혜(DIKW)의 차이점과 관계를 설명할 수 있게 된다.
- 데이터베이스의 핵심 특징 4가지를 명확히 이해한다.
- DBMS의 등장 배경과 발전 과정을 설명할 수 있다.
- OLTP, OLAP, 데이터 웨어하우스(DW)의 개념과 차이점을 이해한다.
📚 핵심 개념 및 원리
1. 주요 용어 정의
- 데이터(Data): 가공되지 않은 객관적인 사실. 개별적으로는 큰 의미를 갖지 않으며, 추론이나 예측의 근거로 사용될 수 있는 존재적, 당위적 특성을 가집니다.
- 정보(Information): 데이터를 가공, 처리하고 데이터 간의 연관관계를 분석하여 의미와 패턴을 부여한 결과물입니다.
- 지식(Knowledge): 정보를 구조화하여 유의미하게 분류하고, 개인의 경험과 결합하여 내재화된 결과물입니다.
- 지혜(Wisdom): 지식이 축적되고 원리에 대한 깊은 이해가 더해져 창의적인 아이디어나 통찰을 도출하는 단계입니다.
- 정성적 데이터: 언어, 문자 등 형태가 없고 주관적인 해석이 가능한 데이터 (예: 고객 만족도 서술)
- 정량적 데이터: 수치, 도형, 기호 등 형태가 명확하고 정량적으로 측정 가능한 데이터 (예: 나이, 매출액)
- 암묵지(Tacit Knowledge): 학습과 체험을 통해 개인에게 내재되어 있지만, 언어나 문자로 표현하기 어려운 경험적 지식 (예: 장인의 노하우)
- 형식지(Explicit Knowledge): 암묵지가 문서, 매뉴얼, 책 등의 형태로 외부로 표출되어 공유 가능한 학습적 지식입니다.
- 데이터베이스(DB): 일정한 구조에 따라 편성된 데이터의 집합으로, 관련된 레코드의 모음입니다. 다수의 콘텐츠를 체계적으로 수집하여 다양한 용도로 활용할 수 있도록 정리한 정보 집합체입니다.
- DBMS(Database Management System): 데이터베이스를 관리하고 운영하는 소프트웨어입니다. DB와는 구분되는 개념입니다.
- 데이터 웨어하우스(DW): 의사결정 지원을 위해, 사용자의 관점에서 주제별로 통합된 시계열적 비휘발성 데이터를 저장하는 데이터베이스입니다.
- OLTP(Online Transaction Processing): 온라인 거래 처리 시스템. 다수의 사용자가 실시간으로 데이터를 수정/조회하는 등 단위 프로세스를 처리하는 데 중점을 둡니다. (예: 은행 계좌이체)
- OLAP(Online Analytical Processing): 온라인 분석 처리 시스템. 대규모 데이터를 기반으로 복잡한 분석과 요약 정보를 제공하여 의사결정을 지원하는 데 중점을 둡니다.
2. 핵심 원리/동작 방식
암묵지와 형식지의 상호작용 (SECI 모델)
- 공통화 (Socialization): 암묵지를 다른 사람에게 직접 전수하며 공유하는 단계 (암묵지 → 암묵지).
- 표출화 (Externalization): 암묵지를 책, 매뉴얼 등 형식지로 변환하는 단계 (암묵지 → 형식지).
- 연결화 (Combination): 기존 형식지에 새로운 지식을 더해 더 체계적인 형식지를 만드는 단계 (형식지 → 형식지).
- 내면화 (Internalization): 형식지를 학습하고 체험하여 개인의 암묵지로 체화하는 단계 (형식지 → 암묵지).
DIKW 피라미드 (계층 구조)
- Data: 가공 전의 순수한 사실 (예: A마트 사과 100원, B마트 사과 200원).
- Information: 데이터 가공 및 관계 파악을 통해 얻은 의미 (예: A마트 사과가 B마트보다 싸다).
- Knowledge: 패턴을 이해하고 예측한 결과물 (예: 과일은 A마트에서 구매하는 것이 유리하겠다).
- Wisdom: 원리에 대한 이해를 바탕으로 도출된 통찰 (예: A마트의 다른 제품들도 B마트보다 저렴할 것이다).
데이터베이스의 특징
- 통합된 데이터 (Integrated Data): 데이터 중복을 최소화하여 관리합니다.
- 저장된 데이터 (Stored Data): 컴퓨터가 접근 가능한 저장 매체에 보관됩니다.
- 공용 데이터 (Shared Data): 여러 사용자가 공동으로 이용할 수 있습니다.
- 변화되는 데이터 (Changed Data): 데이터의 삽입, 삭제, 수정(CRUD)을 통해 항상 최신의 정확한 상태(무결성)를 유지합니다.
DB 설계 절차
- 요구사항 분석 → 개념적 설계 → 논리적 설계 → 물리적 설계 순서로 진행됩니다.
3. 관련 예시 또는 시나리오
- DBMS 등장 배경: 과거 파일 시스템에서는 동일한 데이터가 여러 응용 프로그램에 걸쳐 중복 저장되고, 응용 프로그램이 특정 데이터 파일 구조에 종속되는 문제가 발생했습니다. 이러한 데이터의 중복성(Redundancy)과 종속성(Dependency) 문제를 해결하기 위해 DBMS가 등장했습니다.
💡 장점, 단점 및 고려사항 (기술/개념 비교)
- DB와 DW의 비교
| 특징 | 데이터베이스 (DB) | 데이터 웨어하우스 (DW) |
|---|---|---|
| 목적 | 실시간 거래 처리 (OLTP) | 의사결정 지원을 위한 분석 (OLAP) |
| 데이터 | 현재, 최신 데이터 유지 (변화되는 데이터) | 과거부터 현재까지의 시계열 데이터 (비휘발성) |
| 갱신 | 실시간으로 빈번하게 발생 (CRUD) | 주기적으로 일괄 처리 (읽기 전용) |
| 지향점 | 업무 프로세스 중심 | 데이터 주제 중심 (Subject-Oriented) |
| 규모 | 소규모 ~ 대규모 | 전사적 규모의 대용량 데이터 |
- OLTP와 OLAP의 비교
| 특징 | OLTP (Online Transaction Processing) | OLAP (Online Analytical Processing) |
|---|---|---|
| 주요 작업 | 데이터 입력, 수정, 삭제, 단순 조회 | 복잡한 질의, 데이터 분석, 리포팅 |
| 처리 속도 | 매우 빠름 (실시간성 중요) | 상대적으로 느림 (대규모 데이터 분석) |
| 사용자 | 일반 사용자, 운영 담당자 | 분석가, 경영진 |
| 데이터 단위 | 개별 트랜잭션, 작은 단위의 레코드 | 대규모 데이터, 요약 및 집계 데이터 |
| 목표 | 데이터 무결성, 동시성 제어, 빠른 응답 | 다차원 분석, 의사결정 지원 |
🔧 실제 활용 사례 또는 적용 분야
기업 내부 시스템:
- CRM (Customer Relationship Management): 선별된 고객으로부터 수익을 창출하고 장기적인 고객 관계를 구축하기 위한 시스템.
- SCM (Supply Chain Management): 제품의 생산, 물류, 유통 등 공급망 전체를 효율적으로 관리하기 위한 정보 시스템.
- ERP (Enterprise Resource Planning): 기업의 재무, 회계, 인사, 생산 등 모든 자원을 통합적으로 관리하는 전사적 자원 관리 시스템.
- BI (Business Intelligence): 기업의 DW에 저장된 데이터를 분석하여 경영진의 합리적인 의사결정을 돕는 활동 및 기술.
- KMS (Knowledge Management System): 기업 내 지식을 체계적으로 축적하고 공유하여 조직의 문제 해결 능력을 향상시키는 지식 관리 시스템.
금융 분야:
- EAI (Enterprise Application Integration): 기업 내 다양한 애플리케이션과 시스템을 연동하여 데이터를 통합하고 프로세스를 자동화하는 기술.
- EDW (Enterprise Data Warehouse): 기존 DW를 확장하여 다양한 분석 애플리케이션의 원천 데이터 역할을 수행하는 전사적 데이터 웨어하우스.
- 블록체인 (Blockchain): 데이터를 여러 곳에 분산하여 저장 및 처리하는 기술로, 보안성과 투명성이 높아 금융 거래 등에 활용됩니다.
🤔 나의 이해와 생각 정리 (회고)
- 핵심 요약: 데이터는 객관적 사실에 불과하며, 이를 가공하여 정보로, 다시 경험과 결합하여 지식으로, 최종적으로 통찰을 얻는 지혜로 발전하는 DIKW 계층 구조를 이해했다. 데이터베이스는 데이터를 효율적으로 관리하기 위한 시스템이며, 목적에 따라 실시간 처리를 위한 OLTP 시스템과 분석을 위한 OLAP(DW) 시스템으로 나뉜다.
- 새롭게 깨달은 점: DBMS가 단순히 데이터를 저장하는 것을 넘어 '중복성'과 '종속성'이라는 명확한 문제를 해결하기 위해 등장했다는 배경을 알게 되었다. 또한 데이터 웨어하우스(DW)가 수정이 불가한 '비휘발성' 특징을 갖는 이유가 과거 데이터를 포함한 시계열 분석을 위함이라는 점을 명확히 이해했다.
- 더 궁금해진 점 / 의문점: 3세대 DBMS로 등장한 객체지향 DBMS와 4세대인 NoSQL DBMS가 구체적으로 어떤 문제를 해결하기 위해 등장했는지 궁금하다. 특히 RDBMS와 NoSQL DBMS의 장단점과, 어떤 상황에서 각각을 선택해야 하는지에 대한 트레이드오프를 더 깊이 알고 싶다.