정보처리기사
정보처리기사(실기) - 데이터베이스 기초 활용
내이름효주
2024. 4. 17. 22:49
- 데이터베이스: 다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리되는 데이터 집합
- 자료의 중복성 제거, 무결성 확보, 일관성 유지, 유용성 보장- 저장기술
- 데이터 웨어하우스: 사용자의 의사경정에 도움을 주기 위하여 기간 시스템의 데이터베이스에 축적된 데이터를 공통형식으로 변환해서 관리하는 데이터베이스
- 데이터 마트: 특정 주제, 부서 중심으로 구축된 소규모 단위 주제의 데이터 웨어하우스
- 데이터 웨어하우스에서 데이터를 꺼내 사용자에게 제공하는 역할
- 저장기술
- 하둡(Hadoop): 가상화된 대형 스토리지를 형성하고 그 안에 보관된 거대한 데이터 세트를 병렬로 처리할 수 있도록 개발된 자바 소프트웨어 프레임워크
- 주요기술
- 데이터 수집: ETL, 플럼, 스쿱, 스크래파이
- 분산 데이터 저장: HDFS(대용량 데이터의 집합을 처리)
- 분산 데이터 처리: 맵 리듀스(구글에서 대용량 데이터 처리를 분산병렬 컴퓨팅에서 처리)
- NoSQL: 고정된 테이블 스키마가 필요하지 않고 조인 연산을 사용할 수 없으며 수평적으로 확장 가능한 DBMS
- 주요기술
- 데이터 마이닝: 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾는 기술
- 대규모 데이터에서 의미 있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 기법