본문 바로가기
  • 정답은 없지만,
  • 오답은 있다.
IT/Database

[Database] 데이터베이스 기본 개념

by AGCP 2020. 12. 10.

오늘은 데이터와 정보의 명확한 차이점, 데이터베이스의 필요성, 데이터베이스의 정의와 주요 특성에 대해 정리할 예정이다.


  1   데이터와 정보의 차이점

정보를 데이터와 같은 의미로 사용하는 경우가 많은데, 이 둘은 엄연히 다른 의미이다.
데이터란 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값이다. 이를 자료라고도 한다.
그러나 정보는 데이터를 의사 결정에 활용할 수 있도록 가공한 결과물이다.
예를 들어보자면 목장에서 젖소에게 짠 원유가 '데이터', 이를 인간이 섭취할 수 있도록 가공한 것이 '정보'라고 할 수 있다.
주의해야할 점은 사람마다 데이터를 바라보는 관점이 달라서 '정보'와 '데이터'를 구분하는 것에 어려움을 겪을 수 있다.


  2   정보 시스템과 데이터베이스

정보 시스템(Information System)이란?
- 어떠한 조직 운영에 필요한 데이터를 수집하여 저장해두었다가 의사 결정이 필요할 때마다 처리하여 유용한 정보를 만들어주는 수단을 정보 시스템이라 한다. 

정보 시스템에서의 처리(정보 처리)란?
- 정보 처리는 데이터에서 정보를 추출하는 과정이다.

정보 시스템에서의 데이터베이스(Database)란?
- 정보 시스템에서 필요한 데이터를 수집 후 '저장'해두는 것이 데이터베이스의 역할이다. 즉, 정보 시스템의 구성 요소 중 하나라고 할 수 있다.

정보 시스템과 데이터베이스의 관계성


  3   데이터베이스의 정의

데이터베이스는 쉽게 말해 관련성 있는 데이터들을 수집하여 모아두는 '창고' 같은 개념이다. 일반적으로 데이터베이스는 특정 조직의 여러 사용자들이 서로 공유하여 사용할 수 있도록 통합해서 저장 운영 데이터의 집합이라고 사전적으로 정의한다.

위 내용을 조금 더 구체적으로 정리하면 다음과 같다.

1) 데이터베이스의 공유 데이터 (Shared Data)
DB는 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있어야하는 '공용' 데이터이다.
즉, 여러 사용자들을 함께 고려하여 데이터베이스를 구성해야 한다.

2) 데이터베이스의 통합 데이터 (Integrated Data)
데이터베이스는 똑같은 데이터가 여러 개 존재하는 데이터 중복성(data redundancy)를 허용하지 않는다.
그러나 간혹 효율성을 고려하여 중복을 의도적으로 허용하는 경우도 있으므로 데이터 중복성이 없다라고 하는 것은 옳지 않다. 통합 데이터는 데이터의 중복을 최소화하고 통제 가능한 중복만 허용하는 데이터 정도의 의미로 이해하면 쉽다.

3) 데이터베이스의 저장 데이터 (Stored Data)
데이터베이스는 주로 서버 컴퓨터가 처리하므로 데이터베이스를 컴퓨터가 쉽게 접근할 수 있는 매체에 저장해야 한다.
즉, 데이터베이스는 컴퓨터와 데이터베이스 간의 원활한 처리를 위해 접근성이 좋은 매체에 배치해야 한다.

4) 데이터베이스의 운영 데이터 (Operational Data)
데이터베이스는 조직을 운영하고 해당 조직의 주요 기능을 수행하기 위해 필요한 데이터들을 지속적으로 유지하는 것을 말한다. (더 요약해보자면, 조직 운영 시 요구되는 필수 데이터 유지)


  4   데이터베이스의 특성

데이터베이스의 특성은 어떤 관점으로 바라보냐에 따라 그 종류가 나뉜다. 
이번 글에서는 파일 시스템과 비교한 관점보다는 데이터베이스 자체의 관점으로 바라본 후 작성하였다.

1) 데이터베이스는 실시간 접근이 가능하다.
- 사용자의 요구에 따라 실시간 응답이 가능해야 한다. 이때, 소요되는 시간은 서비스 유형에 따라 각기 다르지만 보통 몇 초를 넘지 않는 시간 내에 데이터를 제공할 수 있어야 한다.

2) 데이터베이스는 계속 변화한다.
- 데이터베이스는 현실 세계의 상태를 정확히 반영해야 한다. 이때, 현실 세계는 끊임없이 변화하므로 데이터베이스에 저장되어 있는 데이터들도 계속해서 변화해야 한다. 즉, 데이터베이스는 데이터를 계속 삽입-삭제-수정(갱신)하여 데이터의 무결성을 유지해야 한다.

3) 데이터베이스는 동시 공유가 가능하다.
- 데이터베이스는 여러 사용자가 동시에 이용할 수 있는 동시 공유의 특성을 제공해야 한다. 이때, 동시 공유란 우리가 익히 알고있는 공유의 개념과는 조금 다른 내용이다. 이 글에서 사용된 동시 공유는 같은 데이터를 동시에 사용하는 것까지 지원하는 것을 의미한다. 그러나, 동시 공유 특성을 지원하도록 관리하는 것은 쉽지 않은 일이기 때문에 데이터를 동시에 사용할 수 있도록 까다로운 처리가 요구된다.

4) 데이터베이스는 내용 기반 참조가 가능하다.
- 데이터베이스는 저장된 주소나 위치로 참조하는 것이 아니라 데이터의 내용(값)으로 참조한다. 일반적으로 컴퓨터에 저장된 데이터는 저장 주소를 알아야 검색이 가능하다. (예로 포인터 변수와 주소 참조 연산자가 있다.)

하지만 데이터베이스는 '재고량이 1,000개 이상인 제품의 이름을 SQL문으로 검색하여라' 처럼 찾고자 하는 데이터의 조건만 제시하게 되면 조건에 해당되는 데이터가 서로 다른 위치에 저장되어 있어도 모두 검색할 수 있다.


오늘도 긴 글 읽어주셔서 감사합니다.
공감 버튼 꼭 눌러주세요!

'IT > Database' 카테고리의 다른 글

[Database] 데이터베이스 관리 시스템(DBMS)  (0) 2020.12.18

댓글