본문 바로가기
테크 큐레이터

[테크] 데이터 정합성 | 데이터 무결성 | Data Integrity 정의 및 차이점 총정리

by 동글네모 2021. 3. 26.
728x90
반응형

데이터, 빅데이터, 인공지능에 대한 활용도가 높아지면서 '빅 데이터 거버넌스' '데이터 보안' '데이터 보안 전문가' 등 데이터를 보안하는 직업, 그 방법론이 굉장히 큰 이슈로 대두되고 있습니다. 조금 다른 이야기일 수도 있지만, '이루다 사태'도 유사한 시사점을 주었습니다.

활용도가 높아진만큼 보안도 중요해진 것인데요. 관련해서 데이터 보안 관련주 또한 중요성과 상승세가 대두되고 있습니다.

 

이 글에서는 관련하여 데이터 정합성 | 데이터 무결성에 대해 정리드리겠습니다.

Data Integrity 용어 정의

데이터 정합성: 서로 모순이 없이 일관되게 일치해야 한다는 의미. 데이터 값이 각각 일치해야 한다는 뜻.

데이터 정합성에 어긋난다: 데이터가 일치하지 않는다.

 

데이터 무결성

  • 무결성은 데이터 값이 정확한 상태를 뜻합니다.
  • Data Integrity가 주로 데이터 무결성으로 번역되나, 정확하다는 의미에서 데이터 완전성이나 정확성이라는 표현이 더 정확합니다.

 

데이터 정합성

  • 정합성은 무결성과 유사하게 사용되는 용어입니다.
  • 어떤 데이터들의 값이 서로 일치할 때 데이터 정합성이 맞다고 표현합니다.
  • 중복 데이터를 많이 사용하면 데이터끼리 정합성을 맞추기 어렵고 궁극적으로는 서로 달라지는 경우(정합성이 깨지는 경우)가 생길 수 있습니다.

 


 

머리나는 맥주효모

익스트림 비오틴 1500 / 800mg, 60정, 6개

 


 

무결성과 정합성의 비교

  • 정합성은 데이터가 서로 모순 없이 일관되게 일치해야 한다는 의미입니다.
  • 무결성은 데이터가 정확하고 완전해야 한다는 의미 → 데이터는 처음 의도된 그 상태로 존재해야 합니다.
  • 어떤 데이터는 정합성에는 이상이 없으나 무결성은 훼손된 상태일 수 있습니다. (중간에 변화가 있다 다시 돌이킨 경우 등)
  • 따라서 무결성의 정의가 더 넓은 개념입니다.
  • 무결성을 지키는 것이 데이터 모델링의 최고의 목표입니다.

 

<요약>

데이터 정합성(Consistency)과 무결성(Integrity)은 데이터 관리와 데이터베이스 설계에서 중요한 개념으로, 둘 다 데이터의 정확성과 신뢰성을 보장하기 위해 필요합니다. 하지만 그 의미와 초점이 다릅니다.


1. 데이터 정합성 (Consistency)

  • 정의:
    • 데이터가 서로 논리적으로 일치하고 일관된 상태를 유지하는 것을 말합니다.
    • 데이터가 여러 곳에 분산되어 있을 때, 동일한 정보를 나타내는 데이터 값들이 일치하는지 확인합니다.
  • 초점:
    • 데이터 간의 일관성에 초점.
    • 같은 데이터가 여러 시스템, 데이터베이스, 또는 테이블 간에 동일한 값을 유지하는 것.
  • 예시:
    • 쇼핑몰의 주문 데이터에서, 주문 테이블에 기록된 주문 상태가 배송 테이블의 상태와 일치해야 함.
    • 데이터 복제(replication)를 사용하는 시스템에서 마스터 데이터와 복제본이 동일한 값이어야 함.
  • 위반 사례:
    • 한 테이블에서는 상품 재고가 10개로 기록되어 있는데, 다른 테이블에서는 5개로 표시되는 경우.

2. 데이터 무결성 (Integrity)

  • 정의:
    • 데이터가 정확하고 신뢰할 수 있는 상태이며, 정의된 규칙과 제약 조건을 충족하는 것을 말합니다.
    • 데이터베이스의 구조와 제약 조건(Primary Key, Foreign Key, Unique Constraints 등)이 제대로 작동하여 데이터의 오류나 부조리를 방지합니다.
  • 초점:
    • 데이터 자체의 정확성, 신뢰성, 유효성에 초점.
    • 데이터가 미리 정해진 규칙에 부합하는지 확인.
  • 종류:
    • 참조 무결성: 외래 키 값이 참조하는 기본 키가 실제 존재해야 함.
    • 도메인 무결성: 특정 필드의 값이 정의된 데이터 타입과 범위를 벗어나지 않아야 함.
    • 엔터티 무결성: 기본 키는 NULL이 될 수 없고, 고유해야 함.
  • 예시:
    • 학생 관리 시스템에서 학생 ID(기본 키)는 중복되거나 NULL이 될 수 없음.
    • 데이터 입력 시 잘못된 형식의 이메일 주소가 허용되지 않음.
  • 위반 사례:
    • 고객 테이블에서 존재하지 않는 고객 ID를 주문 테이블에서 참조하는 경우.
    • 잘못된 데이터 형식으로 인해 날짜 필드에 숫자가 저장된 경우.

 


주요 차이점 요약

구분정합성 (Consistency)무결성 (Integrity)

초점 데이터 간의 논리적 일관성 데이터의 정확성과 규칙 준수
목표 동일한 데이터가 시스템 내/간에 일치하는지 보장 데이터가 올바른 규칙과 제약을 충족하는지 보장
위반 사례 중복된 데이터의 불일치 잘못된 데이터 값, 규칙 위반
해결 방법 데이터 동기화, 복제본 검증 제약 조건 설정, 데이터 검증 로직 구현

결론:

  • 정합성은 데이터 간의 관계와 일치성을 다루고, 데이터가 서로 충돌 없이 동작하도록 유지하는 데 중점을 둡니다.
  • 무결성은 데이터 자체의 유효성과 정확성을 보장하기 위한 제약과 규칙을 말합니다.
  • 이 두 가지는 데이터베이스 시스템에서 함께 작용하여 데이터의 신뢰성과 안정성을 높입니다.

 

2021.04.16 - [테크 큐레이터] - [테크] 쿠팡 알고리즘 총정리 A to Z | 개인화 추천시스템 알고리즘 아키텍처

 

 

2021.01.19 - [테크 큐레이터] - [Tech] 2021 CES Unique Items | Dog IOT door, Mug projector, Stress relief headset

 

 

2021.01.18 - [테크 큐레이터] - [Tech] Tesla's Mobility Revolution | Tesla surpasses Apple | CEO of Elon Musk

 

 

 

728x90
반응형

댓글