728x90
반응형
데이터, 빅데이터, 인공지능에 대한 활용도가 높아지면서 '빅 데이터 거버넌스' '데이터 보안' '데이터 보안 전문가' 등 데이터를 보안하는 직업, 그 방법론이 굉장히 큰 이슈로 대두되고 있습니다. 조금 다른 이야기일 수도 있지만, '이루다 사태'도 유사한 시사점을 주었습니다.
활용도가 높아진만큼 보안도 중요해진 것인데요. 관련해서 데이터 보안 관련주 또한 중요성과 상승세가 대두되고 있습니다.
이 글에서는 관련하여 데이터 정합성 | 데이터 무결성에 대해 정리드리겠습니다.
Data Integrity 용어 정의
데이터 정합성: 서로 모순이 없이 일관되게 일치해야 한다는 의미. 데이터 값이 각각 일치해야 한다는 뜻.
데이터 정합성에 어긋난다: 데이터가 일치하지 않는다.
데이터 무결성
- 무결성은 데이터 값이 정확한 상태를 뜻합니다.
- Data Integrity가 주로 데이터 무결성으로 번역되나, 정확하다는 의미에서 데이터 완전성이나 정확성이라는 표현이 더 정확합니다.
데이터 정합성
- 정합성은 무결성과 유사하게 사용되는 용어입니다.
- 어떤 데이터들의 값이 서로 일치할 때 데이터 정합성이 맞다고 표현합니다.
- 중복 데이터를 많이 사용하면 데이터끼리 정합성을 맞추기 어렵고 궁극적으로는 서로 달라지는 경우(정합성이 깨지는 경우)가 생길 수 있습니다.
머리나는 맥주효모
무결성과 정합성의 비교
- 정합성은 데이터가 서로 모순 없이 일관되게 일치해야 한다는 의미입니다.
- 무결성은 데이터가 정확하고 완전해야 한다는 의미 → 데이터는 처음 의도된 그 상태로 존재해야 합니다.
- 어떤 데이터는 정합성에는 이상이 없으나 무결성은 훼손된 상태일 수 있습니다. (중간에 변화가 있다 다시 돌이킨 경우 등)
- 따라서 무결성의 정의가 더 넓은 개념입니다.
- 무결성을 지키는 것이 데이터 모델링의 최고의 목표입니다.
<요약>
데이터 정합성(Consistency)과 무결성(Integrity)은 데이터 관리와 데이터베이스 설계에서 중요한 개념으로, 둘 다 데이터의 정확성과 신뢰성을 보장하기 위해 필요합니다. 하지만 그 의미와 초점이 다릅니다.
1. 데이터 정합성 (Consistency)
- 정의:
- 데이터가 서로 논리적으로 일치하고 일관된 상태를 유지하는 것을 말합니다.
- 데이터가 여러 곳에 분산되어 있을 때, 동일한 정보를 나타내는 데이터 값들이 일치하는지 확인합니다.
- 초점:
- 데이터 간의 일관성에 초점.
- 같은 데이터가 여러 시스템, 데이터베이스, 또는 테이블 간에 동일한 값을 유지하는 것.
- 예시:
- 쇼핑몰의 주문 데이터에서, 주문 테이블에 기록된 주문 상태가 배송 테이블의 상태와 일치해야 함.
- 데이터 복제(replication)를 사용하는 시스템에서 마스터 데이터와 복제본이 동일한 값이어야 함.
- 위반 사례:
- 한 테이블에서는 상품 재고가 10개로 기록되어 있는데, 다른 테이블에서는 5개로 표시되는 경우.
2. 데이터 무결성 (Integrity)
- 정의:
- 데이터가 정확하고 신뢰할 수 있는 상태이며, 정의된 규칙과 제약 조건을 충족하는 것을 말합니다.
- 데이터베이스의 구조와 제약 조건(Primary Key, Foreign Key, Unique Constraints 등)이 제대로 작동하여 데이터의 오류나 부조리를 방지합니다.
- 초점:
- 데이터 자체의 정확성, 신뢰성, 유효성에 초점.
- 데이터가 미리 정해진 규칙에 부합하는지 확인.
- 종류:
- 참조 무결성: 외래 키 값이 참조하는 기본 키가 실제 존재해야 함.
- 도메인 무결성: 특정 필드의 값이 정의된 데이터 타입과 범위를 벗어나지 않아야 함.
- 엔터티 무결성: 기본 키는 NULL이 될 수 없고, 고유해야 함.
- 예시:
- 학생 관리 시스템에서 학생 ID(기본 키)는 중복되거나 NULL이 될 수 없음.
- 데이터 입력 시 잘못된 형식의 이메일 주소가 허용되지 않음.
- 위반 사례:
- 고객 테이블에서 존재하지 않는 고객 ID를 주문 테이블에서 참조하는 경우.
- 잘못된 데이터 형식으로 인해 날짜 필드에 숫자가 저장된 경우.
주요 차이점 요약
구분정합성 (Consistency)무결성 (Integrity)
초점 | 데이터 간의 논리적 일관성 | 데이터의 정확성과 규칙 준수 |
목표 | 동일한 데이터가 시스템 내/간에 일치하는지 보장 | 데이터가 올바른 규칙과 제약을 충족하는지 보장 |
위반 사례 | 중복된 데이터의 불일치 | 잘못된 데이터 값, 규칙 위반 |
해결 방법 | 데이터 동기화, 복제본 검증 | 제약 조건 설정, 데이터 검증 로직 구현 |
결론:
- 정합성은 데이터 간의 관계와 일치성을 다루고, 데이터가 서로 충돌 없이 동작하도록 유지하는 데 중점을 둡니다.
- 무결성은 데이터 자체의 유효성과 정확성을 보장하기 위한 제약과 규칙을 말합니다.
- 이 두 가지는 데이터베이스 시스템에서 함께 작용하여 데이터의 신뢰성과 안정성을 높입니다.
2021.04.16 - [테크 큐레이터] - [테크] 쿠팡 알고리즘 총정리 A to Z | 개인화 추천시스템 알고리즘 아키텍처
728x90
반응형
댓글