파티션(Patition)
데이터베이스에서 파티션은 대용량의 테이블이나 인덱스 를 작은 논리적 단위인 파티션으로 나누는 것을 말한다.
•대용량 DB의 경우 중요한 몇 개의 테이블에만 집중되어 데이터가 증가되므로, 이런 테이블들을 작은 단위로 나눠 분산시키면 성능 저하를 방지할 뿐만 아니라 데이터 관리도 쉬워진다.
파티션의 종류
범위 분할 (Range Partitioning)
지정한 열의 값을 기준으로 범위를 지정하여 분할 함 일별, 월별, 분기별 등
해시 분할 (Hash Partitioning)
•해시 함수를 적용한 결과 값에 따라 데이터를 분할 함
•특정 파티션에 데이터가 집중되는 범위 분할의 단점을 보완한 것으로, 데이터를 고르게 분산할 때 유용함
•특정 데이터가 어디에 있는지 판단할 수 없음
•고객번호, 주민번호 등과 같이 데이터가 고른 컬럼에 효과적임
조합 분할 (Composite Partitioning)
•범위 분할로 분할한 다음 해시 함수를 적용하여 다시 분할하는 방식
•범위 분할한 파티션이 너무 커서 관리가 어려울 때 유용함
목록 분할 (List Partitioning)
지정한 열 값에 대한 목록을 만들어 이를 기준으로 분할함 ‘국가’라는 열에 ‘한국’, ‘미국’, ‘일본’이 있는 경우 ‘미국’을 제외할 목적으로 ‘아시아’라는 목록을 만 들어 분할함
라운드 로빈 분할 (Round Robin Partitioning)
•레코드를 균일하게 분배하는 방식
•각 레코드가 순차적으로 분배되며, 기본키가 필요 없음
HDD쓰면서 알게된 그 개념이 아닌듯...?
분산 데이터베이스 정의 및 구성 요소
분산 데이터베이스는 논리적으로는 하나의 시스템에 속하 지만 물리적으로는 네트워크를 통해 연결된 여러 개의 컴퓨 터 사이트(Site)에 분산되어 있는 데이터베이스를 말한다.
•분산 데이터베이스의 구성 요소
분산 처리기
자체적으로 처리 능력을 가지며, 지리적으로 분산 되어 있는 컴퓨터 시스템
분산 데이터베이스
지리적으로 분산되어 있는 데이터베이스로서 해당 지역의 특성에 맞게 데이터베이스가 구성됨
통신 네트워크
분산 처리기들을 통신망으로 연결하여 논리적으로 하나의 시스템처럼 작동할 수 있도록 하는 통신 네트워크
분산 데이터베이스의 목표
•위치 투명성(Location Transparency) : 액세스하려는 데 이터베이스의 실제 위치를 알 필요 없이 단지 데이터베이스의 논리적인 명칭만으로 액세스할 수 있음
•중복 투명성(Replication Transparency) : 동일 데이터가 여러 곳에 중복되어 있더라도 사용자는 마치 하나의 데이터만 존재하는 것처럼 사용하고, 시스템은 자동으로 여러 자료에 대한 작업을 수행함
•병행 투명성(Concurrency Transparency) : 분산 데이터 베이스와 관련된 다수의 트랜잭션들이 동시에 실현되더라도 그 트랜잭션의 결과는 영향을 받지 않음
•장애 투명성(Failure Transparency) : 트랜잭션, DBMS, 네트워크, 컴퓨터 장애에도 불구하고 트랜잭션을 정확하게 처리함
분산 데이터베이스의 장·단점
장점
•지역 자치성이 높음
•자료의 공유성이 향상됨
•분산 제어가 가능함
•시스템 성능이 향상됨
•중앙 컴퓨터의 장애가 전체 시스템에 영향을 끼치지 않음
•효용성과 융통성이 높음
•신뢰성 및 가용성이 높음
•점진적 시스템 용량 확장이 용이함
단점
•DBMS가 수행할 기능이 복잡함
•데이터베이스 설계가 어려움
•소프트웨어 개발 비용이 증가함
•처리 비용이 증가함
•잠재적 오류가 증가함
근데 또 읽고 생각하다보면 HDD 쓰면서 알게된 개념하고 일치하는 면이 있...
일상