DB/관계형 DB
조인(결합) 알고리즘과 성능
쿠와와
2021. 2. 19. 19:26
옵티마이저가 선택 가능한 결합 알고리즘
1. Nested Loops
2. Hash
3. Sort Merge
가장 빈번한 알고리즘은 Nested Loops -> Hash -> Sort Merge 이다.
대부분이 이 세개를 지원하지만 그렇지 않거나 파생된 알고리즘을 제공하는 곳이 있으니 자신이 주로 사용하는 DBMS 최신 동향에 주의를 기울이도록하자.
1. Nested Loops
중첩 반복을 사용하는 알고리즘 -> 결합은 한 번에 두 개의 테이블만 결합하므로 본질적으로 이중 반복과 같은 의미
. 테이블 R을 구동 테이블 = 외부 테이블이라고 부르고 B를 내부 테이블이라고 부른다.
1. 결합 대상 테이블 R에서 레코드를 하나씩 반복해가며 스캔
2. 구동 테이블의 레코드 하나마다 내부 테이블의 레코드를 하나씩 스캔해서 결합 조건에 맞으면 리턴
3. 1~2를 구동 테이블의 모든 레코드에 반복
특징
- 실행시간은 레코드 수에 비례한다.
- 한 번의 단계에서 처리하는 레코드의 수가 적으므로 hash 또는 sort merge에 비해 메모리 소비가 적다.
- 모든 dbms에서 지원
구동 테이블이 작을수록 성능이 좋아짐. 전제 조건 = 내부 테이블의 결합 키 필드에 인덱스가 존재할 때
그때 내부 테이블의 특정 레코드들을 건너뛸 수 있기 때문에 결국 구동테이블의 수가 중요해지는 것이다.
SELECT E.emp_id, E.emp_name, E.dept_id, D.dept_name
FROM Emplotees E INNER JOIN Departments D
ON E.dept_id = D.dept_id
이때 내부 테이블의 결합 키 인덱스가 사용된다면 내부 테이블의 반복을 생략할 수 있으므로 빨라진다.
-> 내부 테이블의 반복을 얼마나 생략할 수 있을지가 포인트
2. Hash
3. Sort Merge