4장

4.1 MySQL 엔진 아키텍쳐

1. MySQL 엔진 구조

MySQL은 (C API, JDBC, .NET 표준 드라이버등을 이용해) 대부분의 프로그래밍 언어로부터 접근 방법을 모두 지원한다.
MySQL 서버는 MySQL 엔진(쿼리파서, 옵티마이저 등의 기능)과 스토리지 엔진으로 구분할 수 있다.

MySQL 엔진

MySQL 엔진은

커넥션 핸들러: 클라이언트로부터 접속 및 쿼리 요청을 처리
SQL 파서 및 전처리기
옵티마이저: 쿼리의 최적화된 실행을 위한 처리 등으로 구성된다.

스토리지 엔진

MySQL 엔진이 두뇌의 해당하는 처리를 수행하고 실제 데이터를 디스크 스토리지에 저장하거나 디스크 스토리지로부터 데이터를 읽어오는 부분은 스토리지 엔진이 담당한다. 스토리지 엔진은 여러 개를 동시에 사용할 수 있다.

핸들러 API

MySQL 엔진은 각 스토리지 엔진에 쓰기나 읽기를 요청하는데 이런 요청을 핸들러 요청이라고 하고 이 때 사용되는 API를 핸들러 API라고 한다. 이 API를 통해 데이터 작업의 횟수도 확인할 수 있다.

SHOW GLOBAL STATUS LIKE 'Handler%';

2. MySQL 스레딩 구조

MySQL은 프로세스 기반이 아닌 스레드 기반으로 동작하며 포그라운드와 백그라운드 스레드로 구분할 수 있다.

SELECT thread_id, name, type, processlist_user, processlist_host
  FROM performance_schema.threads ORDER BY type, thread_id;

위의 명령어를 입력해보면

40개의 스레드 중 백그라운드는 35개, 나머지 5개가 포그라운드 스레드고 이 중에서 thread/sql/one_connection 들만 실제 사용자의 요청을 처리하는 포그라운드 스레드다. 동일한 이름의 스레드는 여러 스레드가 동일 작업을 병렬로 처리하는 경우다.

포그라운드 스레드(클라이언트 스레드)

포그라운드 스레드는 MySQL 서버에 접속된 클라이언트의 수만큼 존재하며 각 클라이언트의 쿼리를 처리한다. 클라이언트가 커넥션을 종료하면 해당 스레드는 스레드 캐시(Thread cache)로 되돌아가며 일정 개수 이상의 스레드가 캐시에 존재한다면 스레드를 종료시켜 최대 스레드 캐시 갯수를 조절한다. thread_cache_size 시스템 변수로 설정 가능하다.

백그라운드 스레드

MySQL에서 대중적으로 쓰이는 스토리지 엔진은 InnoDB, MyISAM이 있다. MyISAM은 사용자 스레드가 읽기와 쓰기를 모두 처리하도록 설계되어 있지만 InnoDB를 비롯한 일반적인 상용 DBMS는 대부분 쓰기 작업을 버퍼링해서 일괄 처리하는 기능이 탑재돼 있다.

InnoDB에서는 다음 작업이 백그라운드로 처리된다.

인서트 버퍼(insert Buffer)를 병합하는 스레드
로그를 디스크로 기록하는 스레드
InnoDB 버퍼 풀의 데이터를 디스크에 기록하는 스레드
데이터를 버퍼로 읽어 오는 스레드
잡금이나 데드락을 모니터링하는 스레드

MySQL 5.5버전부터 쓰기 스레드와 읽기 스레드의 개수를 2개 이상 지정할 수 있으며 해당 변수명은 innodb_write_io_threads, innodb_read_io_threads 쓰기 스레드 갯수를 조절해 디스크를 최적화해 사용할 수 있다.

3. 메모리 할당 및 사용 구조

MySQL의 메모리 공간은 글로벌 메모리 영역과 로컬 메모리 영역으로 구분되며 글로벌 메모리 영역은 MySQL 서버가 시작되면서 운영체제로부터 할당된다. 글로벌 메모리 영역과 로컬 메모리 영역의 구분은 서버 내의 많은 스레드가 공유해서 사용하는 공간인지 여부에 따라 구분된다.

글로벌 메모리 영역

클라이언트 스레드의 수와 상관없이 하나의 메모리 공간만 할당된다. 생성된 글로벌 영역이 N개라 하더라도 모든 스레드에 의해 공유된다.

대표적 글로벌 메모리 영역은 다음과 같다.

테이블 캐시
InnoDB 버퍼 풀
InnoDB 어댑티브 해시 인덱스
InnoDB 리두 로그 버퍼

로컬 메모리 영역

세션, 클라이언트 메모리 영역이라고도 하며 클라이언트 스레드가 쿼리를 처리하는데 사용하는 메모리 영역이다. 로컬 메모리는 각 클라이언트 스레드 별로 독립적으로 할당되며 절대 공유되지 않는다. 커넥션 버퍼나 결과 버퍼 등은 로컬 메모리 공간에서 커넥션이 열려 있는 동안 계속 할당되어 있지만, 쿼리를 실행하는 순간에만 할당했다가 해제하는 소트 버퍼나 조인 버퍼 등도 있다.

정렬 버퍼(Sort Buffer)
조인 버퍼
바이너리 로그 캐시
네트워크 버퍼

4. 플러그인 스토리지 엔진 모델

플러그인 모델은 MySQL의 독특한 구조 중 하나로 플러그인 할 수 있는 것은 스토리지 엔진 뿐만 아니라 사용자 인증 로직 등의 로직과 그 외의 다양한 작업을 플러그인 형태로 커스텀해서 개발할 수 있다.

보통 MySQL에서 쿼리가 실행되는 과정 중에서 스토리지 엔진이 개입하는 부분은 마지막 데이터 읽기/쓰기 작업인데 해당 부분은 플러그인 형태로 동작해 MySQL 엔진에서 핸들러를 통해 스토리지 엔진에게 읽기/쓰기 작업을 명령한다.

SHOW ENGINES;

다음 명령어를 실행하면 MySQL 서버에서 지원되는 스토리지 엔진이 어떤 것이 있는지 볼 수 있다.

support 컬럼의 표시들은 다음의 의미를 가진다.

YES: MySQL 서버에 해당 스토리지 엔진이 포함돼 있고 사용 가능으로 활성화된 상태
DEFAULT: YES와 동일하지만 필수 스토리지 엔진임을 나타냄
NO: 현재 MySQL 서버에 포함되지 않았음을 의미함
DISABLED: 현재 MySQL 서버에는 포함됐지만 파라미터에 의해 비활성화 상태

스토리지 엔진뿐만 아닌 다양한 기능이 플러그인 형태로 지원됨을 알 수 있다.

5. 컴포넌트

MySQL 8.0부터 기존의 플러그인 아키텍쳐를 대체하기 위해 지원된 컴포넌트 아키텍쳐가 존재한다. 플러그인의 단점은 다음과 같았다.

플러그인은 오직 MySQL 서버와 인터페이스할 수 있고 플러그인사이의 통신은 불가
플러그인은 MySQL 서버의 변수나 함수를 직접 호출하기 때문에 안전하지 않음
플러그인은 상호 의존 관계를 설정할 수 없어서 초기화가 어려움

6. 쿼리 실행 구조

쿼리 실행 구조는 기능별로 나눠 볼 수 있다.

쿼리 파서 쿼리 파서는 사용자 요청으로 들어온 쿼리 문장을 토큰으로 분리해 트리 형태의 구조로 만들어내는 작업이다. 문법 오류는 이 과정에서 발견되고 사용자에게 오류 메시지를 날린다.
전처리기 파서 트리를 기반으로 쿼리 문장에 구조적 문제점이 있는지 확인한다. 토큰을 테이블 이름이나 칼럼 이름, 내장 함수 등과 매핑해 객체의 존재 여부와 권한을 확인한다.
옵티마이저 사용자의 요청으로 들어온 쿼리 문장을 가장 저렴하게 처리하는 방법을 결정하는 역할을 담당한다. DBMS의 두뇌로 옵티마이저가 더 나은 선택을 유도하는 방법을 배우는 것이 중요하다.
실행 엔진 옵티마이저는 두뇌의 역할을 담당하고 실행 엔진과 핸들러는 손과 발에 해당한다. 실행 엔진은 중간 관리자, 핸들러는 실무자로 옵티마이저의 실행 결과를 실행 엔진이 핸들러와 상호작용 하며 각 핸들러를 연결하는 역할을 수행한다.
핸들러(스토리지 엔진) MySQL 서버의 최하단에서 MySQL 실행 엔진의 요청에 따라 데이터를 읽고 쓰는 역할을 한다.

7. 복제

16장에서 다룬다.

8. 쿼리 캐시

8.0에서 완전히 제거된 기능으로 쿼리의 결과를 캐싱해서 동일한 쿼리가 실행되면 캐싱된 결과를 반환하는 기능이었지만 테이블의 데이터가 변경되면 변경된 테이블과 관련된 것들을 삭제하는 과정이 필요해 동시 처리 성능 저하와 버그를 가져다 줬다.

9. 스레드 풀

엔터프라이즈 에디션에서 제공하는 기능으로 커뮤니티 에디션은 스레드 풀 기능을 지원하지 않는다. Percona Server에서 제공하는 스레드 풀 기능을 살펴보면 엔터프라이즈 에디션은 MySQL 서버에 내장된 스레드 풀이지만 Percona Server의 스레드 풀은 플러그인 형태로 작동하게 구현되어 있다.

스레드 풀은 내부적으로 사용자의 요청을 처리하는 스레드 개수를 줄여서 MySQL 서버의 CPU가 제한된 개수의 스레드 처리에만 집중할 수 있게 해 서버의 자원 소모를 줄이기 위함이다.
스케줄링 과정에서 CPU 시간을 제대로 확보하지 못하면 오히려 더 느려질 수도 있다.
스레드 그룹의 개수는 thread_pool_size 시스템 변수를 통해 조정 가능하지만 일반적으로 기본 셋팅인 CPU 코어의 개수와 맞추는 것이 CPU 프로세서 친화도를 높이는데 좋다.
만약 스레드 풀이 처리중인 작업이 있는 경우 thread_poll_oversubscribe 시스템 변수에 설정된 개수만큼 추가로 더 받아들일 수 있다.
thread_pool_stall_limit을 통해 해당 밀리초만큼 작업 스레드가 처리중인 작업을 끝내지 못하면 새로운 스레드를 생성한다
하지만 그 개수는 thread_pool_limit을 넘기지 못한다.

Percona Server의 스레드 풀 플러그인은 선순위 큐와 후순위 큐를 이용해 특정 트랜잭션이나 쿼리를 우선 처리하는 기능도 제공하는데 이 기능을 통해 트랜잭션 락을 빨리 해제시켜 성능을 향상시킬 수 있다.

10. 트랜잭션 지원 메타데이터

메타데이터: 데이터베이스 서버에서 테이블의 구조 정보와 스토어드 프로그램 등의 정보를 데이터 딕셔너리 또는 메타데이터라고 한다.

5.7버전까지는 테이블 구조를 FRM 파일, 스토어드 프로그램을 TRN, TRG, PAR 등의 파일 기반으로 관리했지만 파일은 트랜잭션을 지원하지 않아 테이블 생성 또는 변경 도중 비정상적 종료가 일어나면 일관되지 않은 상태로 남았다.

8.0부터는 테이블의 구조나 스토어드 프로그램의 코드를 모두 InnoDB 테이블에 저장하도록 개선됐다. 이를 시스템 테이블이라고 하고 사용자의 인증 등의 테이블들이 있다. 해당 정보는 mysql.ibd라는 이름의 테이블 스페이스에 저장된다.

InnoDB 스토리지 엔진을 사용하는 테이블은 메타 정보가 InnoDB 테이블 기반의 딕셔너리에 저장되지만 MyISAM이나 CSV등과 같은 스토리지 엔진은 SDI(Serialized Dictionary Information) 파일을 사용한다. 이는 FRM 파일과 동일한 역할을 하며 *.sdi 파일로 저장된다.

4.2 InnoDB 스토리지 엔진 아키텍쳐

InnoDB는 MySQL 스토리지 엔진 중 거의 유일하게 레코드(튜플, 행, 레코드) 기반의 잠금을 제공하며 InnoDB 스토리지 엔진은 레코드 자체가 아니라 인덱스의 레코드를 잠근다. 그 때문에 높은 동시성 처리가 가능하고 안정적이며 성능이 뛰어나다.

1. 프라이머리 키에 의한 클러스터링

InnoDB의 모든 테이블은 기본적으로 PK를 기준으로 클러스터링되어 저장된다. 모든 세컨더리 인덱스는 레코드의 주소 대신 PK의 값을 논리 주소로 사용한다. 따라서, PK를 이용한 레인지스캔이 빨리 처리된다. 실행 계획에서 PK가 다른 인덱스보다 높은 비중을 가진다.

MyISAM 엔진은 클러스터링 키를 지원하지 않아 PK와 세컨더리 키가 구조적으로 차이가 없다. MyISAM 테이블의 PK를 포함한 모든 인덱스는 물리적인 레코드의 주소 값(ROWID)를 가진다.

클러스링 인덱스는 물리적으로 행을 재배열한다.

CREATE TABLE TBL_CLUSTERED_TEST (
  LOG_DATE CHAR(8) NOT NULL,
  MEDIA_ID CHAR(1) NOT NULL, 
  PROCEEDS DOUBLE DEFAULT NULL,
  PRIMARY KEY (LOG_DATE,MEDIA_ID)
) ENGINE=INNODB DEFAULT CHARSET=utf8;

INSERT INTO TBL_CLUSTERED_TEST (LOG_DATE, MEDIA_ID, PROCEEDS) VALUES ('20130618', 'A', 1000);
INSERT INTO TBL_CLUSTERED_TEST (LOG_DATE, MEDIA_ID, PROCEEDS) VALUES ('20130619', 'A', 1000);
INSERT INTO TBL_CLUSTERED_TEST (LOG_DATE, MEDIA_ID, PROCEEDS) VALUES ('20130619', 'C', 2000);
INSERT INTO TBL_CLUSTERED_TEST (LOG_DATE, MEDIA_ID, PROCEEDS) VALUES ('20130619', 'B', 1000);
INSERT INTO TBL_CLUSTERED_TEST (LOG_DATE, MEDIA_ID, PROCEEDS) VALUES ('20130613', 'B', 3000);

mysql> select * from tbl_clustered_test;

+----------+----------+----------+
| LOG_DATE | MEDIA_ID | PROCEEDS |
+----------+----------+----------+
| 20130613 | B        |   3000   |
| 20130618 | A        |   1000   |
| 20130619 | A        |   1000   |
| 20130619 | B        |   1000   |
| 20130619 | C        |   2000   |
+----------+----------+----------+

위와 같은 테이블에 데이터를 넣으면 LOG_DATE를 정렬한 후 MEDIA_ID를 정렬하게 된다.

조회문 성능 향상을 위해 넌 클러스터링 인덱스를 생성하는데 이는 클러스터링과 다르게 물리적 데이터 정렬이 이뤄지지 않는다. 넌 클러스터링 인덱스는 별도의 공간에 인덱스 테이블을 생성해 데이터를 정렬한다.

클러스터링 인덱스는 leaf level이 필요없다

출처: https://vaert.tistory.com/110

2. 외래 키 지원

FK에 대한 지원은 InnoDB 스토리지 엔진 레벨에서 지원하는 기능으로 MyISAM, MEMORY에서는 지원하지 않는다.
InnoDB의 외래 키는 부모 테이블과 자식 테이블 모두 해당 칼럼에 인덱스 생성이 필요하다.
변경시에는 각 테이블을 체크하기 때문에 잠금이 여러 테이블로 전파되기 쉽다.

수동 데이터 적재나 스키마 변경 시 외래 키가 얽혀있어 풀기 힘들다면 foreign_key_checks 시스템 변수를 OFF로 설정하면 외래 키 관계에 대한 체크 작업을 일시적으로 멈출 수 있다. 다만, 테이블간의 관계를 복원해 일관성을 맞춰준 후에 ON으로 활성화해야 한다.

foreign_key_checks가 비활성화되면 update와 delete에 대한 cascade 옵션도 무시된다.

SET foreign_key_checks=OFF;
=
SET SESSION foreign_key_checks=OFF;

해당 시스템 변수는 GLOBAL과 SESSION 두 가지의 적용 범위를 가져갈 수 있고, 기본이 SESSION 모드다

3. MVCC(Multi Version Concurrency Control)

잠금을 사용하지 않는 일관된 읽기를 제공하는 목적으로 InnoDB는 언두로그를 이용해 이 기능을 구현한다. MVCC(Multi Version Concurrency Control)는 하나의 레코드에 대해 여러 개의 버전이 동시에 관리된다는 의미다.

READ_COMMITTED의 격리 수준을 가지는 MySQL 서버를 예로 들면

INSERT INTO member (m_id, m_name, m_area) VALUES (12, '홍길동', '서울');
COMMIT;

INSERT문을 실행하면 아래의 사진상태로 바뀐다.

여기에 UPDATE쿼리를 넣어주면

UPDATE member SET m_area='경기' WHERE m_id=12;

커밋 실행 여부와 상관없이 InnoDB의 버퍼 풀은 '경기'로 업데이트된다. 아직 커밋이 실행되지 않았을 때 다른 사용자가 해당 레코드를 조회하면 격리 수준에 따라 다른 결과를 뱉는다.

READ_UNCOMMITTED인 경우 InnoDB 버퍼 풀이 가지고 있는 변경된 데이터를 읽어서 반환한다.
READ_COMMITTED or more(REPEATABLE_READ, SERIALIZABLE)인 경우는 언두 영역의 데이터를 반환한다.

이런 일련의 과정을 MVCC라고 표현한다. 하나의 레코드에 대해 2개의 버전이 유지되고 필요에 따라 보여지는 데이터가 다르다.

언두로그는 커밋한다고 바로 사라지는 것이 아니라 해당 언두 영역을 더 이상 필요로하는 트랜잭션이 없을 때 사라진다.

언두로그: UPDATE나 DELETE로 데이터를 변경했을 때 변경되기 전의 데이터를 보관하는 곳으로 롤백에 대비하고 트랜잭션의 격리 수준을 유지하면서 높은 동시성을 제공하기 위해 존재한다.

4. 잠금 없는 일관된 읽기(Non-Locking Consistent Read)

InnoDB 스토리지 엔진은 MVCC를 이용해 잠금을 걸지 않고 읽기 작업을 수행하는데, SERIALIZABLE이 아닌 READ_UNCOMMITTED, READ_COMMITTED, REPEATABLE_READ 수준인 경우 INSERT와 연결되지 않은 순수한 읽기 작업은 다른 트랜잭션과 관계없이 바로 실행된다.

트랜잭션이 길어질수록 일관된 읽기를 위해 언두영역이 커지기 때문에 트랜잭션을 최대한 빨리 끝내는 게 좋다.

5. 자동 데드락 감지

InnoDB 스토리지 엔진은 내부적으로 락이 교착 상태에 빠지지 않았는지 체크하기 위해 잠금 대기 목록을 그래프 형태로 관리한다. InnoDB 스토리지 엔진은 데드락 감지 스레드를 가지고 있어서 주기적으로 잠금 대기 목록을 검사해 교착에 빠진 트랜잭션 중 하나를 강제종료한다. 보통 언두 로그를 적게 가진 트랜잭션을 롤백한다.

InnoDB 엔진은 MySQL 엔진의 내부는 볼 수 없어 데드락 감지가 불확실할 수 있어 innodb_table_locks 환경변수를 활성화하면 테이블 레벨의 잠금도 감지할 수 있다.

동시 처리 스레드가 많아지거나 트랜잭션의 잠금 개수가 많아지만 데드락 감지 스레드가 느려진다. 이 상황에서 서비스 쿼리 처리 스레드가 느려질 수 있기 때문에 해당 문제가 있을 경우 innodb_deadlock_detect 시스템 변수를 OFF로 설정하면 데드락 감지 스레드는 더 작동하지 않는다. 이 때 무한대기를 방지하기 위해 innodb_lock_wait_timeout을 50초 이하로 설정해서 사용하면 그 대안이 된다.

세컨더리 인덱스를 기반으로 높은 동시성 처리를 요구하는 서비스가 있다면 해당 기능을 활용해 비교해보자.

6. 자동화된 장애 복구

InnoDB에는 손실이나 장애로부터 데이터를 보호하기 위한 메커니즘이 있다.

InnoDB는 MySQL 서버가 시작될 때 항상 자동 복구를 수행하는데 이 단계에서 자동으로 복구될 수 없는 손상이 존재한다면 SQL서버를 중단시킨다. 이 때는 MySQL 서버의 설정파일에 innodb_force_recovery 시스템 변수를 설정해 MySQL을 시작해야 하고 MySQL 서버가 시작될 때 InnoDB 스토리지 엔진이 데이터 파일이나 로그 파일의 손상 여부 검사 과정을 선별적으로 진행할 수 있게 한다.

해당 시스템 변수는 1~6까지 존재하며 숫자가 커질수록 심각한 상황이며 데이터 손실 가능성이 커진다. MySQL 서버가 기동된 단계에 따라 복구 방법이 다르다.

각 숫자 값으로 복구되는 상황과 해결 방법은 다음과 같으며 복구모드에서 SELECT 이외의 쿼리는 실행 불가능하다.

1(SRV_FORCE_IGNORE_CORRUPT)
- InnoDB의 테이블 스페이스의 데이터나 인덱스 페이지에서 손상된 부분이 발생해도 무시하고 서버를 시작한다.
- mysqldump 프로그램이나 SELECT INTO OUTFILE 명령을 이용해 덤프해서 데이터베이스를 다시 구축해야 한다.
2(SRV_FORCE_NO_BACKGROUD)
- InnoDB는 쿼리 처리를 위해 여러 백그라운드르 스레드를 동시에 사용하는데 해당 옵션은 메인 스레드를 시작하지 않고 서버를 시작한다.
- InnoDB 메인 스레드가 언두 데이터를 삭제하는 과정에서 장애가 발생한다면 이 모드로 복구하면 된다.
3(SRV_FORCE_NO_TRX_UNDO)
- MySQL 서버는 다시 시작하면서 언두 영역의 데이터를 데이터 파일에 적용하고 리두 로그의 내용을 다시 덮어써서 장애 시점의 데이터를 만든다.
- 그리고 정상적인 MySQL 서버의 시작에서는 최종 커밋되지 않은 트랜잭션에 대한 롤백을 실행하지만 해당 모드는 롤백하지 않고 그대로 놔둔다.
- mysqldump를 이용해 데이터를 백업해서 다시 데이터베이스를 구축하는 것이 좋다.
4(SRV_FORCE_NO_IBUF_MERGE)
- INSERT, UPDATE, DELETE등의 데이터 조작으로 인한 인덱스 변경 작업을 인서트 버퍼에 저장해두고 데이터 파일에 병합되지 않은 상태에서 종료됐을 때 일어날 수 있는 문제로
- 스토리지 엔진이 인서트 버퍼의 내용을 무시하고 강제로 시작되게 한다.
- 데이터와 관련된 부분이 아니라 테이블을 덤프한 후 다시 데이터베이스를 구축하면 데이터의 손실 없이 복구 가능하다.
5(SRV_FORCE_NO_UNDO_LOG_SCAN)
- MySQL 서버가 종료되는 시점에 진행중인 트랜잭션이 있었다면 해당 커넥션을 강제로 끊어버리고 정리 없이 종료한다.
- MySQL 서버 시작 시 언두 레코드를 이용해 복구, 리두로그를 적용해 종료 시점이나 장애 발생 시점을 재현하고, 마지막 커밋되지 않은 트랜잭션은 모두 롤백한다.
- 하지만 언두로그를 사용할 수 없다면 서버가 시작되지 않는다.
- 해당 옵션은 InnoDB 엔진이 언두 로그를 모두 무시하고 MySQL을 시작할 수 있지만 종료되던 시점의 커밋되지 않은 데이터가 자동 커밋되기 때문에 데이터가 잘못됐다고 할 수 있다.
- mysqldump를 이용해 데이터를 백업하고 데이터베이스를 다시 구축해야 한다.
6(SRV_FORCE_NO_LOG_REDO)
- 리두 로그가 손상된 상태로 이 복구 모두를 사용하면 리두 로그를 모두 무시한 채로 서버가 시작되고, 커밋됐다 하더라도 리두 로그에만 기록되고 데이터 파일에 기록되지 않은 데이터는 모두 무시된다.
- 기존 InnoDB의 리두 로그는 모두 삭제하고 MySQL 서버를 시작하는 것이 좋다.
- mysqldump를 이용해 데이터를 모두 백업해서 MySQL 서버를 새로 구축하는 것이 좋다.

리두로그: Buffer pool이 메모리 공간이기 때문에 장애 발생시 해당 내용은 사라진다. 따라서 Buffer pool의 데이터 유실을 방지하기 위해 DML 문장이 수행되면 변경할 내용을 기록하는 곳이 Redo Log Buffer다. 해당 영역은 메모리로 제한적이기 때문에 checkpoint 발생 시점에 Redo Log Buffer의 데이터를 Redo Log File로 Disk에 저장한다.

7. InnoDB 버퍼 풀

InnoDB 스토리지 엔진에서 가장 핵심으로

디스크의 데이터 파일
인덱스 정보
쓰기 지연을 위한 버퍼

역할을 담당한다

버퍼 풀의 크기 설정

MySQL 서버 내에서 메모리를 필요로 하는 부분은 크게 없지만 독특한 경우 레코드 버퍼가 많이 차지한다. 레코드 버퍼: 각 클라이언트 세션에서 테이블의 레코드를 읽고 쓸 때 사용하는 공간으로 커넥션과 테이블이 많다면 버퍼 공간을 많이 사용할 수 있다.

MySQL5.7부터 InnoDB 버퍼 풀의 크기를 동적으로 조절할 수 있으며 그 설정법은

운영체제의 전체 메모리 공간이 8G 미만이라면 50%, 그 이상이라면 50%부터 올려가며 최적점을 찾는다
전체 메모리 공간이 5G 이상이라면 15~30G를 제외한 나머지 메모리 공간

inoodb_buffer_pool_size 시스템 변수로 크기를 설정할 수 있고 동적으로 크기를 확장할 수 있다.
128MB 청크 단위로 변경한다.
innodb_buffer_pool_instances 시스템 변수로 버퍼 풀을 여러 개로 분리해서 관리할 수 있으며 각 버퍼 풀을 버퍼 풀 인스턴스라고 표현한다.
버퍼 풀은 버퍼 풀 전체를 관리하는 잠금을 줄이기 위해 버퍼 풀을 여러 개로 쪼개 관리할 수 있다.
기본 버퍼 풀 인스턴스는 8개지만 버퍼 풀을 위한 메모리가 1G 이하 미만이라면 1개만 생성된다.
버퍼 풀에 할당할 수 있는 메모리가 40G 이하라면 8을 유지하고 메모리가 크다면 인스턴스당 5G정도가 되게 인스턴스 개수를 조절하는 것이 좋다.

버퍼 풀의 구조

InnoDB 엔진은 LRU(Least Recently Used) 리스트, 플러시 리스트, 프리리스트 자료구조를 이용한다.

프리리스트: InnoDB 버퍼 풀에서 실제 사용자 데이터로 채워지지 않은 비어 있는 페이지들의 목록
LRU리스트: LRU와 MRU리스트의 결합 형태로 Old 서브리스트가 LRU, New 서브리스트가 MRU(Most Recently Used)로 생각하면 된다.
- LRU 리스트는 디스크에서 한 번 읽어온 페이지를 최대한 오래 InnoDB의 버퍼풀의 메모리에 유지해 디스크 읽기를 최소화 하기 위해 관리한다.
플러시 리스트: 디스크로 동기화되지 않은 데이터를 가진 데이터 페이지(더티 페이지)의 변경 시점 기준의 페이지 목록을 관리한다.
- 데이터 변경이 가해진 데이터 페이지는 플러시 리스트에 관리된다.
- 데이터가 변경되면 InnoDB는 변경 내용을 리두 로그에 기록하고 버퍼 풀의 데이터 페이지에도 변경 내용을 반영한다.
- 리두 로그가 디스크에 기록됐다고 해서 데이터 페이지가 디스크로 기록됐다는걸 보장하지 않는다.
- 체크포인트를 발생시켜 서버 시작시 디스크의 리두로그와 데이터페이지의 상태를 동기화함으로써 복부 실행 기준점을 만든다.

InnoDB 스토리지 엔진에서 데이터를 찾는 과정을 다음과 같다.

필요한 레코드가 저장된 데이터 페이지가 버퍼 풀에 있는지 검사
1. InnoDB 어댑티브 해시 인덱스를 이용해 페이지 검색
2. 해당 테이블의 인덱스(B-Tree)를 이용해 버퍼 풀에서 페이지를 검색
3. 버퍼 풀에 이미 데이터 페이지가 있었다면 해당 페이지의 포인터를 MRU 방향으로 승급
디스크에서 필요한 데이터 페이지를 버퍼 풀에 적재하고, 적재된 페이지에 대한 포인터를 LRU 헤더 부분에 추가
버퍼 풀의 LRU 헤더 부분에 적재된 데이터 페이지가 실제로 읽히면 MRU 헤더 부분으로 이동(Read-Ahead인 경우 버퍼 풀에 적재는 되지만 실제 쿼리에 사용되지 않는다면 MRU로 이동 X)
버퍼 풀에 상주하는 데이터 페이지는 사용자 쿼리가 얼마나 최근에 접근했는지에 따라 Age가 부여되며 Aging되면 버퍼 풀에서 제거된다. 만약 사용되면 Age가 초기화되고 MRU의 헤더 부분으로 옮겨진다.
필요한 데이터가 자주 접근됐다면 해당 페이지의 인덱스 키를 어댑티브 해시 인덱스에 추가한다.

Read-Ahead: 해당 페이지가 필요할 것으로 예상해 버퍼 풀에 있는 여러 페이지를 미리 한번에 가져오는 비동기 I/O 요청으로 두 가지 읽기 예측 알고리즘을 사용한다.

1. Linear: 버퍼 풀의 페이지 순차 엑세스를 기반으로 필요할 페이지를 예측하는 기술
   - **innodb_read_ahead_threshold**를 사용해 비동기 읽기 요청을 트리거하는데 필요한 순차 페이지 엑세스 횟수를 조정할 수 있다.
   - 0-64의 값으로 기본은 56으로 56페이지를 읽으면 다음 페이지를 미리 가져오게 된다.

2. Random: 페이지 읽기 순서와 상관없이 버퍼 풀에 있는 페이지를 기반으로 곧 페이지가 필요할 시기를 예측하는 기술
   - **innodb_random_read_ahead**를 사용해 ON, OFF를 설정할 수 있다.
   - 버퍼 풀에서 동일한 범위의 연속된 페이지가 13개 발견되면 비동기적으로 나머지 페이지를 미리 가져오도록 요청한다.

SHOW ENGINE INNODB STATUS를 통해 알고리즘의 효율성을 평가하는 통계를 볼 수있다.

버퍼 풀과 리두 로그

InnoDB의 버퍼 풀은 DB 성능 향상을 위해

데이터 캐시
쓰기 버퍼링

두 가지 일을 한다. 버퍼 풀 메모리 공간의 단순 확보는 캐시 기능의 향상을 의미한다. 쓰기 버퍼링을 향상시키려면 버퍼 풀과 리두 로그의 관계를 이해해야 한다.

InnoDB 스토리지 엔진은 데이터 변경시 세 가지 작업을 하는데

버퍼풀의 페이지에 변경 내용을 반영
리두 로그 파일에도 변경 내용을 저장
변경된 페이지를 flush list가 참조

리두 로그와 버퍼 풀의 관계는 다음과 같다.

InnoDB의 버퍼 풀은 디스크에서 읽은 상태 그대로인 클린 페이지와 변경된 데이터인 더티페이지를 가지고 있다.
리두 로그는 1개 이상의 고정 크기 파일을 순환 고리처럼 사용한다. 즉, 지속된 데이터 변경이 이뤄지면 데이터가 덮인다.
리두 로그는 재사용 불가능한 공간과 재사용 가능한 공간인 활성 리두로그로 나뉜다.
리두 로그 파일의 공간은 LSN(Log Sequence Number)라는 증가되는 값을 가진다.
InnoDB 스토리지 엔진은 체크포인트를 통해 리두 로그와 버퍼 풀의 더티 페이지를 디스크로 동기화 한다.
가장 최근 체크포인트의 LSN과 마지막 리두 로그 엔트리의 LSN의 차이를 체크포인트 에이지라고 한다.

버퍼 풀 플러시(Buffer Pool Flush)

버퍼 풀에서 아직 디스크로 기록되지 않은 더티 페이지들을 성능저하없이 동기화하기 위해 2개(플러시 리스트, LRU 리스트)의 플러시 기능을 백그라운드로 사용한다.

플러시 리스트 플러시
리두 로그 공간의 재활용을 위해 주기적으로 오래된 리두 로그 엔트리가 사용하는 공간을 비워야 한다. 이를 위해 버퍼풀의 더티 페이지가 디스크로 동기화 돼야 한다. InnoDB 엔진은 플러시 리스트 함수를 통해 플러시 작업을 수행한다. 플러시 작업의 중점은 더티 페이지의 양이다.
- inndb_page_cleaners: 스토리지 엔진에서 더티 페이지를 디스크로 동기화하는 스래드인 클리너 스레드 개수 조정하는 값으로 innodb_buffer_pool_instances와 맞춰주는 것이 좋다.
- innodb_max_dirty_pages_pct_lwm: 일정 수준 이상의 더티 페이지가 발생하면 조금씩 디스크로 기록하는 옵션으로 기본이 10%
- innodb_max_dirty_pages_pct: 버퍼 풀에서 더티 페이지의 한계를 정하는 옵션으로 기본이 90%
- innodb_io_capacity: 디스크에 대한 읽고 쓰기를 일반 상황에서 처리할 횟수
- innodb_capacity_max: 디스크에 대한 읽고 쓰기를 최대의 성능을 발휘할 때 처리할 횟수
- innodb_flush_neighbors: 디스크가 HDD인 상황에서 이웃 페이지들의 동시 쓰기 기능
- innodb_adaptive_flushing: 리두 로그의 증가 속도를 측정해 적절한 수준의 더티 페이지가 버퍼 풀에 유지될 수 있도록 디스크 쓰기를 실행하는 옵션
- innodb_adaptive_flushing_lwm: 디폴트가 10%로 활성 리두 로그의 공간이 10% 미만이면 어댑티브 플래시 알고리즘이 작동한다.
LRU 리스트 플러시 LRU 리스트에서 사용 빈도가 낮은 데이터 페이지들을 제거하기 위한 함수로 InnoDB 스토리지 엔진은 LRU 리스트의 끝부분부터 최대 innodb_lru_scan_depth만큼 스캔하는데 더티 페이지는 디스크 동기화, 클린페이지는 프리 리스트로 페이지를 옮긴다.

버퍼 풀 상태 백업 및 복구

MySQL5.5 이전까지는 버퍼 풀 쿼리 워밍업을 위해 주요 테이블과 인덱스에 대한 풀 스캔을 진행했지만 5.6 버전부터는 innodb_buffer_pool_dump_now를 통해 버퍼 풀의 상태를 백업하고 innodb_buffer_pool_load_now를 통해 버퍼 복구가 가능하다.

자동 옵션은 innodb_buffer_pool_dump_at_shutdown과 innodb_buffer_pool_load_at_startup 설정을 통해 가능하다.

버퍼 풀의 적재 내용 확인

information_schema 데이터베이스에 innodb_cached_indexes를 통해 테이블 인덱스별로 데이터 페이지가 얼마나 InnoDB 버퍼 풀에 적재돼 있는지 확인할 수 있다.

8. Double Write Buffer

리두 로그는 리두 로그 공간의 낭비를 막기 위해 페이지의 변경된 내용만 기록하는데 스토리지 엔진에서 더티 페이지를 디스크 파일로 플러시할 때 하드웨어 문제로 일부만 기록되는 문제가 발생하면 그 페이지를 복구할 수 없을 수 있는데 이를 위해 Double_Write 기법이 존재한다.

스토리지 엔진이 실제 데이터 파일에 변경을 기록하기 전에 더티 페이지를 묶어서 DoubleWrite 버퍼에 기록하고 기록 도중 운영체제가 비정상적으로 종료된다면 재시작 시 DoubleWrite 버퍼와 데이터 파일 페이지를 비교해 다른 내용을 복구하는 기능이다.

SSD같은 랜덤IO를 지원하는 저장 시스템에서는 부담스럽기 때문에 무결성이 중요한 것이 아니라면 비활성화 하는 것이 좋다.

9. 언두 로그

언두로그는 DML에 의한 데이터 변경 이전을 백업하는 공간으로

트랜잭션 보장: 롤백시 언두 로그를 이용해 복구
격리 수준 보장: 특정 커넥션의 데이터 변경 도중 다른 커넥션의 조회가 들어오면 격리 수준에 따라 언두로그의 데이터를 반환

MySQL 5.5 버전까지는 언두 로그의 공간이 늘어나면 서버를 새로 구축해야 했지만 5.7부터는 언두 로그를 줄일 수 있으며 자동으로 줄여주기도 한다.

언두 로그 모니터링

언두 로그 건수는 다음과 같이 확인 가능하다.

-- 모든 버전
SHOW ENGINE INNODB STATUS \G

-- 8.0
SELECT count
FROM information_schema.innodb_metrics
WHERE SUBSYSTEM='transaction' AND NAME='trx_rseg_history_len';

언두 테이블스페이스 관리

언두 로그가 저장되는 공간을 언두 테이블스페이스라고 하고 5.6버전 이전에는 시스템 테이블 스페이스에 저장됐다. 하지만 확장의 한계 때문에 5.6 버전부터는 innodb_undo_tablespaces 시스템 변수를 2보다 크게 설정하면 별도의 언두 로그 파일을 사용했다.

8.0부터는 해당 시스템 변수는 사라졌고 항상 별도 로그 파일에 기록된다.

CREATE UNDO TABLESPACE
DROP TABLESPACE

등의 명령으로 언두 테이블스페이스의 동적 추가 삭제가 가능하다.

언두 스페이스의 불필요한 공간의 반납은 자동과 수동 두 가지 방법이 있는데

자동모드: innodb_undo_log_truncate 시스템 변수를 ON으로 하면 언두로그 파일을 퍼지 스레드가 주기적으로 깨어나 사용하지 않는 공간을 잘라내고 운영체제로 반납한다.
수동모드: innodb_undo_log_truncate를 OFF로 설정하면 퍼지 스레드가 불필요한 공간을 잘라내 반납한다.

10. 체인지버퍼

데이터의 INSERT나 UPDATE시 테이블에 포함된 인덱스도 업데이트 해야 한다.
- 버퍼 풀에 인덱스 페이지가 존재한다면 바로 업데이트
- 디스크 엑세스가 필요하다면 임시공간에 저장하는데 이게 체인지 버퍼(Change Buffer)
유니크 인덱스는 체인지 버퍼를 사용할 수 없다.
백그라운드 스레드에 의해 병합되는데 이 스레드를 버퍼 머지 스레드라고 부른다.

11. 리두 로그 및 로그 버퍼

리두 로그는 서버가 비정상적으로 종료됐을 때 데이터 파일에 기록되지 못한 데이터를 잃지 않게 해주는 안전장치다. 대부분의 데이터베이스 서버는 쓰기보다 읽기를 중요하게 생각하기 때문에 쓰는 시점에는 랜덤 엑세스가 필요하다. 그래서 로그에 먼저 기록한다.

innodb_flush_log_at_trx_commit: 리두 로그를 어느 주기로 디스크에 동기화할 지 결정하는 시스템 변수로
- 0: 1초에 한 번씩 리두 로그를 디스크로 기록하고 동기화를 실행한다. 서버의 비정상 종료에 최대 1초의 트랜잭션 데이터가 사라질 수 있다.
- 1: 매번 트랜잭션이 커밋될 때마다 디스크로 기록하고 동기화를 수행한다.
- 2: 트랜잭션이 커밋될때마다 기록은 되지만 실질적 동기화는 1초에 한번씩 실행된다. 서버의 비정상적 종료에도 운영체제가 정상적으로 작동한다면 트랜잭션의 데이터는 사라지지 않는다.
innodb_log_file_size: 리두 로그 파일 사이즈 결정
innodb_log_files_in_group: 리두 로그 파일의 개수를 결정

12. 어댑티브 해시 인덱스

어댑티브 해시 인덱스는 사용자가 수동으로 생성하는 인덱스가 아니라 InnoDB 스토리지 엔진에서 사용자가 자주 요청하는 데이터에 대해 자동으로 생성하는 인덱스이며 innodb_adaptive_hash_index로 조정 가능하다.

B-Tree는 특정 값을 찾기 위해 리프 노드에 도달해야 하는데 동시에 많은 작업을 하게되면 성능이 떨어지게 된다. 어댑티브 해시 인덱스는 자주 읽히는 데이터 페이지의 키 값을 이용해 해시 인덱스를 만든다.

해시 인덱스는 다음과 같다.

인덱스 키 값: 데이터 페이지 주소 의 쌍
B-Tree 인덱스의 Id + B-Tree 인덱스의 실제 키 값: InnoDB 버퍼 풀에 로딩된 페이지의 주소

어댑티브 해시 인덱스가 성능 향상에 도움이 되지 않는 경우, 단점

디스크 읽기가 많은 경우
특정 패턴의 쿼리가 많은 경우(조인이나 LIKE패턴 검색)
매우 큰 데이터를 가진 테이블의 레코드를 폭넓게 읽는 경우
때에 따라 큰 메모리 공간을 사용할 수 있다.
효율이 없어도 계속 해시 인덱스를 사용해야 한다.
테이블의 삭제 또는 변경작업이 필요한 경우

성능 향상에 도움이 되는 경우

디스크의 데이터가 InnoDB 버퍼 풀 크기와 비슷한 경우
동등 조건 검색(동등 비교와 IN 연산자)이 많은 경우
쿼리가 데이터 중에서 일부 데이터에만 집중되는 경우

아래 쿼리 통해 어댑티브 해시 인덱스가 효과적인지 알 수 있다.

SHOW ENGINE INNODB STATUS\G

4.4 MySQL 로그 파일

MySQL 로그 파일을 이용하면 MySQL의 상태나 부하를 일으키는 원인을 쉽게 찾아 해결할 수 있다.

1. 에러 로그 파일

MySQL 실행 도중 발생하는 에러나 경고 메시지가 출력되는 로그 파일로 MySQl 설정 파일(my.cnf)에서 log_errer라는 이름의 파라미터로 정의된 경로에 생성된다.

MySQL이 시작하는 과정과 관련된 정보성 및 에러 메시지
비정상적 종료 후 InnoDB의 트랜잭션 복구 메시지
- 비정상적 종료에 의해 처리되지 못한 트랜잭션을 처리하고 기록되지 않은 데이터를 재처리하는 작업
쿼리 처리 도중에 발생하는 문제에 대한 에러 메시지
비정상적으로 종료된 커넥션 메시지
- 문제에 대해 알아보고 max_connect_error 시스템 변숫값을 올리는 방안이 있을 수도 있다.
InnoDB의 모니터링 또는 상태조회명령(ex: SHOW ENGINE INNODB STATUS)의 결과메시지
- 모니터링 명령은 큰 메시지를 에러로그에 기록하기 때문에 다시 비활성화 해줘야 한다.
MySQL의 종료 메시지
- 종료시 출력된 메시지

2. 제너럴 쿼리 로그 파일

MySQl 서버에서 실행되는 쿼리 전체 목록을 보기 위함으로 실행 중에 에러가 발생해도 기록된다.

쿼리 로그 파일의 경로는 general_log_file에 설정돼 있다.

3. 슬로우 쿼리 로그

슬로우 쿼리 로그 파일에는 long_query_time 이상의 시간 소요 정상실행 쿼리가 모두 기록된다.

로그의 항목들은 다음과 같다.

Time: 쿼리가 종료된 시점으로 시작시점은 Query_time만큼 빼야한다.
User@Host: 쿼리 실행 사용자의 계정
Query_time: 쿼리가 실행되는데 걸린 전체 시간으로 잠금 체크 시간도 포함하므로 매우 작다면 무시해도 무방하다.
Rows_examined: 쿼리 처리를 위해 몇 건의 레코드에 접근했는지를 의미한다.
Rows_sent: 실제 몇 건의 처리 결과를 클라이언트로 보냈는지 의미한다.
- 만일 Rows_examined의 레코드 건수는 높지만 Rows_sent 건수가 적은 집합함수(Group By, Count, Min, Max, Avg)가 아닌 쿼리라면 튜닝해 볼 가치가 있다.

Percona에서 개발한 Percona Toolkit의 pt-query-digest 스크립트를 이용해 빈도나 처리 성능별로 쿼리를 정렬해서 볼 수 있고, 3개의 그룹으로 나누어 저장된다.

슬로우 통계 쿼리: 분석 결과의 최상단에 표시되며 쿼리 로그의 실행시간, 잠금 대기 시간 등에 대한 평균, 최소, 최대 값을 표시한다.
실행 빈도 및 누적 실행 시간순 랭킹: 각 쿼리별로 응답 시간과 실행 횟수를 보여준다
쿼리별 실행 횟수 및 누적 실행 시간 상세 정보: Query ID별 쿼리를 쿼리 랭킹에 표시된 순서대로 자세한 내용을 보여준다.

PreviousRealMySQL8.0 Next5장

Last updated 2 years ago

hashtag4.1 MySQL 엔진 아키텍쳐

hashtag1. MySQL 엔진 구조

hashtagMySQL 엔진

hashtag스토리지 엔진

hashtag핸들러 API

hashtag2. MySQL 스레딩 구조

hashtag포그라운드 스레드(클라이언트 스레드)

hashtag백그라운드 스레드

hashtag3. 메모리 할당 및 사용 구조

hashtag글로벌 메모리 영역

hashtag로컬 메모리 영역

hashtag4. 플러그인 스토리지 엔진 모델

hashtag5. 컴포넌트

hashtag6. 쿼리 실행 구조

hashtag7. 복제

hashtag8. 쿼리 캐시

hashtag9. 스레드 풀

hashtag10. 트랜잭션 지원 메타데이터

hashtag4.2 InnoDB 스토리지 엔진 아키텍쳐

hashtag1. 프라이머리 키에 의한 클러스터링

hashtag2. 외래 키 지원

hashtag3. MVCC(Multi Version Concurrency Control)

hashtag4. 잠금 없는 일관된 읽기(Non-Locking Consistent Read)

hashtag5. 자동 데드락 감지

hashtag6. 자동화된 장애 복구

hashtag7. InnoDB 버퍼 풀

hashtag버퍼 풀의 크기 설정

hashtag버퍼 풀의 구조

hashtag버퍼 풀과 리두 로그

hashtag버퍼 풀 플러시(Buffer Pool Flush)

hashtag버퍼 풀 상태 백업 및 복구

hashtag버퍼 풀의 적재 내용 확인

hashtag8. Double Write Buffer

hashtag9. 언두 로그

hashtag언두 로그 모니터링

hashtag언두 테이블스페이스 관리

hashtag10. 체인지버퍼

hashtag11. 리두 로그 및 로그 버퍼

hashtag12. 어댑티브 해시 인덱스

hashtag4.4 MySQL 로그 파일

hashtag1. 에러 로그 파일

hashtag2. 제너럴 쿼리 로그 파일

hashtag3. 슬로우 쿼리 로그