상세 컨텐츠

본문 제목

Real MySQL 4.1 아키텍처 정리

데이터베이스

by 빙하둘리 2023. 1. 22. 17:00

본문

728x90

MySQL 엔진 아키텍처는 다음과 같다.

[MySQL의 전체적인 구조]

MySQL 서버는 크게 MySQL 엔진 스토리지 엔진으로 구분해서 볼 수 있다.

 

MySQL 엔진

클라이언트로부터 접속 및 쿼리 요청을 처리하는 커넥션 핸들러 SQL파서 및 전처리기, 쿼리의 최적화된 실행을
위한 옵티마이저가 중심을 이룬다. 요청된 SQL 문장을 분석하거나 최적화하는 등 DBMS 두뇌에 해당하는 처리를 수행한다.

 

스토리지 엔진

실제 데이터를 디스크 스토리지에 저장하거나 디스크 스토리지로부터 데이터를 읽어오는 부분은 스토리지 엔진이 전담

p.78의 test_table에 대해서 INSERT, UPDATE, DE;ETE, SELECT, ... 등의 작업이 발생하면 InnoDB 스토리지 엔진이 그러한 처리를 담당한다.

그리고 각 스토리지 엔진은 성능 향상을 위해 키 캐시(MyISAM 스토리지 엔진)InnoDB버퍼 풀(InnoDB 스토리지 엔진)과 같은 기능을 내장하고 있다.

 

핸들러 요청

MySQL 엔진의 쿼리 실행기에서 데이터를 쓰거나 읽어야 할 때는 각 스토리지 엔진에 쓰기 또는 읽기를 요청하는데, 이러한 요청을 핸들러 요청이라고 한다. 여기서 사용되는 API를 핸들러 API라고 한다.

MySQL 스레드 구조

MySQL 서버는 프로세스 기반이 아니라 스레드 기반으로 작동

포그라운드(Foreground) 스레드백그라운드(Background) 스레드로 구분할 수 있다.

📝 포그라운드 스레드

  • 최소 접속된 클라이언트의 수만큼 존재(하나의 커넥션의 작업을 병렬로 처리할 수도 있음.)
  • 커넥션을 종료하면 스레드 캐시로 돌아가거나 종료. (스레드 캐시에 저장된 스레드 수를 일정하게 유지한다. 시스템 변수로 설정 가능)
  • 데이터 버퍼나 캐시로부터 데이터를 가져오는 작업을 주로 한다.

📝 백그라운드 스레드

  • 여러가지 작업을 처리하지만 가장 중요한 것은 로그 스레드와 쓰기 스레드이다.
  • mysql 5.5 버전부터 쓰기 스레드를 2개 이상 지정할 수 있고, 쓰기 스레드는 아주 많은 작업을 처리하기 때문에, 일반적인 재장 디스크를 사용할 때는 2~4개 정도로 충분히 설정하는 것이 좋다.
  • 읽기 지연은 절대 일어나지 않지만, os 여건에 따라 쓰기 지연을 일어날 수 있다. 따라서 보통 쓰기 작업을 버퍼링 해서 일괄처리 하도록 설계되어 있다. => 데이터가 디스크에 완전히 저장되는 걸 기다리지 않아도 된다! (InnoDB)
  • 하지만 MyISAM 은 사용자 스레드가 쓰기작업까지 함께 처리하도록 설계돼 있어서, 일반적인 쿼리는 쓰기 버퍼링을 이용할 수 없다.

메모리 할당 및 사용 구조

: 글로벌 메모리 영역과, 로컬 메모리 영역으로 나뉜다.

✏️ 글로벌 메모리 영역

  • 서버가 시작되면서 운영체제로부터 할당된다.
  • 모든 스레드에 의해 공유된다.
  • 보통 하나의 메모리 공간만 할당되지만, 필요에 따라 2개 이상의 공간을 할당받을 수도 있다.

✏️ 로컬 메모리 영역

  • 클라이언트 스레드가 쿼리를 처리하는데 사용하는 메모리 영역이다. => 클라이언트 메모리 영역, 세션 메모리 영역이라고도 한다.
  • 스레드 별로 공유되지 않는다.
  • 쿼리의 용도별로 필요할 때만 공간이 할당된다. 예로 커넥션버퍼나 결과버퍼는 커넥션이 열려있는 동안 계속 할당된 상태로 남아있고, 소트 버퍼나 조인 버퍼는 해당 쿼리를 실행하는 순간에만 할당하고 해제한다.

 

4) 플러그인 스토리지 엔진 모델

  • MySQL 은 플러그인 형태로 다양한 스토리지 엔진을 제공한다.
  • 스토리지 엔진 뿐만 아니라, 인증이나 파서(parser) 등도 플러그인 형태로 제공되고, 직접 개발해서 사용할 수 있다.
  • 스토리지 엔진의 데이터 읽기/쓰기 작업은 대부분 1건의 레코드 단위로 처리된다. group by  order by 등 복잡한 처리는 MySQL 엔진의 쿼리실행기 에서 처리된다.

 하나의 쿼리 작업은 여러 하위 작업으로 나뉘는데, 각 하위 작업이 MySQL 엔진 영역에서 처리되는지 아니면 스토리지 엔진 영역에서 처리되는지 구분할 줄 알아야한다.

mysql> SHOW ENGINES;
mysql> SHOW PLUGINS;

위와 같은 명령어로 설치되어 있는 스토리지 엔진과 플러그인을 확인할 수 있다.

 

5) 컴포넌트

: 기존 플러그인 모델의 단점을 대체하기 위해 등장.

✏️ 플러그인 모델의 단점

  • 플러그인은 MySQL 서버와 인터페이스할 수 있고, 플러그인끼리는 통신할 수 없다.
  • MySQL 서버의 변수나 함수를 직접 호출하기 때문에 안전하지 않다.
  • 상호 의존관계를 설정할 수 없어서 초기화가 어렵다.

 

6) 쿼리 실행 구조

  1. 쿼리 파서 - sql 쿼리를 알맞은 토큰으로 분리 -> 트리 형태로 변환 - 쿼리 문장의 기본 문법 오류를 인식
  2. 전처리기 - 토큰 트리를 문법으로 인식해, 문장에 구조적인 문제가 있는지 확인. - 토큰을 테이블 이름이나, 내장 함수 등과 같은 개체를 매핑해 해당 객체의 존재 여부를 파악. - 또는 해당 객체에 대한 접근 권한을 파악. - 존재하지 않거나 접근 불가능한 토큰은 걸러진다.
  3. 옵티마이저 - sql 문 최적화. dbms 의 두뇌에 해당.
  4. 실행엔진 - 옵티마이저가 두뇌라면 실행엔진과 핸들러는 손과 발에 비유할 수 있다. - 옵티마이저가 Group By 를 처리하기 위해 임시 테이블을 사용하기로 결정한다고 했을 때,
    • 실행 엔진이 핸들러에게 임시 테이블을 만들라고 요청
    • 다시 실행 엔진은 where 절에 일치하는 레코드를 읽어오라고 핸들러에게 요청
    • 읽어온 레코드들을 1번에서 준비한 임시 테이블로 저장하라고 다시 핸들러에게 요청
    • 데이터가 준비된 임시 테이블에서 필요하 방식으로 데이터를 읽어 오라고 핸들러에게 다시 요청
    • 최종적으로 실행 엔진은 결과를 사용자나 다른 모듈로 넘김

 

7) 쿼리 캐시

 MySQL 8.0 으로 올라오면서 쿼리 캐시는 완전히 제거됐다!

  • 기존에는 실행 결과를 메모리에 캐시했다.
  • 데이터가 변경되었을 때 캐시에 저장된 결과중에서 변경된 테이블과 관련된 것들을 모두 삭제해야한다.
  • 심각한 동시 처리 성능 저하 유발. 및 버그 발생 등의 문제.

 

8) 스레드 풀

  • 내부적으로 사용자의 요청을 처리하는 스레드 개수를 줄여 동시 처리되는 요청이 많다 하더라도, CPU가 제한된 개수의 스레트 처리에만 집중할 수 있게 해서 서버의 자원 소보를 줄이는 것이 목적
  • 엔터프라이즈 에디션은 스레드 풀을 제공하지만, 커뮤니티 에디션은 Percona Server 에서 제공하는 플러그인 형태의 스레드 풀을 이용해야한다.

 

9) 트랜젝션 지원 메타데이터

  • 데이터 딕셔너리(메타데이터) : 테이블의 구조 정보와 스토어드 프로그램 등의 정보. 파일 기반으로 관리했었다. 파일 기반의 메타데이터는 트랜잭션을 지원하지 않기 때문에 테이블을 생성 또는 변경 중에 서버가 비정상 종료되면 테이블 깨지는 현상이 있었다.
  • 8.0 버전부터는 데이터 딕셔너리를 모두 InnoDB의 테이블에 저장하도록 개선됐다. 시스템 테이블과 데이터 딕셔너리를 mysql DB에 저장한다. mysql DB는 통째로 mysql.ibd라는 이름의 테이블스페이스에 저장된다. 시스템 정보라 해당 db 에는 사용자가 접근할 수 없다.
  • MyISAM이나 CSV 등과 같은 스토리지 엔진의 메타 정보는 여전히 저장할 공간이 필요하다.

 

출처) https://gist.github.com/Dong-Hyeon-Yu/e93bbec55d5303698a6349595dc99b2d

728x90

관련글 더보기

댓글 영역