공부/Computer Science

[CS 면접 대비 공부] 데이터베이스

남쪽마을밤송이 2022. 8. 5. 21:57

 데이터베이스 풀 

  • Connection Pool
    • 클라이언트의 요청에 따라 각 어플리케이션의 스레드에서 데이터베이스에 접근하기 위해서는 Connection이 필요하다.
    • Connection Pool은 이런 Connection을 여러 개 생성해 두어 저장해 놓은 공간(캐시) 또는 이 공간의 Connection을 필요할 때 꺼내 쓰고 반환하는 기법을 말한다.

  • DB에 접근하는 단계
    • 웹 컨테이너가 실행되면서 DB와 연결된 Connection 객체들을 미리 생성하여 pool에 저장한다.
    • DB에 요청시, pool에서 Connection 객체를 가져와 DB에 접근한다.
    • 처리가 끝나면 다시 Pool에 반환한다.

  • Connection이 부족하면?
    • 모든 요청이 DB에 접근하고 있고 남은 Connection이 없다면, 해당 클라이언트는 대기 상태로 전환시키고 Pool에 Connection이 반환되면 대기 상태에 있는 클라이언트에게 순차적으로 제공된다.
  • 왜 사용할까?
    • 매 연결마다 Connection 객체를 생성하고 소멸시키는 비용을 줄일 수 있다.
    • 미리 생성된 Connection 객체를 사용하기 때문에, DB 접근 시간이 단축된다.
    • DB에 접근하는 Connection의 수를 제한하여, 메모리와 DB에 걸리는 부하를 조정할 수 있다.
  • Thread Pool
    • 비슷한 맥락으로 Thread Pool이라는 개념도 있다.
    • 이 역시 매 요청마다 요청을 처리할 Thread를 만드는 것이 아닌, 미리 생성한 Pool 내의 Thread를 소멸시키지 않고 재사용하여 효율적으로 자원을 활용하는 기법이다.
  • Thread Pool과 Connection Pool
    •  WAS에서 Thread Pool과 Connection Pool 내의 Thread와 Connection의 수는 직접적으로 메모리와 관련이 있기 때문에, 많이 사용하면 할수록 메모리를 많이 점유하게 된다. 그렇다고 반대로 메모리를 위해 적게 지정한다면, 서버에서는 많은 요청을 처리하지 못하고 대기할 수 밖에 없다.
    • 보통 WAS의 Thread 수가 Connection의 수보다 많은 것이 좋은데, 그 이유는 모든 요청이 DB에 접근하는 작업이 아니기 때문이다.

 

 트랜잭션 

  • 트랜잭션(Transaction)이란
    • 데이터베이스의 상태를 변환시키는 하나의 논리적인 작업 단위를 구성하는 연산들의 집합이다.
      • 예를 들어, A계좌에서 B계좌로 일정 금액을 이체한다고 가정하자.
        • A계좌의 잔액을 확인한다.
        • A계좌의 금액에서 이체할 금액을 빼고 다시 저장한다.
        • B계좌의 잔액을 확인한다.
        • B계좌의 금액에서 이체할 금액을 더하고 다시 저장한다.
      • 이러한 과정들이 모두 합쳐져 계좌이체라는 하나의 작업 단위를 구성한다.
    • 하나의 트랜잭션은 Commit되거나 Rollback된다.
      • Commit 연산
        • 한 개의 논리적 단위(트랜잭션)에 대한 작업이 성공적으로 끝나 데이터베이스가 다시 일관된 상태에 있을 때, 이 트랜잭션이 행한 갱신 연산이 완료된 것을 트랜잭션 관리자에게 알려주는 연산이다.
      • Rollback 연산
        • 하나의 트랜잭션 처리가 비정상적으로 종료되어 데이터베이스의 일관성을 깨뜨렸을 때, 이 트랜잭션의 일부가 정상적으로 처리되었더라도 트랜잭션의 원자성을 구현하기 위해 이 트랜잭션이 행한 모든 연산을 취소(Undo)하는 연산이다.
        • Rollback 시에는 해당 트랜잭션을 재시작하거나 폐기한다.
      • 데이터베이스 응용 프로그램은 트랜잭션들의 집합으로 정의할 수 있다.
  • 트랜잭션의 성질(ACID)
    • 원자성(Atomicity), All or nothing
      • 트랜잭션의 모든 연산들은 정상적으로 수행 완료되거나 아니면 전혀 어떠한 연산도 수행되지 않은 상태를 보장해야 한다.
    • 일관성(Consistency)
      • 트랜잭션 완료 후에도 데이터베이스가 일관된 상태로 유지되어야 하낟.
    • 독립성(Isolation)
      • 하나의 트랜잭션이 실행하는 도중에 변경한 데이터는 이 트랜잭션이 완료될 때까지 다른 트랜잭션이 참조하지 못한다.
    • 지속성(Durability)
      • 성공적으로 수행된 트랜잭션은 영원히 반영되어야 한다.
  • 트랜잭션의 필요성
    • 현금 인출기를 작동하는 도중에 기계 오류나 정전 등과 같은 예기치 않은 상황이 발생하여 카드가 나오지 않거나 기계가 멈추는 경우
    • 각각 다른 지점의 은행에서 동시에 인출할 때, 하나의 지점이 다른 지점에서 저장한 잔액을 덮어 쓰는 경우
    • 위와 같은 상황이 발생하지 않도록 방지하기 위해, 즉, 트랜잭션의 성질인 ACID를 제공받기 위해 트랜잭션을 사용한다.
  • 트랜잭션의 상태
    • 활동(Active)
      • 트랜잭션이 실행 중에 있는 상태, 연산들이 정상적으로 실행 중인 상태
    • 장애(Failed)
      • 트랜잭션이 실행에 오류가 발생하여 중단된 상태
    • 절회(Aborted)
      • 트랜잭션이 비정상적으로 종료되어 Rollback 연산을 수행한 상태
    • 부분 완료(Partially Commited)
      • 트랜잭션이 마지막 연산까지 실행했지만, Commit 연산이 실행되기 직전의 상태
    • 완료(Commited)
      • 트랜잭션이 성공적으로 종료되어 Commit 연산을 실행한 후의 상태
  • 트랜잭션 격리 수준
    • Isolation Level이란?
      • 트랜잭션에서 일관성이 없는 데이터를 허용하도록 하는 수준
    • Isolation Level의 필요성
      • 데이터베이스는 ACID 같이 트랜잭션이 원자적이면서도 독립적인 수행을 하도록 한다.
      • 그래서 Locking이라는 개념이 등장한다.
        • 트랜잭션이 DB를 다루는 동안 다른 트랜잭션이 관여하지 못하게 막는 것