공부/Computer Science

[CS 면접 대비 공부] 운영체제

남쪽마을밤송이 2022. 8. 3. 04:31

 운영체제 

  • 운영체제란
    • 운영체제는 사용자에게 편리한 인터페이스 환경을 제공하고 컴퓨터 시스템의 자원을 효율적으로 관리하는 소프트웨어입니다.
  • 운영체제의 구성
    • 운영체제는 인터페이스(GUI)와 시스템 호출(System Call), 커널(Kernel)과 드라이버(Driver)로 구성됩니다.
    • 이 중 사용자와 응용 프로그램에 인접하여 커널에 명령을 전달하고 실행 결과를 사용자와 응용 프로그램에 돌려주는 인터페이스와 운영체제의 핵심 기능을 모아놓은 커널로 구분됩니다.
  • 운영체제의 역할과 목적
    • 효율적인 자원 관리
    • 안정적인 자원 보호
    • 확장성 높은 하드웨어 인터페이스 제공
    • 편리한 사용자 인터페이스 제공

 

 커널과 인터페이스 

  • 커널(kernel)은 운영체제의 핵심 기능을 모아놓은 것이며, 인터페이스(interface)는 사용자와 응용 프로그램에 인접해 커널에 명령을 전달하고 실행 결과를 반환한다.

 (1) 커널 

  • 커널이란
    • 커널은 프로세스, 메모리, 저장장치 관리와 같이 운영체제의 핵심적인 기능을 모아놓은 것으로 자동차에 비유하자면 엔진에 해당한다.
  • 커널의 주요 역할
    • 프로세스 관리 : 프로세스에 CPU 배분 및 필요한 작업 환경 제공
    • 메모리 관리 : 프로세스에 작업 공간을 배치하고 실제 메모리보다 큰 가상공간 제공
    • 파일 시스템 관리 : 데이터 저장 및 접근 가능한 인터페이스 제공
    • 입출력 관리 : 필요한 입출력 서비스 제공
    • 프로세스 간 통신(IPC) 관리 : 공동 작업을 위한 프로세스 간 통신 환경 지원

 (2) 인터페이스 

  • 인터페이스란
    • 운영체제의 인터페이스는 커널에 사용자 명령을 전달하고, 실행 결과를 사용자에게 알려주는 역할을 한다. 응용 프로그램과 커널의 인터페이스는 시스템 호출, 커널과 하드웨어의 인터페이스는 드라이버가 담당한다.
    • 자동차를 사람이 조작해야 하는 것처럼 핸들과 브레이크, 계기판 등과 같은 역할을 인터페이스라고 한다.

 

 메모리 

  • 메모리의 구성
    • 코드 영역 : 실행될 프로그램의 코드가 저장된다.
    • 데이터 영역 : 전역 변수와 정적 변수가 저장된다.
    • 스택 영역 : 지역변수와 매개 변수가 저장되어 있으며, 함수의 호출과 함께 할당한다. 컴파일 타임에 크기가 결정된다.
    • 힙 영역 : 사용자에 의해 동적으로 할당되고 해제될 수 있는 메모리 영역, 런 타임에 크기가 결정된다.
  • 메모리의 종류
    • RAM (Random Access Memory)
    • ROM (Read Only Memory)
  • 메모리 계층 (Memory Hierarchy)
    • 메모리 계층은 CPU가 메모리에 더욱 빠르게 접근하기 위해 나눈 구조이다.
    • 레지스터와 캐시는 CPU 내부에 존재하므로 CPU는 아주 빠르게 접근할 수 있다.
    • 메모리는 CPU 외부에 존재하므로 레지스터와 캐시보다는 더 느리게 접근할 수 밖에 없다.
    • 하드 디스크는 CPU가 직접 접근할 방법이 없다. 따라서 CPU는 하드 디스크의 데이터를 메모리로 이동시키고, 이 메모리에서 접근하므로 속도가 아주 느리다.

 

 메모리 심화 

  • 메모리 관리 전략
    • 메모리는 CPU가 직접 접근하는 유일한 저장장치이다.
    • 메모리 시스템(하드웨어)은 주소(메모리 위치)를 관리하며 할당과 접근을 제어하는데, 이는 제한된 물리적 메모리의 효율적인 사용(할당)효율적인 메모리 참조(논리-물리주소 할당)를 위함이다.
    • 이러한 관리에는 여러 전략이 있다.
      • 스와핑 (Swapping) : CPU에서 실행 중이지 않은 프로세스의 메모리 이미지를 저장 장치에 이동시켜 메모리 사용의 효율성을 증가시킨다.
      • 연속 메모리 할당 (Contiguous Memory Allocation) : 각 프로세스가 필요로 하는 메모리 요구량을 분석한 뒤, 필요한 메모리를 연속으로 할당(연속된 물리 메모리이므로 시작 주소만 필요)한다.
      • 페이징 (Paging) : 프로세스가 사용하는 주소 공간을 여러 개로 분할하여 비연속적인 물리 메모리 공간에 할당, 가상 메모리를 모두 같은 크기의 블록으로 편성한다.
      • 세그멘테이션 (Segmentaion) : 프로세스가 필요로 하는 메모리 공간을 분할하여 비연속적인 물리 메모리 공간에 할당한다. (페이징으로 대부분 대체)
  • 메모리 할당 알고리즘
    • 새로 적재되어야 할 데이터(페이지, 세그먼트 등)를 주기억장치 영역 중 어느 곳에 배치할지를 결정하는 전략이다.
    • 메모리 할당 알고리즘 종류
      • 최초 적합 (First-fit) : 가용공간 중 수용가능한 첫 번째 기억공간을 할당한다.
      • 최적 적합 (Best-fit) : 모든 공간 중 수용가능한 가장 작은 곳을 선택한다.
      • 최악 적합 (Worst-fit) : 모든 공간 중에서 수용가능한 가장 큰 곳을 선택한다.
    • 따라서 공간 효율성은 최적 적합 > 최초 적합 > 최악 적합 순으로, 시간 효율성은 최초 적합 > 최적 적합 ≒ 최악적합 순이 된다.
  • 페이지 교체 알고리즘
    • 페이지 부재 발생시 새로운 페이지를 할당하기 위해 현재 할당된 페이지 중 어느 것과 교체할 지를 결정하는 전략이다.
    • 페이지 교체 알고리즘 종류
      • FIFO (First-In, First-Out) : 메모리에 올라온 지 가장 오래된 페이지를 교체합니다.
      • 최적 페이지 교체 (Optimal Page Replace) : 이론상 최적 알고리즘입니다.
      • NRU 페이지 교체 (Not-Recently-Used) : 최근 미사용 페이지를 교체합니다.
      • LRU 페이지 교체 (Least-Recently-Used) : 가장 오래 사용되지 않은 페이지를 교체합니다.
      • LFU 페이지 교체 (Least-Frequently-Used) : 참조 횟수가 가장 작은 페이지를 교체합니다.
      • MFU 페이지 교체 (Most-Frequently-Used) : 참조 횟수가 가장 많은 페이지를 교체합니다.

 

 가상 메모리 

 

 캐시 

 

 인터럽트 

 

 병렬 처리 

 

 프로세스와 스레드의 차이 

  • 프로그램이란
    • 사전적 의미 : 어떤 작업을 위해 실행할 수 있는 파일
  • 프로세스란
    • 사전적 의미 : 컴퓨터에서 연속적으로 실행되고 있는 컴퓨터 프로그램
      • 메모리에 올라와 실행되고 있는 프로그램의 인스턴스(독립적인 개체)
      • 운영체제로부터 시스템 자원을 할당받는 작업의 단위
      • 즉, 동적인 개념으로는 실행된 프로그램을 의미
    • 할당받는 시스템 자원의 예
      • CPU 시간
      • 운영되기 위해 필요한 주소 공간
      • Code, Data, Stack, Heap의 구조로 되어 있는 독립된 메모리 영역 
        • 특징
          • 프로세스는 각각 독립된 메모리 영역(Code, Data, Stack, Heap의 구조)을 할당받는다.
          • 기본적으로 프로세스당 최소 1개의 스레드(메인 스레드)를 가지고 있다.
          • 각 프로세스는 별도의 주소 공간에서 실행되며, 한 프로세스는 다른 프로세스의 변수나 자료구조에 접근할 수 없다.
          • 한 프로세스가 다른 프로세스의 자원에 접근하려면 프로세스간의 통신(IPC, inter-process communication)을 사용해야 한다.
            (ex. 파이프, 파일, 소켓 등을 이용한 통신 방법)

  • 스레드란
    • 사전적 의미 : 프로세스 내에서 실행되는 여러 흐름의 단위
      • 프로세스의 특정한 수행 경로
      • 프로세스가 할당받은 자원을 이용하는 실행의 단위
    • 특징
      • 스레드는 프로세스 내에서 각각 Stack만 따로 할당받고 Code, Data, Heap 영역은 공유한다.
      • 다시 말하면 스레드는 한 프로세스 내에서 동작되는 여러 실행의 흐름으로, 프로세스 내의 주소 공간이나 자원들(Heap 공간 등)을 같은 프로세스 내의 스레드끼리 공유하면서 실행된다.
      • 같은 프로세스 안에 있는 여러 스레드들은 같은 Heap 공간을 공유한다. 반면에 프로세스는 다른 프로세스의 메모리에 직접 접근할 수 없다.
      • 각각의 스레드는 별도의 Register와 Stack을 갖고 있지만, Heap 메모리는 서로 읽고 쓸 수 있다.
      • 한 스레드가 프로세스 자원을 변경하면, 다른 이웃 스레드(sibling thread)도 그 변경 결과를 즉시 볼 수 있다.
  • 자바 스레드란 
    • 일반 스레드와 거의 차이가 없으며, JVM이 운영체제의 역할을 한다.
    • 자바에는 프로세스가 존재하지 않고 스레드만 존재하며, 자바 스레드는 JVM에 의해 스케줄되는 실행 단위 코드 블록이다.
    • 자바에서 스레드 스케줄링은 전적으로 JVM에 의해 이루어진다.
    • 아래와 같은 스레드와 관련된 많은 정보들도 JVM이 관리한다.
      • 스레드가 몇 개 존재하는지
      • 스레드로 실행되는 프로그램 코드의 메모리 위치는 어디인지
      • 스레드의 상태는 무엇인지
      • 스레드 우선순위는 얼마인지
    • 즉, 개발자는 자바 스레드로 작동할 스레드 코드를 작성하고, 스레드 코드가 생명을 가지고 실행을 시작하도록 JVM에 요청하는 일을 할 뿐이다.

 

 Thread-Safe 

 

 멀티 프로세스 대신 멀티 스레드를 사용하는 이유 

  • 쉽게 설명하면, 프로그램을 여러 개 키는 것보다 하나의 프로그램 안에서 여러 작업을 해결하는 것이다.
  • 멀티 스레드를 사용하면 좋은점
    1. 자원의 효율성 증대
      • 멀티 프로세스로 실행되는 작업을 멀티 스레드로 실행할 경우, 프로세스를 생성하여 자원을 할당하는 시스템 콜이 줄어들어 자원을 효율적으로 관리할 수 있다.
        • 프로세스 간의 문맥 교환(Context Switching)시 단순히 CPU 레지스터 교체 뿐만 아니라 RAM과 CPU 사이의 캐시 메모리에 대한 데이터까지 초기화되므로 오버헤드가 크기 때문
      • 스레드는 프로세스 내의 메모리를 공유하기 때문에 독립적인 프로세스와 달리 스레드 간 데이터를 주고 받는 것이 간단해지고 시스템 자원 소모가 줄어들게 된다.
    2. 처리 비용 감소 및 응답 시간 단축
      • 또한 프로세스 간의 통신(IPC)보다 스레드 간의 통신의 비용이 적으므로 작업들 간의 통신의 부담이 줄어든다.
        • 스레드는 Stack 영역을 제외한 모든 메모리를 공유하기 때문
      • 프로세스 간의 전환 속도보다 스레드 간의 전환 속도가 빠르다.
        • 문맥 교환(Context Switching)시 스레드는 Stack 영역만 처리하기(바꾸기) 때문
  • 멀티 스레드를 사용할 때 주의할 점
    • 동기화 문제
      • 스레드 간의 자원 공유는 전역 변수(데이터 세그먼트)를 이용하므로 함께 상용할 때 충돌이 발생할 수 있다.

 

 뮤텍스와 세마포어의 차이 

 (1) 뮤텍스(Mutex) 

  • 공유된 자원의 데이터에 여러 스레드가 접근하는 것을 막는 것
  • 상호배제라고도 하며, Critical Section을 가진 스레드의 Running Time이 서로 겹치지 않도록 각각 단독으로 실행하게 하는 기술이다.
  • 다중 프로세스들의 공유 리소스에 대한 접근을 조율하기 위해 synchronized 또는 lock을 사용한다.
    • 즉, 뮤텍스 객체를 두 스레드가 동시에 사용할 수 없다.

 (2) 세마포어(Semaphore) 

  • 공유된 자원의 데이터를 여러 프로세스가 접근하는 것을 막는 것
  • 리소스 상태를 나타내는 간단한 카운터로 생각할 수 있다.
    • 운영체제 또는 커널의 한 지정된 저장장치 내의 값이다.
    • 일반적으로 비교적 긴 시간을 확보하는 리소스에 대해 이용한다.
    • 유닉스 시스템 프로그래밍에서 세마포어는 운영체제의 리소스를 경쟁적으로 사용하는 다중 프로세스에서 행동을 조정하거나 또는 동기화 시키는 기술이다.
  • 공유 리소스에 접근할 수 있는 프로세스의 최대 허용치만큼 동시에 사용자가 접근하여 사용할 수 있다.
  • 각 프로세스는 세마포어 값을 확인하고 변경할 수 있다.
    • 사용중이지 않는 자원의 경우 그 프로세스가 즉시 자원을 사용할 수 있다.
    • 이미 다른 프로세스에 의해 사용 중이라는 사실을 알게 되면 재시도하기 전에 일정 시간을 기다려야 한다.
  • 세마포어를 사용하는 프로세스는 그 값을 확인하고, 자원을 사용하는 동안에는 그 값을 변경함으로써 다른 세마포어 사용자들이 기다리도록 해야 한다.
    • 이를 위해 세마포어는 이진수(0 또는 1)를 사용하거나, 또는 추가적인 값을 가질 수도 있다.

 (3) 둘의 차이 

  • 가장 큰 차이점은 관리하는 동기화 대상의 개수이다.
    • Mutex는 동기화 대상이 오직 하나뿐일 때, Semaphore는 동기화 대상이 하나 이상일 때 사용한다.
    • Semaphore는 Mutex가 될 수 있지만 Mutex는 Semaphore가 될 수 없다.
      • 즉, Mutex는 상태가 0, 1 두 개 뿐인 Binary Semaphore라고 할 수 있다.
    • Semaphore는 소유할 수 없는 반면, Mutex는 소유가 가능하며 소유주가 이에 대한 책임을 가진다.
      • Mutex의 경우 상태가 두 개 뿐인 lock이므로 lock을 가질 수 있다.
    • Mutex의 경우 Mutex를 소유하고 있는 스레드가 이 Mutex를 해제할 수 있다. 하지만 Semaphore의 경우 Semaphore를 소유하지 않는 스레드가 Semaphore를 해제할 수 있다.
    • Semaphore는 시스템 범위에 걸쳐있고 파일시스템상의 파일 형태로 존재하는 반면 Mutex는 프로세스 범위를 가지며 프로세스가 종료될 때 자동으로 Clean Up 된다.

 

 동기와 비동기 

  • 동기(Synchronous)란?
    • '동기'라고 하면 다수의개체들이 동일한 무언가를 가지는 것, 또는 무언가가 동일하게 되는 것.
    • 그 무언가는 상태, 행위, 시간, 속도, 주기, 출현 등이 될 수 있다.
    • 여기서 말하는 '동기'는 두 개의 프로세스가 데이터를 주고 받을 때, 주고 받는 순서(또는 시간)가 일정하다는 것을 뜻한다. (너 한 번, 나 한 번)
  • 비동기(Asynchronous)란?
    • '동기'가 아닌 것
  • 동기식, 동기적이다란?
    • 어떤 작업을 요청했을 때 그 작업이 종료될 때까지 기다린 후 그 다음 작업을 수행하낟.
      • 데이터를 주고받는 '순서'가 중요할 때 사용된다.
      • 요청한 작업만 처리하면 되기 때문에 전체적인 수행 속도는 빠를 수 있다.
      • 한 작업에 대한 시간이 길어질 경우, 전체 응답이 지연될 수 있다.
  • 비동기식, 비동기적이다란?
    • 어떤 작업을 요청했을 때 그 작업이 종료될 때까지 기다리지 않고(작업을 위임하고), 다음 작업을 수행한다. 요청했던 작업이 끝나면 결과를 받고, 그에 따른 추가 작업이 있다면 수행한다.
      • 요청 순서에 상환없이, 동시에 다수의 작업을 처리할 수 있다.
      • 작업이 끝날 때 따로 이벤트를 감지하고 결과를 받아 그에 따른 추가 작업을 해줘야하기 때문에, 비교적 느릴 수 있다.
      • I/O 작업이 잦고, 빠른 응답속도를 요구하는 프로그램에 적합하다.

 

 교착상태의 개념과 조건 

  • 교착상태(데드락, Deadlock)이란
    • 첫 번째 스레드는 두 번째 스레드가 들고 있는 객체(자원)의 락이 풀리기를 기다리고 있고, 두 번째 스레드 역시 첫 번째 스레드가 들고 있는 객체의 락이 풀리기를 기다리는 상황을 일컷는다.
    • 모든 스레드가 락이 풀리기를 기다리고 있기 때문에, 무한 대기 상태에 빠지게 된다. 이런 스레드를 교착상태에 빠졌다고 한다.
  • 교착상태의 4가지 조건
    • 상호 배제
      • 한 번에 한 프로세스만 공유 자원을 사용할 수 있다.
      • 좀 더 정확하게는, 공유 자원에 대한 접근 권한이 제한된다. 자원의 양이 제한되어 있더라도 교착상태는 발생할 수 있다.
    • 점유 대기(Hold and Wait)
      • 공유 자원에 대한 접근 권한을 갖고 있는 프로세스가, 그 접근 권한을 양보하지 않은 상태에서 다른 자원에 대한 접근 권한을 요구할 수 있다.
    • 비선점 = 선취 불가능
      • 한 프로세스가 다른 프로세스의 자원 접근 권한을 강제로 취소할 수 없다.
    • 순환 대기 = 대기 상태의 사이클
      • 두 개 이상의 프로세스가 자원 접근을 기다리는데, 그 관계에 사이클이 존재한다.
      • 대기가 꼬리를 물고 사이클이 되어 자기 순서로 돌아와도 기다리는 경우를 말한다.
  • 교착상태 방지법
    • 4가지 조건들 가운데 하나를 제거하면 된다.
    • 공유 자원 중 많은 경우가 한 번에 한 프로세스만 사용할 수 있기 때문에 (예를 들어 프린트) 1번 조건은 제거하기 어렵다.
    • 대부분의 교착상태 방지 알고리즘은 4번 조건, 즉 대기 상태의 사이클이 발생하는 일을 막는 데 초점이 맞춰져 있다.

 

 PCB와 문맥 교환(Context Switching) 

  • Process Management이란
    • CPU가 프로세스가 여러개일 때, CPU 스케줄링을 통해 관리하는 것을 말한다.
    • 이 때 CPU는 각 프로세스들이 누군지 알아야 관리가 가능하다.
    • 따라서 프로세스들의 특징을 갖고 있는 것이 바로 Process Metadata이다.
      • Process ID
      • Process State
      • Process Priority
      • CPU Registers
      • Owner
      • CPU Usage
      • Memory Usage
    • 이 메타데이터는 프로세스가 생성되면 PCB라는 곳에 저장된다.
  • PCB (Process Control Block)이란
    • 프로세스 메타데이터들을 저장해 놓는 곳, 한 PCB 안에는 한 프로세스의 정보가 담긴다.
    • CPU에서는 프로세스의 상태에 따라 교체작업이 이루어지는데 (예를 들어 interrupt가 발생) 이 때 앞으로 다시 수행할 대기 중인 프로세스에 관한 저장 값을 PCB에 저장해두는 것이다.
    • PCB 관리
      • PCB는 Linked List 방식으로 관리된다. 
      • PCB List Head에 PCB들이 생성될 때마다 붙게 된다.
      • 주소값으로 연결이 이루어져 있는 연결리스트이기 때문에 삽입 삭제가 용이하다.
      • 즉, 프로세스가 생성되면 해당 PCB가 생성되고 프로세스 완료시 제거된다.
  • 문맥 교환(Context Switching)이란
    • 현재 진행하고 있는 Task(Process, Thread)의 상태를 저장하고 다음 진행할 Task의 상태 값을 읽어 적용하는 과정을 말한다.
    • Context Switching 과정
      • Task의 대부분 정보는 Register에 저장되고 PCB로 관리된다.
      • 현재 실행하고 있는 Task의 PCB 정보를 저장한다.
      • 다음 실행할 Task의 PCB 정보를 읽어 Register에 적재하고 CPU가 이전에 진행했던 과정을 연속적으로 수행할 수 있다.
    • Context Switching Cost (Process vs Thread)
      • Process Context Switching 비용 > Thread Context Switching 비용
      • Thread는 Stack 영역을 제외한 모든 메모리를 공유하므로 Context Switching 수행 시 Stack 영역만 변경하면 되기 때문에 비용이 적게 든다.
    • Context Switching Overhead
      • overhead는 과부하라는 뜻으로 보통 안좋은 말로 많이 쓰인다.
      • 하지만 프로세스 작업 중에는 다음과 같이 overhead를 감수해야 하는 상황이 있다.
        • 프로세스를 수행하다가 입출력 이벤트가 발생해서 대기 상태로 전환시킴
          이때, CPU를 그냥 놀게 놔두는 것보다 다른 프로세스를 수행시키는 것이 효율적임
      • 즉, CPU에 계속 프로세스를 수행시키도록 하기 위해서 다른 프로세스를 실행시키고 Context Switching 하는 것이다.
      • CPU가 놀지 않도록 만들고, 사용자에게 빠르게 일처리를 제공할 수 있다.

 

 

참고

https://github.com/InSeong-So/IT-Note/tree/master/chapter02-%EC%9A%B4%EC%98%81%EC%B2%B4%EC%A0%9C

https://github.com/WeareSoft/tech-interview#5-design-pattern

https://github.com/gyoogle/tech-interview-for-developer/blob/master/Computer%20Science/Operating%20System/PCB%20%26%20Context%20Switcing.md