세션(Session)이란?
세션(Session)은 클라이언트와 웹서버 간 네트워크 연결이 지속 유지되고 있는 상태를 말한다. 즉, 사용자가 브라우저를 열어 서버에 접속한 뒤 접속을 종료할 때까지의 시점을 말한다. HTTP 프로토콜은 비접속형 프로토콜이므로, 매 접속마다 새로운 네트워크 연결이 이루어지는데 세션이 연결 유지를 가능하게 한다.
클라이언트가 웹서버에 Request를 보내면 해당 서버의 엔진이 클라이언트에게 유일한 ID를 부여하는데, 이를 세션ID라고 한다. 세션ID는 임시로 저장하여 페이지 이동 시 이용하거나, 클라이언트가 재접속 했을 때 클라이언트를 유일하게 구분하는 수단이 된다. 정보들이 서버단에 저장되기 때문에 보안 면에서 쿠키보다 우수하다.
다중 서버 환경에서 세션을 관리하는 방법
- Sticky Session
- Session Clustering
- Inmemory DB를 이용한 세션 storage
1. Stickey Session
Stickey Session은 말 그대로 고정된 세션을 의미한다. Load Balance가 기본적으로 라운드 로빈 방식으로 트래픽을 분산하며, 이 Stickey Session의 핵심은 로드 밸런스가 얼마나 오랫동안 동일한 인스턴스로 사용자 요청을 일관되게 라우팅 하도록 하느냐 이다.
즉, 특정 사용자가 접속을 시도했을 때 처음 접속된 서버로 계속해서 접속되도록 트래픽을 처리하는 방식이다.
예를들어, User1이 1번부터 3번까지의 서버 중 1번 서버에 세션을 생성하였다면, 이후에 User1이 보내는 모든 요청은 Load Balancer에 의해 리다이렉트되어 1번 서버로만 보내지게 된다. 이를 위해 로드 밸런서는 요청을 받으면 가장 먼저 요청에 쿠키가 존재하는지 확인하고, 쿠키가 있다면 지정된 서버로 전송된다. 쿠키가 없는경우 기존 로드밸런싱 알고리즘 기반으로 서버를 선정한다.
Stickey Session 방식을 이용하면 사용자는 세션이 유지되는 동안 동일한 서버만을 사용하기 때문에 정합성 이슈에서 자유로워질 수 있다. 하지만 고정된 세션을 사용한다는 것은 특정 서버에 트래픽이 집중될 위험이 있기 때문에 자신의 서버에 트래픽이 집중되어있더라도 다른 서버를 사용할 수 없다. 또한 하나의 서버에 장애가 발생한다면 해당 서버를 사용하는 사용자들은 세션 정보를 잃게 되어 가용성이 떨어진다.
2. 세션 클러스터링 (Session Clustering)
Stickey Session을 이용하면 정합성 이슈를 해결할 수 있지만 가용성과 트래픽 분산을 완벽히 확보할 수 없다. Session Clustering은 정합성 이슈를 해결하면서 가용성과 트래픽 분산까지 확보 할 수 있는 세션 관리 방식이다.
Clustering이란 여러 대의 컴퓨터들이 하나의 시스템처럼 동작하도록 만드는 것이다. Session Clustering은 WAS가 2대 이상 설치 형태일 때 동일한 세션으로 관리하는 것을 의미한다.
세션을 복제하면 유저가 이후에 어떤 서버에 접속하더라도 데이터가 세션에 복제되어 있으므로 정합성 이슈가 해결된다. 하지만 모든 서버가 동일한 세션 객체를 가져야하기 때문에 많은 메모리가 필요하다. 또한 세션 저장소에 저장될 때마다 모든 서버에 입력해야 하므로 트래픽 증가로 인해 서버수가 증가할 때 성능 저하가 발생하게 된다. 이보다 가장 치명적인 단점은 여러 대의 서버로 하나의 서비스를 위해 사용함으로써 데이터 불일치가 잠재적으로 발생할 수 있다. Session Clustering은 가용성과 트래픽 분산을 이용할 수 있지만 세션 저장소를 저장할 때마다 성능적 한계가 명확하다.
3. 세션 스토리지 분리(Inmemory DB)
세션 스토리지 분리란 기존 서버가 갖고있는 세션 저장소를 이용하는 것이 아니라, 별도의 세션 저장소를 사용하여 세션 스토리지를 분리하는 것이다. Inmemory DB란 데이터 스토리지의 메인 메모리에 설치되어 운영되는 방식의 데이터베이스 시스템이다. 메모리 접근이 디스크 접근보다 빠르며 데이터를 조회할 때 검색 시간이 줄어든다. 대표적으로 Redis와 Memcached가 있다.
위와 같이 세션 스토리지가 분리되면 서버가 아무리 늘어난다고 할 지라도 세션 스토리지에 대한 정보만 각각의 서버에 입력해주면 세션을 공유할 수 있게된다. 이러한 방식을 사용한다면 트래픽이 비정상적으로 몰리는 현상을 고려하지 않아도 되고, 서버 하나가 장애가 발생하더라도 별도의 세션 저장소가 존재하기 때문에 가용성을 확보할 수 있다. 뿐만 아니라 여러 대의 서버가 하나의 세션을 이용하기 때문에 개별적으로 갖고있던 로컬 세션 저장소의 데이터 불일치가 발생하지 않는다. 단, 하나의 세션 저장소를 운영하는 것은 해당 세션 저장소에 장애가 발생하면 모든 세션이 이용 불가하기 때문에 복제를 구성하는 것이 좋다.
'IT > 인프라' 카테고리의 다른 글
L4 로드밸런싱 방법 종류 (0) | 2020.10.20 |
---|---|
PCI-DSS 조치 후기. (0) | 2018.12.26 |
파이썬(Python) 웹 프레임워크 장고(Django) 이클립스 설정 (0) | 2018.12.18 |
centos 7.0에서 was(tomcat9) 설치하기! (0) | 2018.12.10 |
댓글