[Web] 쿠키 & 세션 & 캐시

[Web] 쿠키 & 세션 & 캐시


HTTP 프로토콜의 특징이자 약점을 보완하기 위해서 사용


HTTP 프로토콜의 특징


1. 비연결지향(Connectionless)

HTTP는 먼저 클라이언트가 request를 서버에 보내면, 서버는 클라이언트에게 요청에 맞는 response를 보내고 접속을 끊는 특성이 있다.

헤더에 keep-alive라는 값을 줘서 커넥션을 재활용하는데 HTTP1.1에서는 이것이 default이다.

HTTP가 tcp위에서 구현되기 때문에(tcp는 연결지향, udp는 비연결지향) 연결지향이라고 할 수도 있다는 얘기도 있고 논란도 있으나 아직까지는 네트워크 관점에서 keep-alive는 옵션으로 두고 connectionless의 연결비용을 줄이는 것이 명확한 장점이기 때문에 비 연결지향이라고 알아둔다.

2. 상태정보유지안함(Stateless)

연결을 끊는 순간 클라이언트와 서버의 통신이 끝나며 상태 정보는 유지하는 않는 특성이 있다.


HTTP의 이 두가지 특성을 보완하기 위해서 쿠키와 세션을 사용하게 되었다.

비연결지향이라는 특성 덕분에 계속해서 통신 연결을 유지하지 않아서 리소스 낭비가 줄어드는 것은 아주 큰 장점이지만, 통신할 때마다 새로 커넥션을 열기 때문에 클라이언트는 내가 누구인지 인증을 계속해야하는 단점이 생긴다.

만약 쿠키와 세션이 없다면 어떤 페이지에서 옮겨 다닐때마다 로그인을 다시 해야 한다.


쿠키


쿠키는 클라이언트 로컬에 저장되는 키와 값이 들어있는 작은 데이터 파일이다.

쿠키에는 이름, 값, 만료날짜(쿠키 저장기간), 경로 정보가 들어있다.

쿠키는 일정시간동안 데이터를 저장할 수 있다.(로그인 상태 유지에 활용)

쿠키는 사용자가 웹사이트에 접속할 때 생성되는 파일이다.

쿠키는 클라이언트의 상태 정보를 로컬에 저장했다가 참조한다.

쿠키는 웹사이트가 생성하고 웹브라우저에 저장된다.

쿠키 프로세스

  1. 브라우저에서 웹 페이지 접속
  2. 클라이언트가 요청한 웹페이지를 받으면서 쿠키를 클라이언트 로컬에 저장
  3. 클라이언트가 재 요청시 웹페이지 요청과 함께 쿠키값도 전송
  4. 지속적으로 로그인 정보를 가지고 있는 것처럼 사용

쿠키 사용 사례

  • 자동 로그인, 팝업에서 "오늘 더 이상 이 창을 보지 않음" 체크, 쇼핑몰의 장바구니

쿠키의 제한

  • 클라이언트에서  300개까지 쿠키저장 가능, 하나의 도메인당 20개의 값만 가질 수 있음
  • 하나의 쿠키값은 4KB까지 저장
쿠키는 사용자가 따로 요청하지 않아도 브라우저가 Request시 Request Header를 넣어서 자동으로 서버에 전송한다.


세션


일정 시간동안 같은 사용자(정확하게 브라우저를 말한다)부터 들어오는 일련의 요구를 하나의 상태로 보고 그 상태를 유지하는 기술

  • (일정시간) : 방문자가 웹 브라우저를 통해 웹 서버에 접속한 시점으로부터 웹 브라우저를 종료함으로써 연결을 끝내는 시점
    즉, 방문자가 웹서버에 접속해 있는 상태를 하나의 단위로 보고 세션이라고 칭함

클라이언트가 Request를 보내면, 해당 서버의 엔진이 클라이언트에게 유일한 ID를 부여하는데 이것이 세션 ID이다.

세션 프로세스

  1. 클라이언트가 서버에 접속시 세션 ID를 발급
  2. 서버에서는 클라이언트로 발급해준 세션 ID를 쿠키를 사용해서 저장
  3. 클라이언트가 다시 접속할 때, 이 쿠키를 이용해서 세션ID값을 서버로 전달

즉, 세션을 구별하기 위해 ID가 필요하고 그 ID만 쿠키를 이용해서 저장해놓는다.

쿠키는 자동으로 서버에 전송되니까 서버에서 세션아이디에 따른 처리를 할 수 있음

세선 사용 사례

  • 예를들면 게시판에 글을 작성할 때 작성 버튼을 누르면 세션에 있는 아이디를 참조해서 작성자를 지정하게 된다.
  • 로그인 정보 유지
    • Email에서 어느정도 시간이 지나면 세션이 만료되었다고 뜨면서 로그아웃

쿠키와 세션의 차이


저장 위치

  • 쿠키 : 클라이언트에 파일로 저장
  • 세션 : 서버에 저장

보안

  • 쿠키 : 클라이언트 로컬에 저장되기 때문에 변질되거나 request에서 스나이핑 당할 우려가 있어서 보안에 취약
  • 세션 : 쿠키를 이용해서 sessionid만 저장하고 그것으로 구분해서 서버에서 처리하기 때문에 비교적 보안이 좋다.

라이프 사이클

  • 쿠키 : 만료시간이 있지만 파일로 저장되기 때문에 브라우저를 종료해도 계속해서 정보가 남을 수 있다.
    • 만료기간을 넉넉하게 잡아두면 쿠키삭제를 할때까지 유지될수도 있다.
  • 세션 : 세션도 만료시간을 정할 수 있지만 브라우저가 종료되면 만료시간에 상관없이 삭제된다.

세션을 주로 사용하면 좋은데 왜 쿠키를 사용할까?


세션은 서버의 자원을 사용하기 때문에 무분별하게 만들다보면 서버의 메모리가 감당할 수 없어질 수가 있고 속도가 느려질 수 있기 때문이다.




추가....

캐시


캐시의 경우 쿠키, 세션과는 전혀 다른 기능을 가진다.

홈페이지를 접속하면 css, js, 이미지 파일이 사용자의 브라우저에 저장이 된다.

그 후 다시 같은 홈페이지를 접속하게 되면 css, js, 이미지 파일을 서버가 아닌 사용자의 PC에서 가져오게 된다.

이렇게 저장된 데이터를 캐시되었다고 합니다.

이로써 얻는 이점은 css, js, 이미지의 용량이 3MB라고 가정할 때, 서버는 한번 요청될 때마다 3MB의 자원을 아끼게 된다.

대부분의 홈페이지는 상단 ,하단이 동일하므로 더욱 더 많은 자원이 아껴지게 된다.

이로써 발생하는 문제가 있습니다.
홈페이지 관리자가 이미지를 변경 -> 사용자는 이미지가 변경되지 않음

위와 같은 상황이 발생할 수도 있다.
이러한 경우도 브라우저에 이미 캐시되어 있는 경우 발생하는 문제

해결 방법은 사용자 브라우저의 캐시를 지워주거나, 서버에서 클라이언트로 응답을 보낼 때  header에 캐시 만료시간을 명시해주는 등 방법은 다양하다.

캐시의 지역성 및 공간성

캐시를 이용한 이득은 memory access의 locality가 클수록 증가하게 됩니다.
즉, 캐시에서 코드나 데이터를 읽을 확률이 높을 수록 성능이 증가하게 된다.
당연한 것이 캐시에서 읽으면 빠르기 때문에, 메모리에서 읽는 것보다 시간이 적게 걸리게 됩니다.

여기서 말한 locality는 두가지가 있습니다.
  • 시간 지역성(Temporal Locality)
  • 공간 지역성(Spatial Locality)

시간 지역성

최근에 사용된 데이터나 명령이 다시 사용될 확률이 높다는 뜻
왜냐하면 프로그램엔 loop문(반복문)이 있기 때문에, 그 안의 코드는 여러 번 사용될 확률이 높은 것이다.

공간 지역성

일반적으로 프로그램은 순차적으로 실행되게 됩니다.
예를 들어 1000번지 명령을 실행한 다음에는 1004번지 명령을 실행할 확률이 가장 높을 것이고, 그 다음엔 1008번지 명령어를 실행할 확률이 가장 높을 것입니다.
이렇게 순차적으로 실행될 확률이 높은 것을 이용하는 것입니다.


이런 locality를 이용하면 작은 용량의 SRAM이 전체 시스템의 성능 향상에 기여할 수 있습니다.

프로세서가 읽고자 하는 명령이나 데이터가 캐시 내에 존재하는 횟수가 많을수록(Cache Hit) 시스템 성능이 향상됩니다.

만일, 프로세서가 읽고자 하는 명령이나 데이터가 캐시 내에 없으면(Cache Miss), Cache Controller는 외부 메모리장치(DRAM)에서 명령이나 데이터가 속한 메모리 주소로부터 라인 단위로 명령 또는 데이터를 읽어와야 합니다.

이렇게 되면 성능이 저하되며, 결론적으로 Cache Hit가 많을수록, Cache Miss가 적을수록 시스템 성능이 좋아집니다.




댓글

이 블로그의 인기 게시물

[소프트웨어공학] NS(Nassi-Schneiderman) 차트

[컴퓨터네트워크] Telnet이란?

[Python] # -*- coding: utf-8 -*-를 쓰는 이유