본문 바로가기
CS

HTTP 기본

by 토니짱 2022. 9. 5.

HTTP란?

HyperText transfer Protocol의 약어이다.

 

HTTP 메시지에 모든 것을 전송할 수 있다.

-HTML, TEXT

-IMAGE, 음성, 영상, 파일

-JSON, XML(API)

-거의 모든 형태의 데이터를 전송할 수 있다.

-서버끼리 데이터를 주고받을 때에도 대부분 HTTP를 사용한다.

 

HTTP의 역사

HTTP/0.9 (1991년) : GET메서드만 지원하고 HTTP 헤더가 없음.

HTTP/1.0 (1996년) : 메서드, 헤더 추가

HTTP/1.1 (1997년) : 가장 많이 사용하고 우리에게 가장 중요한 버전이다.

 - RFC2068 (1997년) -> RFC2616 (1999년) -> RFC7230~7235 (2014년)

HTTP/2 (2015년) : 성능 개선

HTTP/4 진행 중 : TCP 대신 UDP 사용, 성능 개선

 

기반 프로토콜

-TCP : HTTP/1.1, HTTP/2

-UDP : HTTP/3

-현재 HTTP/1.1을 주로 사용하고 HTTP/2, HTTP/3도 점점 많이 사용하는 추세이다.

HTTP/1.1과 2는 대부분 TCP위에서 동작한다. TCP는 3 way handshake도 있고, 넣어야 할 데이터도 많고 속도가 빠르지 않기 때문에,

HTTP/3는 UDP 기반으로 개발되어 있다.

Protocol 항목의 h2는 HTTP/2이고 h3는 HTTP/3을 의미한다.

 

HTTP 특징

-클라이언트 서버 구조

-무상태 프로토콜(스테이리스), 비연결성

-HTTP 메시지

-단순함, 확장 가능

 

클라이언트 서버 구조

-Request Response 구조

-클라이언트는 서버에 요청을 보내고, 응답을 대기

-서버가 요청에 대한 결과를 만들어서 응답

클라이언트는 HTTP 메시지를 통해서 서버에 요청을 보내고 서버 응답이 올 때까지 무작정 기다리다가 응답이 오면 결과를 열어서 동작한다.

클라이언트와 서버를 분리하는 것은 매우 중요하다. 예전에는 하나로 뭉쳐있었지만, 현재는 비즈니스 로직과 데이터를 다 서버에 밀어놓고 클라이언트는 UI를 그리는 것에 집중하게 되었다. 이로써 클라이언트와 서버가 각각 독립적으로 진화할 수 있다.

 

무상태 프로토콜(스테이스리스 Stateless)

-서버가 클라이언트의 상태를 보존하지 않는다.

-장점 : 서버 확장성 높음(스케일 아웃)

-단점 : 클라이언트가 추가 데이터 전송

 

Stateful, Stateless의 차이

 

<상태 유지 - Stateful>

고객 : 이 노트북 얼마인가요?

점원 : 100만원입니다.

고객 : 2개 구매할게요.

점원 : 200만 원입니다. 신용카드와 현금 중에 어떤 걸로 구매하세요?

고객 : 신용카드로 구매하겠습니다.

점원 : 200만 원 결제 완료되었습니다.

-> 보통 물건을 구매하면 점원 한 명을 통해 진행하므로 점원이 컨텍스트를 계속 알고 있어 바로 소통이 된다.

 

<상태 유지 - Stateful, 중간에 점원이 바뀐다면!?>

고객 : 이 노트북 얼마인가요?

점원 1 : 100만 원입니다.

 

고객 : 2개 구매할게요.

점원 2 :??? 무엇을 2개 구매하시겠어요?

 

고객 : 신용카드로 구매하겠습니다.

점원 3 : ??? 무엇을 몇 개 신용카드로 구매하신다는 거예요?

-> 점원 1에게 물어보던 내용을 점원 2, 점원 3에게 이어서 물어보면 점원 2, 점원 3은 무슨 대화인지 모를 것이다. 점원 2,3은 컨텍스트를 모른다.

 

상태 유지 - Stateful, 정리

고객 : 이 노트북 얼마예요?

점원 : 100만 원입니다. (노트북 상태 유지)

 

고객 : 2개 구매할게요.

점원 : 200만 원입니다. 신용카드, 현금 중에 어떤 걸로 구매하세요? (노트북, 2개 상태 유지)

 

고객 : 신용카드로 구매할게요.

점원 : 200만 원 결제 완료되었습니다.(노트북, 2개, 신용카드 상태 유지)

->첫 대화를 통해 클라이언트가 노트북을 구매하고 싶다는 상태를 서버가 알고 있다. 그렇게 때문에 다음 대화에서 바로 결제 수단을 물어본다. 최종적으로 구매 물건:노트북 , 구매 개수:2개 , 구매수단:신용카드라는 상태를 유지하게 된다.

 

<무상태 - Stateless>

고객 : 이 노트북 얼마예요?

점원 : 100만 원입니다.

 

고객 : 노트북 2개 구매할게요.

점원 : 노트북 2개는 200만 원입니다. 신용카드, 현금 중에 어떤 걸로 구매하시나요?

 

고객 : 노트북 2개를 신용카드로 구매할게요.

점원 : 결제 완료되었습니다.

->상태 유지와 달리 두 번째 대화에서 점원이 고객의 상태를 유지하고 있지 않다. 따라서 고객은 물어볼 때마다 매번 무엇을 몇 개 어떤 결제수단을 사용할 것인지 말해줘야 한다.

 

<무상태 - Stateless, 점원이 중간에 바뀌면??>

고객 : 이 노트북 얼마인가요?

점원 1 : 100만 원입니다.

 

고객 : 노트북 2개 구매할게요.

점원 2 : 노트북 2개는 200만 원입니다. 신용카드와 현금 중 어떤 걸로 구매하시나요?

 

고객 : 노트북 2개를 신용카드로 구매하겠습니다.

점원 3 : 200만 원 결제 완료되었습니다.

-> 무상태는 점원이 바뀌더라도 고객이 매번 요청을 명확하게 하기 때문에 올바른 결과를 받을 수 있다. 따라서 무상태로 설계하면 무한적 확장할 수 있는 가능성이 생긴다.

 

Stateful, Stateless 차이 정리

-상태 유지 : 중간에 다른 점원으로 바뀌면 안 된다.( 점원이 바뀔 경우 상태 정보를 다른 점원에게 알려야 한다.)

 

 

-무상태 : 중간에 다른 점원으로 바뀌어도 된다.

               갑자기 고객이 증가해도 점원을 대거 투입할 수 있다.

               갑자기 클라이언트 요청이 증가해도 서버를 대거 투입할 수 있다.

               무상태는 응답 서버를 쉽게 바꿀 수 있다. -> 무한한 서버 증설 가능, 스케일 아웃에 굉장히 유리하다.

*scale-out(수평 확장) : 서버를 증설하는 것을 말한다.

 

Stateless 실무 한계

-모든 것을 무상태로 설계할 수 있는 경우도 있고 없는 경우도 있다.

-무상태 ex) 로그인이 필요 없는 단순한 서비스 소개 화면 (아무 정보를 담을 필요가 없는 이벤트성 페이지)

-상태 유지 ex) 로그인 (상태를 유지하지 않으면 로그인이 화면 이동 시마다 풀려버린다.)

-로그인한 사용자의 경우 로그인했다는 상태를 서버에 유지

-일반적으로 브라우저 쿠키와 서버 세션 등을 사용해서 상태 유지

-상태 유지는 최소한만 사용한다.

-데이터를 매번 너무 많이 보낸다.

 

비 연결성(connectionless)

<연결을 유지하는 모델>

클라이언트 1이 TCP/IP 연결을 통해 요청과 응답을 받는 상황이다.

클라이언트 2, 3이 요청을 보낼 때에도 클라이언트 1은 계속 연결되어 있다. 연결을 유지하는 동안 서버의 자원이 소모된다.

 

<연결을 유지하지 않는 모델>

클라이언트 1이 요청을 하고 응답을 받으면 연결을 종료한다.

서버는 어떤 클라이언트가 요청을 해도 요청을 주고받을 때에만 연결을 유지하기 때문에 최소한의 자원만 사용할 수 있다.

 

비연결성 특징

- HTTP는 기본이 연결을 유지하지 않는 모델이다.

- 일반적으로 초 단위의 이하의 빠른 속도로 응답한다.

- 1시간 동안 수천 명이 서비스를 사용해도 실제 서버에서 동시에 처리하는 요청은 수십 개 이하로 매우 작다.

   ex) 요청 시에만 연결하기 때문에 실제로 동시에 처리하는 요청은 얼마 안 된다.

         구글 검색 시 검색 버튼을 연속으로 누르지 않고 한 번의 검색 후 자료를 찾고, 또 한참 후 다시 검색하며 진행되기 때문에 가능하다.

- 서버 자원을 매우 효율적으로 사용할 수 있음.

 

비연결성 한계

- TCP/IP 연결을 새로 맺어야 함 -> 3 way handshake 시간이 추가된다.

- 웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바스크립트, css, 추가 이미지 등 수많은 자원을 매번 함께 다운로드하기 때문에 비효율적이다.

 

비연결성 한계점 극복

- 지금은 HTTP 지속 연결(Persistent Connections)로 문제를 해결한다.

- HTTP/2, HTTP/3에서 더 많은 최적화가 이루어져 있다.

HTTP 초기에는 클라이언트가 요청하면 HTML을 응답하고, 받고 나서 또 자바스크립트가 필요하면 또 응답하고 이런식이었다.

HTTP 지속 연결을 하면 요청에 응답한 후 연결을 유지한다. 유지한 상태에서 계속 요청과 응답을 주고받는다. 그렇게 작업이 다 종료된 후 연결을 종료한다.

 

스테이리스를 기억하자! (서버 개발자들이 어려워하는 업무)

- 같은 시간에 딱 맞추어 발생하는 대용량 트래픽 ex) 저녁 6:00 선착순 1000명 치킨 할인 이벤트

- 이런 이벤트를 진행할 때 대용량 트래픽이 몰리면 비 연결성이 소용이 없어지기 때문에 최대한 Stateless 하게 설계하는 것이 중요하다.

- 보통 이벤트의 첫 페이지는 정적 페이지로 뿌린다. 아무런 상태 없이 html만 존재하여 중간에 한 단계를 넣어서 사람들이 어느 정도 머물다가 이벤트에 참여할 수 있도록 유도한다.

 

HTTP 메시지

HTTP 메시지는 시작 라인, 헤더, 공백라인, 바디로 구성되어 있다. 공백라인은 반드시 있어야 한다.만약 전송할 바디가 없다면 공백만 넣고 끝내면 된다.

 

시작 라인 (start-line)

start-line = request-line / status-line

- 시작 라인은 크게 request-line과 status-line으로 이루어져 있다.

 

시작라인 요청 메시지(request-line)

request-line method SP(공백) request-target SP HTTP-version CRLF(엔터)

요청 메시지 구성은 

-HTTP 메서드 (위의 요청 예시에서는 GET이 해당된다.)

-요청 대상 (/search?q=hello&hl=ko)

-HTTP Version (HTTP/1.1)

으로 이루어져 있다.

 

시작 라인 요청 메시지 - HTTP 메서드

-종류 : GET, POST, PUT, DELETE

-서버가 수행해야 할 동작을 지정해준다.

  GET : 리소스 조회

  POST : 요청 내역 처리

 

시작라인 요청메시지 - 요청 대상

-absolute-path[?query](절대경로[?쿼리])

*절대 경로는 /로 시작하는 경로이다. 참고로 *, Http://...?x=y와 같이 다른 유형의 경로지정 방법도 있다.

 

시작 라인 요청메시지 - HTTP 버전

- 말 그대로 HTTP 버전이다.

 

시작라인 응답 메시지

status-line = HTTP-version SP status-code SP reason-phrase CRLF

status-line은 위 예시에서 맨 윗줄에 해당한다.

-HTTP 버전 (HTTP/1.1)

-HTTP 상태 코드

  200 : 성공

  400 : 클라이언트 요청 오류

  500 : 서버 내부 오류

-이유 문구 : 사람이 이해할 수 있는 짧은 상태 코드 설명 글 (OK)

 

HTTP 헤더

-header-field는 field-name ":" OWS field-value OWS의 구성으로 이루어져 있다.

 *OWS : 띄어쓰기 허용

 *field-name은 대소문자 구분하지 않지만 field-value는 구분한다.

 *field-name에는 띄어쓰기 사용 불가

HOST : www.google.com에서 HOST는 field-name, www.google.com은 field-value에 속한다. 

 

HTTP 헤더의 용도

-HTTP 전송에 필요한 모든 부가정보를 담고 있다.

ex) 메시지 바디의 내용(html인지 xml인지 등), 메시지 바디의 크기, 압축 여부, 인증, 요청 클라이언트(브라우저) 정보, 서버 애플리케이션 정보, 캐시 관리 정보... 등

-표준 헤더 필드는 너무 많다. 참고) https://en.wikipedia.org/wiki/List_of_HTTP_header_fields

 

List of HTTP header fields - Wikipedia

HTTP header fields are a list of strings sent and received by both the client program and server on every HTTP request and response. These headers are usually invisible to the end-user and are only processed or logged by the server and client applications.

en.wikipedia.org

 

-필요하면 임의의 헤더를 추가할 수 있다. ex) helloworld : hihi

 

HTTP 메시지 바디의 용도

-실제 전송할 데이터를 담는다.

-HTML 문서, 이미지, 영상, JSON 등 byte로 표현할 수 있는 모든 데이터 전송 가능

 

정리

-HTTP는 단순하다.

-HTTP 메시지도 매우 단순하다.

-크게 성공하는 표준 기술은 단순하지만 확장 가능한 기술이다.

반응형

'CS' 카테고리의 다른 글

HTTP 상태 코드  (1) 2022.10.02
HTTP 메서드 활용  (0) 2022.09.25
HTTP 메서드  (0) 2022.09.08
URI와 웹 브라우저 요청 흐름  (0) 2022.09.04
인터넷 네트워크  (0) 2022.09.04