[HTTP Network] 5장 - HTTP와 연계하는 웹 서버

2023. 3. 6. 17:05Computer Science/네트워크


1. 1대로 멀티 도메인을 가능하게 하는 가상 호스트

HTTP/1.1에서는 하나의 HTTP 서버에 여러 개의 웹 사이트를 실행할 수 있다.

이를 위해 가상 호스트(Virtual Host)라는 기능을 사용하고 있다.

가상 호스트 기능을 사용하면 물리적으로는 서버가 1대지만 가상으로는 여러 대가 있는 것처럼 설정하는 것이 가능하다.

 

인터넷에서 도메인명은 DNS에 의해서 IP 주소로 변환되고 나서 액세스하게 된다.

같은 IP 주소에서 다른 호스트명과 도메인 명을 가진 여러 개의 웹 사이트가 실행되고 있는 가상 호스트의 시스템이 있기 때문에, HTTP 리퀘스트를 보내는 경우에는 호스트명과 도메인 명을 완전하게 포함한 URI를 지정하거나, 반드시 Host 헤더 필드에서 지정해야 한다.


2. 통신을 중계하는 프로그램: 프록시, 게이트웨이, 터널

HTTP는 클라이언트와 서버 이외에 프록시(Proxy), 게이트웨이(Gateway), 터널(Tunnel)와 같은 통신을 중계하는 프로그램과 서버를 연계하는 것도 가능하다. 이러한 프로그램과 서버는 그 다음에 있는 다른 서버에 리퀘스트를 중계하고, 그 서버로부터 받은 리스폰스를 클라이언트에 반환하는 역할을 담당한다.


프록시

  • 서버와 클라이언트의 양쪽 역할을 하는 중계 프로그램
  • 프록시 서버를 사용하는 이유는 캐시를 사용해서 네트워크 대역 등을 효율적으로 사용하는 것조직 내에 특정 웹 사이트에 대한 엑세스 제한, 엑세스 로그를 획득하는 정책을 철저하게 지키려는 목적으로 사용하는 경우도 있다.
  • 클라이언트로부터 받은 리퀘스트 URI를 변경하지 않고 그 다음의 리소스를 가지고 있는 서버에 보낸다.
  • 리소스 본체를 가진 서버를 오리진 서버라고 부른다.
  • 프록시 서버를 여러 대 경유할 경우 Via 헤더 필드에 경유한 호스트 정보를 추가해야 한다.

 

캐싱 프록시

프록시로 리스폰스를 중계하는 때에는 프록시 서버 상에 리소스 캐시를 보존해 두는 타입의 프록시이다.

프록시에 다시 같은 리소스에 리퀘스트가 온 경우, 오리진 서버로부터 리소스를 획득하는 것이 아니라 캐시를  리스폰스로서 되돌려 준는 것이 있다.

 

 

투명 프록시

프록시로 리퀘스트와 리스폰스를 중계할 때 메시지 변경을 하지 않는 타입의 프록시를 투명 프록시라 한다.

반대로 메시지에 변경을 가하는 타입의 프록시를 비투과 프록시라고 한다.


게이트웨이

  • 게이트웨이의 경우 동작은 프록시와 매우 유사하지만 그 다음에 있는 서버가 HTTP 서버 이외의 서비스를 제공하는 서버가 된다.
  • 클라이언트와 게이트웨이 사이를 암호화하는 등으로 안전하게 접속함으로써 통신의 안정성을 높이는 역할

터널

  • 터널은 요구에 따라서 다른 서버와의 통신 경로를 확립합니다. 이 때 클라이언트는 SSL 같은 암호화 통신을 통해 서버와 안전하게 통신을 하기 위해 사용한다.
  • 터널 자체는 HTTP 리퀘스트를 해석하지 않고 리퀘스트를 그대로 다음 서버에 중계한다.
  • 터널은 통신하고 있는 양쪽 끝의 접속이 끊어질 때에 종료한다.

3. 리소스를 보관하는 캐시

캐시는 프록시 서버와 클라이언트의 로컬 디스크에 보관된 리소스의 사본을 가리킨다.

캐시를 사용하면 리소스를 가진 서버의 액세스를 줄이는 것이 가능하기 때문에 통신량과 통신 시간을 절약할 수 있다.

캐시 서버는 프록시 서버의 하나로 캐싱 프록시로 분류된다. 결국, 프록시가 서버로부터의 리스폰스를 중계하는 때에 프록시 서버 상에 리소스의 사본을 보존한다.

 

 

캐시는 유효기간이 있다.

캐시 서버에 캐시가 있는 경우라도 같은 리소스의 리퀘스트에 대해서 항상 캐시를 돌려 준다고는 할 수 없다.

오리진 서버에 있는 원래 리소스가 갱신되는 경우가 있는데, 이때 캐시 서버는 갱신되기 전에 낡은 리소스를 그대로 보내게 된다. 그래서 캐시를 가지고 있더라도 클라이언트의 요구나 캐시의 유효 기간 등에 의해서 오리진 서버에 리소스의 유효성을 확인하거나 새로운 리소스를 다시 획득 하러 가게 되는 경우가 있다.

 

 

클라이언트 측에도 캐시가 있다.

클라이언트가 사용하고 있는 브라우저에서도 캐시를 가질 수 있다. 인터넷 익스플로러에서 클라이언트가 보존하는 캐시를 인터넷 임시 파일이라고 부른다. 브라우저가 유요한 캐시를 가지고 있는 경우, 같은 리소스의 액세스는 서버에 액세스하지 않고 로킬 디스크로부터 불러옵니다. 또한, 리소스가 오래된 것으로 판단된 경우 오리진 서버에 리소스의 유효성을 확인하러 가거나 새로운 리소스를 다시 획득하러 가는 일이 있다.