WEB-сервера, назначение, принципы организации

Гипертекст - это система позволяющая распоряжаться набором информации так, чтобы к ней можно было получить доступ в любой последовательности. Система состоит из множества документов (это могут быть тексты, рисунки, звуки или их комбинация) и логических связей между ними.
WEB-сервера - это сервера в сети Интернет, предоставляющие гипертекст, размеченный с помощью языка НТМL. Язык НТМL позволяет оформить текст в определенной цветовой гамме и нужными шрифтами, создать таблицы и списки, вставить в нужном месте графические, видеоизображения, звуковые файлы и ссылки (реализующие логические связи) на другие документы. Подробнее с языком НTML вы можете ознакомиться с помощью следующих учебников:

  1. http://micron.narod.ru/
  2. http://www.arcus.lv/dimas/
  3. http://www.projectwm.al.ru/

Программа для просмотра и получения документов с WEB-сервера называется браузером. Обычно браузер получает информацию с WEB-сервера по НТТР-протоколу.  Скорость передачи информации, которую показывают многие браузеры - это средняя скорость получения информации с учетом всех задержек (число всех полученных байт, деленное на затраченное на их получение время).
Прежде чем перейти к изучению протокола НТТР, систематизируем сведения по уже изученным протоколам:

  1. IP-протокол предназначен для доставки пакетов от одной машины в сети к другой. При этом совершенно неважно, какие это данные и как они будут в дальнейшем использоваться. Вообще говоря, этот протокол даже не гарантирует доставку пакета.

  2. TCP-протокол предназначен для установки двунаправленного соединения между двумя машинами. Одна машина - клиент - запрашивает соединение с другой машиной - сервером, и протокол TCP используется для организации канала, по которому эти две машины могут обмениваться данными. В качестве нижележащего протокола используется протокол IP. Упаковка данных в IP-пакеты  контролируется TCP. Он пытается передать пакет до тех пор, пока не получит сообщение, что пакет доставлен и получен без искажений.

  3. Над этими двумя протоколами находятся протоколы доставки почтовых сообщений, самый распространенный из которых - SMTP (Simple Mail Transfer Protocol) - отвечает за доставку почтовых сообщений между серверами. Он передает следующую информацию: от кого письмо, кому письмо и тело письма, установку соединения и корректность передачи контролирует ТСР-протокол, а выбор с кем соединяться на совести почтовой программы (задается в ее настройках или берется из DNS). Протокол РОР3 обеспечивает возможность пользователю получать почтовые сообщения из ящика, находящегося на сервере.

А теперь обсудим HTTP-протокол. Этот протокол также работает над ТСР. Одной из его задач является регламентация передачи данных на WEB-страницах. Он используется при передаче любых данных в соответствующем формате и содержит средства для указания, какие данные он передает в настоящий момент и как с ними следует поступить.

Рассмотрим с точки зрения сети этапы просмотра WEB-страницы

  1. Клиентская программа просмотра WEB-страниц (браузер) устанавливает соединение с сервером (ТСР).

  2. Получив ответ об установленном соединении, программа направляет запрос серверу. В запросе указывается, что ей нужен такой-то ресурс (файл, динамическая страница или каталог), желательно в такой-то кодировке и на таком-то языке.

  3. Сервер направляет ответ из 3 частей:

  • Код ответа (все в порядке, или документ в другом месте, или этот документ не имеют права читать все подряд, сообщите свое имя и пароль, или пароль неверный, или нет таких документов, или сервер не работает)

  • Заголовки страницы (тип данных (текст+кодировка, звук, рисунок и т.д.), иногда размер, можно ли сохранять этот документ в кэше, срок хранения и т.п.)

  • сам запрошенный документ.


Браузер, получив этот ответ, сохраняет его у себя либо в оперативной памяти, либо на диске (в дисковом кэше) и, исходя из заголовка документа, решает, что с ним делать... Если выводился текст в формате НТML , то там могут быть ссылки на другие ресурсы. Для каждого ресурса, например, картинки, устанавливается новое соединение с сервером, и она точно так же запрашивается.
 

Файловые сервера. Пересылка и получение файлов.

FTP-протокол регламентирует работу с файлами на FTP-серверах, например такие операции, как копирование файлов, удаление файлов, перемещение, получение файлов с сервера на локальную станцию, или наоборот - передачу локальных файлов на сервер, просмотр каталогов и т.д..
Мы будем рассматривать только просмотр каталогов и получение файлов с сервера.  FTP-протокол передает любые данные в одном из двух форматов - текстовом или двоичном.
Этапы получения файла по FTP-протоколу:

  1. Установка контрольного (управляющего, для команд) соединения с сервером; выполняет FTP-клиент. В этот этап входит получение ответа от сервера о том, что соединение установлено.

  2. Сообщение серверу имени пользователя, который собирается с ним работать. В отличие от НТТР-протокола имя пользователя нужно всегда. В случае необходимости анонимного доступа используются зарезервированные имена: anonymous или ftp.

  3. Сообщение серверу пароля данного пользователя. FTP-клиент может это сделать автоматически. В случае анонимного доступа стандарт требует, чтобы указывался почтовый адрес пользователя.

  4. Далее следует процесс управления FTP-сессией с помощью команд. Самые типичные: сменить директорию (каталог), показать содержимое каталога.

  5. Команда, подготавливающая передачу (пассивное или активное соединение). Тип зависит от того, кто будет устанавливать дополнительное соединение - сервер или станция. Если дополнительное соединение устанавливает сервер - активное, клиент - пассивное. Не все сервера и не все клиенты поддерживают пассивное соединение.

  6. Команда на передачу файла
  7. Собственно передача файла. Она происходит по независимому соединению. После команды на передачу файла клиент или сервер устанавливают дополнительное соединение - так называемое соединение для данных. С помощью ТСР-протокола организуется еще один канал связи, по которому и передается файл.

  8. Далее клиент решает, что делать с файлом - запустить на выполнение, просмотр, записать на диск и т.п.

  9. Последний этап - команда на разрыв соединения.

Поиск в сети Интернет. Основные принципы.

Существует три основных объекта поиска, которые можно получить из сети Интернет:

  1. Файлы (например, мы хотим найти какую-то программу, точно зная как называется файл, в котором она содержится). В этом случае нам следует воспользоваться сервером поиска файлов, на котором храниться база данных, содержащая имена файлов и ссылки на эти файлы ( http://ftpsearch.city.ru/ , http://www.files.ru/).

  2. Сервера (если мы хотим ознакомится с прейскурантом, какой либо фирмы, разумнее всего поискать его на сервере этой фирмы).  Тогда чаще всего обращаются к услугам каталогизаторов. Это поисковые сервера, содержащие базу данных, в которой хранятся ссылки на главные страницы WEB-узлов, названия их владельцев и ключевые слова (http://www.rambler.ru/ , http://www.yahoo.com/ ).

  3. Информация (тексты художественных произведений, научные статьи на заданную тему, биографии, учебные пособия и т. п.). Теперь лучше всего обратится на сервер контекстного поиска. Эти сервера по данной вами фразе выдают вам ссылки на WEB-страницы, где эта фраза содержится (http://www.yandex.ru , http://altavista.com).

Для закрепления знаний ответьте на один или несколько вариантов теста 3.
Тестовые карточки

В НАЧАЛО