Стандартизованный способ записи адреса ресурса файла в сети интернет выполняется на основе

Обновлено: 04.07.2024

Цель: ознакомиться со структурой и основными принципами работы всемирной сети Интернет, с базовыми протоколами Интернет и системой адресации.

Архитектура и принципы работы сети Интернет

Глобальные сети, охватывая миллионы людей, полностью изменили процесс распространения и восприятия информации.

Глобальные сети (Wide Area Network, WAN) – это сети, предназначенные для объединения отдельных компьютеров и локальных сетей, расположенных на значительном удалении (сотни и тысячи километров) друг от друга. Глобальные сети объединяют пользователей, расположенных по всему миру, используя при этом самые разнообразные каналы связи.

Современный Интернет — весьма сложная и высокотехнологичная система, позволяющая пользователю общаться с людьми, находящимися в любой точке земного шара, быстро и комфортно отыскивать любую необходимую информацию, публиковать для всеобщего сведения данные, которые он хотел бы сообщить всему миру.

В действительности Internet не просто сеть, — это структура, объединяющая обычные сети. Internet — это «сеть сетей».

Чтобы описать сегодняшний Internet , полезно воспользоваться строгим определением.

В своей книге « The Matrix : Computer Networks and Conferencing Systems Worldwide » Джон Квотерман описывает Internet как «метасеть, состоящую из многих сетей, которые работают согласно протоколам семейства TCP/IP, объединены через шлюзы и используют единое адресное пространство и пространство имен».

В Internet нет единого пункта подписки или регистрации, вместо этого вы контактируете с поставщиком услуг, который предоставляет вам доступ к сети через местный компьютер. Последствия такой децентрализации с точки зрения доступности сетевых ресурсов также весьма значительны. Среду передачи данных в Internet нельзя рассматривать только как паутину проводов или оптоволоконных линий. Оцифрованные данные пересылаются через маршрутизаторы, которые соединяют сети и с помощью сложных алгоритмов выбирают наилучшие маршруты для информационных потоков (рис.1).

В отличие от локальных сетей, в составе которых имеются свои высокоскоростные каналы передачи информации, глобальная (а так­же региональная и, как правило, корпоративная) сеть включает под­сеть связи (иначе: территориальную сеть связи, систему передачи ин­формации), к которой подключаются локальные сети, отдельные ком­поненты и терминалы (средства ввода и отображения информации) (рис. 2).

Подсеть связи состоит из каналов передачи информации и коммуни­кационных узлов, которые предназначены для передачи данных по сети, выбора оптимального маршрута передачи информации, комму­тации пакетов и реализации ряда других функций с помощью компь­ютера (одного или нескольких) и соответствующего программного обеспечения, имеющихся в коммуникационном узле. Компьютеры, за которыми работают пользователи-клиенты, называются рабочими станциями, а компьютеры, являющиеся источниками ресурсов сети, предоставляемых пользователям, называются серверами. Такая струк­тура сети получила название узловой.


Рис.1 Схема взаимодействия в сети Интернет

Интернет – это глобальная информационная система, которая:

· логически взаимосвязана пространством глобальных уникальных адресов, основанных на Интернет-протоколе (IP);

· способна поддерживать коммуникации с использованием семейства протокола управления передачей - TCP/IP или его последующих расширений/преемников и/или других IP-совместимых протоколов;

· обеспечивает, использует или делает доступными на общественной или частной основе высокоуровневые услуги, надстроенные над описанной здесь коммуникационной и иной связанной с ней инфраструктурой.

Инфраструктура Интернет (рис.2):

1. магистральный уровень (система связанных высокоскоростных телекоммуникационных серверов).

2. уровень сетей и точек доступа (крупные телекоммуникационные сети), подключенных к магистрали.

3. уровень региональных и других сетей.

4. ISP – интернет-провайдеры.

К техническим ресурсам сети Интернет относятся компьютерные узлы, маршрутизаторы, шлюзы, каналы связи и др.


Рис.2 Инфраструктура сети Интернет

T CP / IP — технология межсетевого взаимодействия

Наиболее распространенным протоколом управления обменом данных является протокол TCP/IP. Главное отличие сети Internet от других сетей заключается именно в ее протоколах TCP/IP, охватыва­ ющих целое семейство протоколов взаимодействия между компью­ терами сети. TCP/IP — это технология межсетевого взаимодействия, технология Internet . Поэтому г лобальная сеть, объединяющая мно­ жество сетей с технологией TCP/IP , называется Internet .

Протокол TCP/IP — это семейство программно реализованных протоколов старшего уровня, не работающих с аппаратными пре­ рываниями. Технически протокол TCP/IP состоит из двух частей — IP и TCP .

Протокол IP ( Internet Protocol — межсетевой протокол) является главным протоколом семейства, он реализует распространение ин­ формации в IP -сети и выполняется на третьем (сетевом) уровне моде ли ISO / OSI . Протокол IP обеспечивает дейтаграммную доставку паке­ тов, его основная задача — маршрутизация пакетов. Он не отвечает за надежность доставки информации, за ее целостность, за сохране­ ние порядка потока пакетов. Сети, в которых используется протокол IP , называются IP -сетями. Они работают в основном по аналоговым каналам (т.е. для подключения компьютера к сети требуется IP -мо­ дем) и являются сетями с коммутацией пакетов. Пакет здесь называ­ ется дейтаграммой.

Высокоуровневый протокол TCP ( Transmission Control Protocol — протокол управления передачей) работает на транспортном уровне и частично — на сеансовом уровне. Это протокол с установлением ло­ гического соединения между отправителем и получателем. Он обес­ печивает сеансовую связь между двумя узлами с гарантированной доставкой информации, осуществляет контроль целостности переда­ ваемой информации, сохраняет порядок потока пакетов.

Для компьютеров протокол TCP/IP — это то же, что правила раз­ говора для людей. Он принят в качестве официального стандарта в сети Internet , т.е. сетевая технология TCP/IP де-факто стала техноло­ гией всемирной сети Интернет.

АДРЕСАЦИЯ В СЕТИ ИНТЕРНЕТ

Основные протоколы сети Интернет

Работа сети Internet основана на использовании семейств коммуникационных протоколов TCP/IP ( Transmission Control Protocol / Internet Protocol ). TCP/IP используется для передачи данных как в глобальной сети Internet , так и во многих локальных сетях.

Название TCP/IP определяет семейство протоколов передачи данных сети. Протокол — это набор правил, которых должны придерживаться все компании, чтобы обеспечить совместимость производимого аппаратного и программного обеспечения. Эти правила гарантируют совместимость производимого аппаратного и программного обеспечения. Кроме того, TCP / IP – это гарантия того, что ваш персональный компьютер сможет связаться по сети Internet с любым компьютером в мире, также работающим с TCP/IP. При соблюдении определенных стандартов для функционирования всей системы не имеет значения, кто является производителем программного обеспечения или аппаратных средств. Идеология открытых систем предполагает использование стандартных аппаратных средств и программного обеспечения. TCP/IP — открытый протокол и вся специальная информация издана и может быть свободно использована.

Различный сервис, включаемый в TCP/IP, и функции этого семейства протоколов могут быть классифицированы по типу выполняемых задач. Упомянем лишь основные протоколы, так как общее их число насчитывает не один десяток:

· транспортные протоколы — управляют передачей данных между двумя машинами:

· TCP / IP ( Transmission Control Protocol ),

· UDP ( User Datagram Protocol );

· протоколы маршрутизации — обрабатывают адресацию данных, обеспечивают фактическую передачу данных и определяют наилучшие пути передвижения пакета:

· IP (Internet Protocol),

· ICMP (Internet Control Message Protocol),

· RIP (Routing Information Protocol)

· протоколы поддержки сетевого адреса — обрабатывают адресацию данных, обеспечивают идентификацию машины с уникальным номером и именем:

· DNS (Domain Name System),

· ARP (Address Resolution Protocol)

· протоколы прикладных сервисов — это программы, которые пользователь (или компьютер) использует для получения доступа к различным услугам:

· FTP ( File Transfer Protocol ),

· NNTP (NetNewsTransfer Protocol)

Сюда включается передача файлов между компьютерами, удаленный терминальный доступ к системе, передача гипермедийной информации и т.д.;

· EGP (Exterior Gateway Protocol),

· GGP (Gateway-to-Gateway Protocol),

· IGP (Interior Gateway Protocol);

· SMTP (Simple Mail Transfer Protocol),

· NFS ( Network File System ).

IP -адресация

Теперь подробнее остановимся на понятии IP -адреса.

Каждый компьютер в Internet (включая любой ПК, когда он устанавливает сеансовое соединение с провайдером по телефонной линии) имеет уникальный адрес, называемый IP -адрес.

IP -адрес имеет длину 32 бита и состоит из четырех частей по 8 бит, именуемых в соответствии с сетевой терминологией октетами ( octets ). Это значит, что каждая часть IP-адреса может принимать значение в пределах от 0 до 255. Четыре части объединяют в запись, в которой каждое восьмибитовое значение отделяется точкой. Когда речь идет о сетевом адресе, то обычно имеется в виду IP -адрес.

С понятием IP -адреса тесно связано понятие хоста ( host ). Некоторые просто отождествляют понятие хоста с понятием компьютера, подключенного к Internet . В принципе, это так, но в общем случае под хостом понимается любое устройство, использующее протокол TCP/IP для общения с другим оборудованием. То есть кроме компьютеров, это могут быть специальные сетевые устройства — маршрутизаторы ( routers ), концентраторы ( habs ) и другие. Эти устройства так же обладают своими уникальными I Р-адресами,— как и компьютеры узлов сети пользователей.

Любой IP -адрес состоит из двух частей: адреса сети (идентификатора сети, Network ID ) и адреса хоста (идентификатора хоста, Host ID ) в этой сети. Благодаря такой структуре IP -адреса компьютеров в разных сетях могут иметь одинаковые номера. Но так как адреса сетей различны, то эти компьютеры идентифицируются однозначно и не могут быть перепутаны друг с другом.

IP-адреса выделяются в зависимости от размеров организации и типа ее деятельности. Если это небольшая организация, то, скорее всего в ее сети немного компьютеров (и, следовательно, IP -адресов). Напротив, у большой корпорации могут быть тысячи (а то и больше) компьютеров, объединенных во множество соединенных между собой локальных сетей. Для обеспечения максимальной гибкости IP -адреса разделяются на классы: А, В и С. Еще существуют классы D и Е, но они используются для специфических служебных целей.

Адрес сети класса A определяется первым октетом IP -адреса (считается слева направо). Значение первого октета, находящееся в пределах 1-126, зарезервировано для гигантских транснациональных корпорации и крупнейших провайдеров. Таким образом, в классе А в мире может существовать всего лишь 126 крупных компаний, каждая из которых может содержать почти 17 миллионов компьютеров.

Класс B использует 2 первых октета в качестве адреса сети, значение первого октета может принимать значение в пределах 128—191. В каждой сети класса В может быть около 65 тысяч компьютеров, и такие сети имеют крупнейшие университеты и другие большие организации.

Соответственно, в классе C под адрес сети отводится уже три первых октета, а значение первого октета может быть в пределах 192-223. Это самые распространенные сети, их число может превышать более двух миллионов, а число компьютеров (хостов) в каждой сети — до 254. Следует отметить, что «разрывы» в допустимых значениях первого октета между классами сетей появляются из-за того, что один или несколько битов зарезервированы в начале IP -адреса для идентификации класса.

Если любой IP -адрес символически обозначить как набор октетов w . x . y . z , то структуру для сетей различных классов можно представить в таблице 1.

При выходе в интернет компьютеру присваивается уникальный идентификационный номер, по которому можно определить его местонахождение, узнать прочую информацию. В данной статье речь пойдет об особенностях адресации в интернете.


Разновидности адресации в сети.

Определение адресации в сети интернет

Это название устройства, которое ему присваивается в интернете, то есть его IP-адрес, состоящий из определенного набора символов, цифр.

Адресация может быть цифровой, символьной, а также уникальной с заданным номером.

Адресация нужна в целях соблюдения безопасности пользования ресурсами интернета, для снижения мошеннических действий со стороны пользователей, а также для поиска системой нужных файлов. Далее будет более подробно рассказано о типах адресации.


Структура IP.

Основные виды адресации

Подтипов адресации достаточно много. Однако есть две главных группы, о которых пойдет речь далее.

Полная

Это абсолютная адресация в сети интернет, отображающая полный путь до исходного файла, и не зависящая от действующего IP.

В свою очередь, данный тип адресации состоит из следующих компонентов:

  • идентификатор протокола, по которому происходит обращение к имени файла;
  • точное название сервера с расположением данного файла;
  • расположение файла и его название (как он должен называться).

Все пакеты с информацией можно размещать по IP-адресам, а маршрутизаторы отправляют этот пакет по нужному направлению. Поэтому в названии отправляемого файла прописан как адрес отправителя, так и получателя сведений.


Адресация в интернете.

В интернете приняты следующие системы адресации:

  • IP-адрес;
  • MAC-адрес;
  • адрес домена;
  • URL.

Для полного понимания темы необходимо рассмотреть определение каждого пункта:

  • IP-адрес — это индивидуальный номер каждого устройства в интернете.
  • MAC-адрес. Это номер, присваиваемый сетевому интерфейсу персонального компьютера. У ПК может быть большое количество таких интерфейсов, и каждый из них будет идентифицироваться собственным номером.
  • Доменная система. Домен — это имя, предназначенное для перевода, размещения других имен, назначенных для компьютера, в IP.
  • URL — уникальное имя компьютерных сайтов и других элементов в глобальной сети.

Относительная адресация

Это процедура поиска элемента по его текущему местоположению. Протокол, по которому происходит поиск файла, в дальнейшем будет сохранен. Причем файл обращения должен располагаться на этом же сервере.

В свою очередь, данный тип подразделяется на классовую и бесклассовую адресацию:

  • Классовая. Представляет собой один из способов рационального применения ресурсов, получаемых от IP-адресов и не предполагает совместное применение нескольких масок подсетей. Маска должна быть фиксированной.
  • Бесклассовая. Это также способ проявления IP-адресации, задача которого заключается в рациональном разделении пространства адреса.

Основой современных сетей являются значения масок подсети. Некоторые из них имеют одинаковый принцип работы.

Зачем нужна маска подсети

В состав IP-адреса входит сетевая часть и характеристики узла, а маска подсети предназначена для определения местонахождения каждой из этих частей.

Компьютеру или другому устройству, выходящему в интернет, помимо IP-адреса, присваивается маска подсети, а сам ПК именуется в глобальной сети как узел.

Маска имеет разрядность 32 бита и разграничивает части IP-адреса между сетью и узлом, то есть рассматриваемым устройством.

Маска подсети и IP сравниваются между собой по каждому биту в направлении слева направо. В свою очередь, маска состоит из единиц, определяющих сетевую часть и нулей, осуществляющих поиск устройства.


Значение маски подсети в настройках роутера.

Компьютер, с которого отправляется размещенный пакет информации, производит сравнение собственного IP с идентификационным номером маски. Доставка пакета производится, когда биты сетевой части IP-адреса совпадают с номером узла. Если этого не происходит, то устройство доставляет пакет маршрутизатору, чтобы передать его в другую сеть.

Главные типы адресов для отправления конкретного пакета информации

Таких типов несколько, и каждый из них задает собственный номер для узла. Рассмотрим каждый класс IP-адреса подробно.

Клиентские

Тарифный план на предоставление интернета, заключенный с тем или иным провайдером, может быть как общедоступным, так и частным. Эти определения характеризуют порядок сетевого расположения. При этом частный номер применяется внутри сети, а общедоступный за ее границами.

Клиентские адреса по определению должны быть общедоступными. Об этом прописано в договоре провайдера на оказание услуг.

Частные

Все устройства, которые, например, синхронизируются с точной доступа Wi-Fi, обладают частным IP. Здесь речь идет о множестве приборов: ноутбуках, смартфонах, планшетах, телевизорах, модемах, принтерах.

Роутер производит идентификацию всех устройств, подключенных к нему, а некоторые приборы, определяют друг друга. Благодаря этому каждое устройство на главном компьютере можно разграничить и назвать.

Общедоступные

Это главный адрес сети. Он совмещает в себе идентификационные номера всех устройств, находящихся в одной сети. Общедоступный адрес направляется непосредственно провайдеру интернета, с которым у пользователя заключен договор на оказание услуг. Общедоступные адреса, в свою очередь, делятся на динамические и статические.

Динамические

Это номера, которые автоматически изменяются с заметной регулярностью провайдером интернета. Дело в том, что провайдеры самостоятельно присваивают каждому клиенту собственный индивидуальный адрес, который впоследствии сменяется адресом, полученным от клиента, отказавшегося от предоставления услуг и расторгшего договор.

Это было придумано в целях экономии денег провайдера, которому также не придется заменять динамический адрес, когда клиент переедет на другое место жительства.


Статическая и динамическая адресация.

Статические

Данный тип IP никогда не меняется в отличие от рассмотренного выше. Статический адрес назначается сетью и остается неизменным на протяжении всего периода использования данного устройства.

Статические адреса в частности актуальны для людей и организаций, которые хотят иметь собственный сервер, а обычный пользователь может обойтись и без них.

Для веб-сайтов в интернете также есть собственное разграничение по IP. Об этом будет рассказано далее.

Типы адресов веб-сайтов

Люди, которые планируют создать собственный сайт в интернете, должны знать, что у них есть две группы адресации. В целях раскрытия данной темы необходимо изучить каждый тип отдельно.

Общие

Это сайты, которые работают на основе хостинговых планов, предоставляемых тем или иным провайдером. Общие адреса характерны для сайтов с ограниченным количеством страниц и переходов, которые в данный момент актуальны только для физических лиц и представителей малого бизнеса.

Выделенные

Тарифный план веб-хостинга также предполагает покупку выделенного IP-адреса. Он актуален в случаях, когда у пользователя интернета есть необходимость в разработке собственного FTP-сервера.

Многие компании покупают такой тип адресации для того, чтобы была возможность применять анонимный FTP-доступ. Помимо этого, с помощью выделенных адресов можно переходить на различные интернет -ресурсы с применением только одного IP и без использования домена. Таким образом, регистрировать доменный номер можно только после тестирования IP.


Структура URL адреса.

Как узнать IP адрес устройства

Идентификационный номер можно узнать на каждом используемом устройстве. Однако, методы будут разные.

На компьютере процесс определения IP выполняется по алгоритму:

  • запустить «Командную строку», прописав поиске «Пуска» фразу «CMD»;
  • ввести с клавиатуры фразу «ipconfig»;
  • проверить результат (должна отобразиться информация об IP компьютера).

Открыть «Командную строку» на операционной системе Windows также можно через окно «Выполнить».

На ПК, работающем на операционной системе MAC, получить подобные сведения можно следующим образом:

  • зайти в настройки;
  • переключиться в раздел, отвечающий за работу сети;
  • проверить результат — обычно информация об IP отображается внизу списка параметров.

На устройствах Apple iPhone нужно проделать следующие шаги:

  • зайти в параметры телефона;
  • переключиться на раздел Wi-Fi;
  • войти в свойства нужной сети и посмотреть информацию.

На Андроид посмотреть подобную информацию нельзя.

Адреса, которые не маршрутизируются в сети интернет

Подобная адресация зарезервирована и применяется в закрытых сетях. При этом провайдер не может осуществлять контроль за данными адресами.

Пользователь, имеющий частный IP, не сможет получить прямого доступа к интернету.


Частные внутренние.

Таким образом, в данной статье были рассмотрены основные типы адресации в сети интернет, их особенности и назначение. Эта информация может быть полезна для людей, планирующих открыть собственный сервер, а также для ряда пользователей. Также были представлены способы просмотра IP на различных устройствах. Теперь читатель сможет выбрать типы адресации в интернете.

Интернет — это глобальная компьютерная сеть, объединяющая сотни миллионов компьютеров в общее информационное пространство. Интернет представляет свою инфраструктуру для прикладных сервисов различного назначения, самым популярным из которых является Всемирная Паутина – World Wide Web (www).

WWW — сетевая технология прикладного уровня стека TCP/IP, построенная на клиент-серверной архитектуре и использующая инфраструктуру Интернет для взаимодействия между сервером и клиентом (рис. 1).

Серверы www (веб-серверы) — это хранилища гипертекстовой (в общем случае) информации, управляемые специальным программным обеспечением.

Документы, представленные в виде гипертекста называются веб-страницами. Несколько веб-страниц, объединенных общей тематикой, оформлением, связанных гипертекстовыми ссылками и обычно находящихся на одном и том же веб-сервере, называются веб-сайтом.

Для загрузки и просмотра информации с веб-сайтов используются специальные программы — браузеры, способные обрабатывать гипертектовую разметку и отображать содержимое веб-страниц.

Рис. 1. Архитектура сервиса WWW

Основной тип ресурсов Всемирной паутины — гипертекстовые страницы. Гипертекст — это обычный текст, размеченный специальными управляющими конструкциями — тегами. Браузер считывает теги и интерпретирует их как команды форматирования при выводе информации. Теги описывают структуру документа, а специальные теги, якоря и гиперссылки, позволяют установить связи между веб-страницами и перемещаться как внутри веб-сайта, так и между сайтами.

Т. Дж. Бернерс-Ли — «отец» Всемирной паутины

../_images/tim-berners-lee.jpg

Компоненты WWW¶

Функционирование сервиса обеспечивается четырьмя составляющими:

Адресация веб-ресурсов. URL, URN, URI

Для доступа к любым сетевым ресурсам необходимо знать где они размещены и как к ним можно обратиться. Во Всемирной паутине для обращения к веб-документам изначально используется стандартизованная схема адресации и идентификации, учитывающую опыт адресации и идентификации таких сетевых сервисов, как e-mail, telnet, ftp и т.п. — URL, Uniform Resource Locator.

URL (RFC 1738) — унифицированный локатор (указатель) ресурсов, стандартизированный способ записи адреса ресурса в www и сети Интернет. Адрес URL имеет гибкую и расширяемую структуру для максимально естественного указания местонахождения ресурсов в сети. Для записи адреса используется ограниченный набор символов ASCII. Общий вид адреса можно представить так:

имя пользователя и его пароль, используемые для доступа к ресурсу уточняющая информация о месте нахождения ресурса (зависит от протокола).

В августе 2002 года RFC 3305 анонсировал устаревание URL в пользу URI (Uniform Resource Identifier), еще более гибкого способа адресации, вобравшего возможности как URL, так и URN (Uniform Resource Name, унифицированное имя ресурса). URI позволяет не только указавать местонахождение ресурса (как URL), но и идентифицировать его в заданном пространстве имен (как URN). Если в URI не указывать местонахождение, то с его помощью можно описывать ресурсы, которые не могут быть получены непосредственно из Интернета (автомобили, персоны и т.п.). Текущая структура и синтаксис URI регулируется стандартом RFC 3986, вышедшим в январе 2005 года.

Язык гипертекстовой разметки HTML¶

HTML ( `HyperText Markup Language <>`_ ) — стандартный язык разметки документов во Всемирной паутине. Большинство веб-страниц созданы при помощи языка HTML. Язык HTML интерпретируется браузером и отображается в виде документа, в удобной для человека форме. HTML является приложением SGML (стандартного обобщённого языка разметки) и соответствует международному стандарту ISO 8879.

HTML создавался как язык для обмена научной и технической документацией, пригодный для использования людьми, не являющимися специалистами в области вёрстки. Для этого он представляет небольшой (сравнительно) набор структурных и семантических элементов — тегов. С помощью HTML можно легко создать относительно простой, но красиво оформленный документ. Изначально язык HTML был задуман и создан как средство структурирования и форматирования документов без их привязки к средствам воспроизведения (отображения). В идеале, текст с разметкой HTML должен единообразно воспроизводиться на различном оборудовании (монитор ПК, экран органайзера, ограниченный по размерам экран мобильного телефона, медиа-проектор). Однако современное применение HTML очень далеко от его изначальной задачи. Со временем основная идея платформонезависимости языка HTML стала жертвой коммерциализации www и потребностей в мультимедийном и графическом оформлении.

Общий шлюзовый интерфейс CGI¶

CGI ( `Common Gateway Interface <>`_ ) — механизм доступа к программам на стороне веб-сервера. Спецификация CGI была разработана для расширения возможностей сервиса www за счет подключения различного внешнего программного обеспечения. При использовании CGI веб-сервер представляет браузеру доступ к исполнимым программам, запускаемым на его (серверной) стороне через стандартные потоки ввода и вывода.

Интерфейс CGI применяется для создания динамических веб-сайтов, например, когда веб-страницы формируются из результатов запроса к базе данных. Сейчас популярность CGI снизилась, т.к. появились более совершенные альтернативные решения (например, модульные расширения веб-серверов).

Программное обеспечение сервиса WWW¶

Apache — свободное программное обеспечение, распространяется под совместимой с GPL лицензией. Apache уже многие годы является лидером по распространенности во Всемирной паутине в силу своей надежности, гибкости, масштабируемости и безопасности.

IIS (Internet Information Services) — проприетарный набор серверов для нескольких служб Интернета, разработанный Майкрософт и распространяемый с серверными операционными системами семейства Windows. Основным компонентом IIS является веб-сервер, также поддерживаются протоколы FTP, POP3, SMTP, NNTP.

Google Web Server (GWS) — разработка компании Google на основе веб-сервера Apache. GWS оптимизирован для выполнения приложений сервиса Google Applications.

Исторически первым браузером в современном понимании (т.е. с графическим интерфейсом и т.д.) была программа NCSA Mosaic, разработанная Марком Андерисеном и Эриком Бина. Mosaic имел довольно ограниченные возможности, но его открытый исходный код стал основой для многих последующих разработок.

Существует большое число программ-браузеров, но наибольшей популярностью пользуются следующие:

Internet Explorer (IE) — браузер, разработанный компанией Майкрософт и тесно интегрированный c ОС Windows. Платформозависим (поддержка сторонних ОС прекращена, начиная с версии 5). Единственный браузер, напрямую поддерживающий технологию ActiveX. Не полностью совместим со стандартами W3C, в связи с чем требует дополнительных затрат от веб-разработчиков.

Firefox — свободный кроссплатформенный браузер, разрабатываемый Mozilla Foundation и распространяемый под тройной лицензией GPL/LGPL/MPL. В основе браузера — движок Gekko, который изначально создавался для Netscape Communicator. Однако, вместо того, чтобы предоставить все возможности движка в стандартной поставке, Firefox реализует лишь основную его функциональность, предоставляя пользователям возможность модифицировать браузер в соответствии с их требованиями через поддержку расширений (add-ons), тем оформления и плагинов.

Safari — проприетарный браузер, разработаный корпорацией Apple и входящий в состав операционной системы Mac OS X. Бесплатно распространяется для операционных систем семейства Microsoft Windows. В браузере используется уникальный по производительности интерпретатор JavaScript и еще ряд интересных для пользователя решений, которые отсутствуют или не развиты в других браузерах.

Chrome — кроссплатформенный браузер с открытым исходным кодом, разрабатываемый компанией Google. Первая стабильная версия вышла 11 декабря 2008 года. В отличие от многих других браузеров, в Chrome каждая вкладка является отдельным процессом. В случае если процесс обработки содержимого вкладки зависнет, его можно будет завершить без риска потери данных других вкладок. Еще одна особенность — интеллектуальная адресная строка (Omnibox). К возможности автозаполнения она добавляет поисковые функции с учетом популярности сайта, релевантности и пользовательских предпочтений (истории переходов).

Opera — кроссплатформенный многофункциональный веб-браузер, впервые представленный в 1994 году группой исследователей из норвежской компании Telenor. Дальнейшая разработка ведется Opera Software ASA. Этот браузер обладает высокой скоростью работы и совместим с основными стандартами. Отличительными особенностями Opera долгое время являлись многостраничный интерфейс и возможность масштабирования веб-страниц целиком. На разных этапах развития в Opera были интегрированы возможности почтового/новостного клиента, адресной книги, клиента сети BitTorrent, агрегатора RSS, клиента IRC, менеджера закачек, WAP-браузера, а также поддержка виджетов — графические модулей, работающих вне окна браузера. Роботы-«пауки»

Интернет — это глобальная компьютерная сеть, объединяющая сотни миллионов компьютеров в общее информационное пространство. Интернет представляет свою инфраструктуру для прикладных сервисов различного назначения, самым популярным из которых является Всемирная Паутина – World Wide Web (www).

WWW — сетевая технология прикладного уровня стека TCP/IP, построенная на клиент-серверной архитектуре и использующая инфраструктуру Интернет для взаимодействия между сервером и клиентом (рис. 1).

Серверы www (веб-серверы) — это хранилища гипертекстовой (в общем случае) информации, управляемые специальным программным обеспечением.

Документы, представленные в виде гипертекста называются веб-страницами. Несколько веб-страниц, объединенных общей тематикой, оформлением, связанных гипертекстовыми ссылками и обычно находящихся на одном и том же веб-сервере, называются веб-сайтом.

Для загрузки и просмотра информации с веб-сайтов используются специальные программы — браузеры, способные обрабатывать гипертектовую разметку и отображать содержимое веб-страниц.

Архитектура www

Рис. 1. Архитектура сервиса WWW

Основной тип ресурсов Всемирной паутины — гипертекстовые страницы. Гипертекст — это обычный текст, размеченный специальными управляющими конструкциями — тегами. Браузер считывает теги и интерпретирует их как команды форматирования при выводе информации. Теги описывают структуру документа, а специальные теги, якоря и гиперссылки, позволяют установить связи между веб-страницами и перемещаться как внутри веб-сайта, так и между сайтами.

Т. Дж. Бернерс-Ли — «отец» Всемирной паутины

Тимоти Бернерс-Ли

Компоненты сервиса

Функционирование сервиса обеспечивается четырьмя составляющими:

    — унифицированный способ адресации и идентификации сетевых ресурсов; — язык гипертекстовой разметки веб-документов; — протокол передачи гипертекста; — общий шлюзовый интерфейс, представляющий доступ к серверным приложениям.

Адресация веб-ресурсов. URL, URN, URI

Для доступа к любым сетевым ресурсам необходимо знать где они размещены и как к ним можно обратиться. Во Всемирной паутине для обращения к веб-документам изначально используется стандартизованная схема адресации и идентификации, учитывающую опыт адресации и идентификации таких сетевых сервисов, как e-mail, telnet, ftp и т.п. — URL, Uniform Resource Locator.

URL (RFC 1738) — унифицированный локатор (указатель) ресурсов, стандартизированный способ записи адреса ресурса в www и сети Интернет. Адрес URL имеет гибкую и расширяемую структуру для максимально естественного указания местонахождения ресурсов в сети. Для записи адреса используется ограниченный набор символов ASCII. Общий вид адреса можно представить так:

Язык гипертекстовой разметки HTML

HTML (HyperText Markup Language) — стандартный язык разметки документов во Всемирной паутине. Большинство веб-страниц созданы при помощи языка HTML. Язык HTML интерпретируется браузером и отображается в виде документа, в удобной для человека форме. HTML является приложением SGML (стандартного обобщённого языка разметки) и соответствует международному стандарту ISO 8879.

HTML создавался как язык для обмена научной и технической документацией, пригодный для использования людьми, не являющимися специалистами в области вёрстки. Для этого он представляет небольшой (сравнительно) набор структурных и семантических элементов — тегов. С помощью HTML можно легко создать относительно простой, но красиво оформленный документ. Изначально язык HTML был задуман и создан как средство структурирования и форматирования документов без их привязки к средствам воспроизведения (отображения). В идеале, текст с разметкой HTML должен единообразно воспроизводиться на различном оборудовании (монитор ПК, экран органайзера, ограниченный по размерам экран мобильного телефона, медиа-проектор). Однако современное применение HTML очень далеко от его изначальной задачи. Со временем основная идея платформонезависимости языка HTML стала жертвой коммерциализации www и потребностей в мультимедийном и графическом оформлении.

Общий шлюзовый интерфейс CGI

CGI (Common Gateway Interface) — механизм доступа к программам на стороне веб-сервера. Спецификация CGI была разработана для расширения возможностей сервиса www за счет подключения различного внешнего программного обеспечения. При использовании CGI веб-сервер представляет браузеру доступ к исполнимым программам, запускаемым на его (серверной) стороне через стандартные потоки ввода и вывода.

Интерфейс CGI применяется для создания динамических веб-сайтов, например, когда веб-страницы формируются из результатов запроса к базе данных. Сейчас популярность CGI снизилась, т.к. появились более совершенные альтернативные решения (например, модульные расширения веб-серверов).

Программное обеспечение сервиса www

Веб-серверы

Apache — свободное программное обеспечение, распространяется под совместимой с GPL лицензией. Apache уже многие годы является лидером по распространенности во Всемирной паутине в силу своей надежности, гибкости, масштабируемости и безопасности.

IIS (Internet Information Services) — проприетарный набор серверов для нескольких служб Интернета, разработанный Майкрософт и распространяемый с серверными операционными системами семейства Windows. Основным компонентом IIS является веб-сервер, также поддерживаются протоколы FTP, POP3, SMTP, NNTP.

Google Web Server (GWS) — разработка компании Google на основе веб-сервера Apache. GWS оптимизирован для выполнения приложений сервиса Google Applications.

Браузеры

Исторически первым браузером в современном понимании (т.е. с графическим интерфейсом и т.д.) была программа NCSA Mosaic, разработанная Марком Андерисеном и Эриком Бина. Mosaic имел довольно ограниченные возможности, но его открытый исходный код стал основой для многих последующих разработок.

Существует множество различных программ-браузеров, но наибольшей популярностью на дату написания этой статьи пользуются следующие:

  • Internet Explorer / (Edge с версии 11) (IE) — браузер, разработанный компанией Майкрософт и тесно интегрированный c ОС Windows.
  • Firefox — свободный кроссплатформенный браузер, разрабатываемый Mozilla Foundation и распространяемый под тройной лицензией GPL/LGPL/MPL.
  • Safari — проприетарный браузер, разработаный корпорацией Apple и входящий в состав операционной системы Mac OS X.
  • Opera — кроссплатформенный многофункциональный веб-браузер, впервые представленный в 1994 году группой исследователей из норвежской компании Telenor. Дальнейшая разработка ведется Opera Software ASA.

Развернутая информация об этих и ряде альтернативных браузеров приводится в статье «Как выбрать лучший браузер?».

Читайте также: