Контрольная работа (на начало урока)
Регистрационная метка
Читальный зал Роботландии

Конспект

Web-пространство Интернета

Сервис WWW (World Wide Web — всемирная паутина)  — это совокупность сайтов в Интернете и средств доступа к ним.

WWW называют также гипертекстовым пространством Интернета, WWW-пространством, Web-пространством или просто Web. В текстах на русском языке употребляют слово Веб, реже — Паутина.

Сервис WWW работает по прикладному протоколу HTTP (HyperText Transfer Protocol — протокол обмена гипертекстовой информацией).

Сайт (site — место, синонимы: Веб-сайт, Веб-ресурс) — совокупность гипертекстовых страниц, объединённых одним доменным адресом (адресом сервера, на котором они расположены), темой, логической структурой, оформлением и авторством.

В качестве адреса сайта указывают адрес его начальной страницы (стартовая страница, домашняя страница).

Адрес сайта записывается в виде полного или сокращённого URL (Uniform Resourse Locator, дословно: унифицированный указатель ресурса).

Для просмотра сайтов запускается специальная программа — браузер. Браузер копирует с Web-сервера файл с гипертекстовым кодом и строит по нему страницу на экране пользователя.

Гипертекстовые страницы, которые составляют сайт, записываются на специальном языке HTML (HyperText Markup Language) — язык гипертекстовой разметки.

Гиперссылка — чувствительная к щелчку область на экране (элемент текста, графики). Если щёлкнуть мышью на такой области, происходит гипертекстовый переход — браузер загружает новую страницу или показывает другой фрагмент текущей страницы.

Гипертекстовый переход выполняется по тому URL, на который закодирована гиперссылка.

Гиперссылка может задавать не только переходы. Если в коде гиперссылки указан URL с протоколом, отличным от HTTP, браузер выполняет соответствующие действия: открывает почтовую программу, программу для работы в режиме удалённого терминала (по протоколу Telnet), копирует файл (по протоколу FTP)…

Навигационные средства сайта — интерфейсные элементы на его страницах (состоящие из гипертекстовых ссылок), которые позволяют перемещаться по сайту (смотреть его страницы).

К навигационным средствам сайта относятся: меню сайта, меню страницы, меню “хлебные крошки”, логотип (является ссылкой на начальную страницу на всех страницах, кроме начальной) и отдельные гиперссылки на странице:

Поиск информации

Инструменты поиска в Интернете:

  • Универсальные средства
    • коллекции ссылок
    • каталоги
    • рейтинги
    • индексы
  • Специализированные средства поиска
    • картинок
    • файлов
    • программ
    • электронных книг
    • в словарях и энциклопедиях
    • карт и Web-камер
    • работы
    • другой специфичной информации

Коллекция ссылок — набор ссылок по теме сайта или содержание специальных сайтов, которые собирают и описывают ссылки на полезные ресурсы.

Коллекции ссылок можно разделить на традиционные и социальные.

Традиционная коллекция ссылок — набор ссылок, редактирование и пополнение которого доступно только авторам.

Социальная коллекция ссылок — набор ссылок, редактирование и пополнение которого открыто для всех желающих. Примером социальной коллекции ссылок является Делишес (сервис действует на сайте по адресу del.icio.us).

Интернет-каталог — сайт, страницы которого образуют тематическую иерархию. На главной странице расположен список внутренних ссылок на основные темы каталога. На страницах-потомках — список внутренних ссылок, детализирующий тему родителя. На страницах-листьях — список внешних ссылок на сайты по данной теме.

Достоинства и недостатки каталогов

Записи в каталог помещаются людьми — владельцами каталога. Отсюда все плюсы и минусы этого инструмента.

Плюсы

Информация в каталогах хорошо структурирована, значит, её легко искать.

Кроме общих, в Интернете много специализированных каталогов (туризм, автомобили, развлечения…) — это также облегчает (конкретизирует) поиск.

Каждая ссылка на сайт снабжена кратким описанием ресурса.

На страницах-листьях каталога располагается совсем немного ссылок — их просмотр (в поисках нужного сайта) не займёт много времени.

Минусы

Каталоги содержат сравнительно небольшие наборы записей и не могут претендовать на охват значительной части Интернета.

Набор записей каталога отражает субъективные предпочтения авторов.

Содержание каталога с трудом поспевает за быстро меняющимся Интернетом.

Каталоги предназначены для поиска сайтов по заданной теме, а не конкретной информации на их страницах. Например, при помощи каталога трудно найти ответ на вопрос “кто такой Мошков?” или “что такое каталог?”

Рейтинг (или топ) — это каталог, в котором ссылки на сайты внутри категорий сортируются по популярности сайтов.

При подсчёте популярности учитываются, как правило:

  • Хиты (визиты) — общее число заходов на сайт.
  • Хосты — количество уникальных посетителей за отчётный период (день, неделю, месяц).

Индекс (поисковая система, поисковик) — сервер, который автоматически, при помощи специальных программ (их называют пауками) постоянно сканируют страницы Интернета, и индексируют их, то есть заносят в свою базу данных.

На сервере индекса располагаются:

  • База данных по страницам Интернета: сами страницы в сжатом виде и словарь по ним (индекс).
  • Программы для сбора страниц Интернета (пауки).
  • Программа для поиска информации в базе данных.
  • Сайт, на котором пользователь может записывать запросы на поиск и просматривать результаты.

Индекс — более мощный инструмент поиска по сравнению с коллекциями ссылок, каталогами и рейтингами.

Плюсы индекса

Индекс охватывает большую и “свежую” часть Интернета. С помощью него удобно искать фрагменты текста, содержащие ответы на конкретные вопросы (а не сайты по теме, как в коллекциях, каталогах и рейтингах).

Минусы индекса

Индекс составляется автоматически специальными программами, поэтому, в отличие от “ручных” коллекций, каталогов и рейтингов, предлагает пользователю большое количество информационного мусора. Для продуктивной работы с индексом нужно правильно формулировать запросы и уметь пользоваться языком поиска, помогая индексу повысить релевантность полученных результатов.

Вес ссылки на документ для слова из индекса. В индексе поисковой системы с каждым словом или фразой связан список ссылок на документы в которых это слово или фраза встречаются. Каждая ссылка снабжается весом — числовой оценкой её значимости.

При вычислении веса ссылки, связанной со словом из индекса, учитываются:

  • Индекс цитирования документа (ИЦ). Более весомым считается документ, на который есть много ссылок с других сайтов, причём цитирование с крупных популярных сайтов оценивается выше.

  • “Свежесть” страницы. Вес ссылки выше для страниц с более новой датой обновления.

  • Написание ссылки. Если слово, к которому привязана ссылка, входит в состав самой ссылки, то вес ссылки больше (например, слово microsoft входит в состав ссылки на сайт компании: www.microsoft.com).

  • Ссылка имеет повышенный вес, если слово, с которым она связана, входит в состав названия окна документа.

  • Вес ссылки повышается, если слово входит в состав списка ключевых слов страницы (тег META с атрибутом keywords) или в состав описания страницы (тег META с атрибутом description).

  • Ссылка имеет повышенный вес, если слово входит в состав альтернативного текста картинки (атрибут alt тега IMG).

  • При подсчёте веса ссылки учитываются разные параметры появления слова (к которому относится ссылка в индексе) в тексте документа:

    • Форматирование. Больший вес имеют документы, в которых слово встречается в заголовках и разного рода выделениях (жирность, курсив, повышенный размер шрифта).

    • Место слова в документе. Больший вес имеют документы, в которых слово встречается в начале документа, а также в навигационном меню сайта или страницы.

    • Частота появления слова в документе. Документ, в котором слово встречается чаще, имеет больший вес.

Индекс цитирования (ИЦ) — числовая характеристика, которая отражает число сайтов, ссылающихся на данный сайт. Индекс цитирования учитывается при подсчёте веса ссылки.

Релевантность — числовая характеристика, пытающаяся отразить степень соответствия полученных результатов ожиданиям пользователя. Обычно, результаты поиска сортируются по убыванию числового значения этой характеристики: первыми в список помещаются ссылки, имеющие большую релевантность.

Простой поиск — поиск, при котором в запросе (ключевой фразе поиска) не используются элементы языка запросов, задаваемые явно или при помощи интерфейсных элементов на странице Расширенный поиск поисковой системы.

Расширенный или сложный поиск — поиск ключевой фразы при дополнительных условиях, задаваемых интерфейсными элементами на странице Расширенный поиск поисковой системы.

Язык запросов — формальный язык, конструкции которого позволяют назначать различные условия на поиск по ключевой фразе, задаваемой в поле ввода поисковой системы.

Мультипоиск — поиск при помощи специальных мультипоисковых систем. У этих систем нет собственных баз данных. Они, как и метапоисковые системы, обращаются к “настоящим” поисковым системам (индексы, каталоги, рейтинги), переадресуя им запрос пользователя, а затем предлагает результаты в отдельных окнах (результаты каждого “настоящего” поисковика в отдельном окне).

Мультипоисковые системы не “суммируют” результаты, не удаляют дублирующие записи.

Метапоиск — поиск при помощи специальных метапоисковых систем.

У этих поисковиков нет собственных баз данных. Они обращаются к “настоящим” поисковым системам (индексы, каталоги, рейтинги), переадресуя им запрос пользователя, а затем суммируют результаты, удаляя дублирующие записи и сортируя сводный список по релевантности.

Портал — универсальный сайт, предлагающие пользователю широкий спектр услуг (индекс, каталог, ящик электронной почты, место под сайт, новости, афишу, телепрограмму, сводку погоды, другие услуги).

Азы информатики RU 2000/2007 © А.А.Дуванов

Вверх Выход из Конспекта