Поиск информации (на материал для учителя)
Регистрационная метка
Выходим в Интернет (на оглавление книги)
Основное занятие пользователей Интернета — поиск информации.
 

Читальный зал | Вопросы
Зачёты
Термины. Часть 1
Термины. Часть 2
Язык запросов. Часть 1
Язык запросов. Часть 2
Практикумы
Поиск на странице
Поиск на сайте
Поиск в коллекциях ссылок
Поиск в каталоге
Поиск в рейтинге
Поиск в индексе
Метапоиск
Академия
Поиск картинок | Вопросы
Поиск файлов | Вопросы
Поиск программ | Вопросы
Поиск электронных книг
Поиск в словарях и энциклопедиях
Поиск карт и Web-камер
Поиск работы
Поиск товара
Практикумы
Поиск картинок
Поиск и копирование файлов
Поиск программ
Поиск электронных книг
Поиск в словарях и энциклопедиях
Поиск карт и Web-камер
Поиск работы
Поиск товара
Справочные страницы Яндекса
Справочные страницы Рамблера
История появления Google
Полезные ссылки

Конспект

Инструменты поиска в Интернете:

  • Универсальные средства
    • коллекции ссылок
    • каталоги
    • рейтинги
    • индексы
  • Специализированные средства поиска
    • картинок
    • файлов
    • программ
    • электронных книг
    • в словарях и энциклопедиях
    • карт и Web-камер
    • работы
    • другой специфичной информации

Коллекция ссылок — набор ссылок по теме сайта или содержание специальных сайтов, которые собирают и описывают ссылки на полезные ресурсы.

Коллекции ссылок можно разделить на традиционные и социальные.

Традиционная коллекция ссылок — набор ссылок, редактирование и пополнение которого доступно только авторам.

Социальная коллекция ссылок — набор ссылок, редактирование и пополнение которого открыто для всех желающих. Примером социальной коллекции ссылок является Делишес (сервис действует на сайте по адресу del.icio.us).

Интернет-каталог — сайт, страницы которого образуют тематическую иерархию. На главной странице расположен список внутренних ссылок на основные темы каталога. На страницах-потомках — список внутренних ссылок, детализирующий тему родителя. На страницах-листьях — список внешних ссылок на сайты по данной теме.

Достоинства и недостатки каталогов

Записи в каталог помещаются людьми — владельцами каталога. Отсюда все плюсы и минусы этого инструмента.

Плюсы

Информация в каталогах хорошо структурирована, значит, её легко искать.

Кроме общих, в Интернете много специализированных каталогов (туризм, автомобили, развлечения…) — это также облегчает (конкретизирует) поиск.

Каждая ссылка на сайт снабжена кратким описанием ресурса.

На страницах-листьях каталога располагается совсем немного ссылок — их просмотр (в поисках нужного сайта) не займёт много времени.

Минусы

Каталоги содержат сравнительно небольшие наборы записей и не могут претендовать на охват значительной части Интернета.

Набор записей каталога отражает субъективные предпочтения авторов.

Содержание каталога с трудом поспевает за быстро меняющимся Интернетом.

Каталоги предназначены для поиска сайтов по заданной теме, а не конкретной информации на их страницах. Например, при помощи каталога трудно найти ответ на вопрос “кто такой Мошков?” или “что такое каталог?”

Рейтинг (или топ) — это каталог, в котором ссылки на сайты внутри категорий сортируются по популярности сайтов.

При подсчёте популярности учитываются, как правило:

  • Хиты (визиты) — общее число заходов на сайт.
  • Хосты — количество уникальных посетителей за отчётный период (день, неделю, месяц).

Индекс (поисковая система, поисковик) — сервер, который автоматически, при помощи специальных программ (их называют пауками) постоянно сканируют страницы Интернета, и индексируют их, то есть заносят в свою базу данных.

На сервере индекса располагаются:

  • База данных по страницам Интернета: сами страницы в сжатом виде и словарь по ним (индекс).
  • Программы для сбора страниц Интернета (пауки).
  • Программа для поиска информации в базе данных.
  • Сайт, на котором пользователь может записывать запросы на поиск и просматривать результаты.

Индекс — более мощный инструмент поиска по сравнению с коллекциями ссылок, каталогами и рейтингами.

Плюсы индекса

Индекс охватывает большую и “свежую” часть Интернета. С помощью него удобно искать фрагменты текста, содержащие ответы на конкретные вопросы (а не сайты по теме, как в коллекциях, каталогах и рейтингах).

Минусы индекса

Индекс составляется автоматически специальными программами, поэтому, в отличие от “ручных” коллекций, каталогов и рейтингов, предлагает пользователю большое количество информационного мусора. Для продуктивной работы с индексом нужно правильно формулировать запросы и уметь пользоваться языком поиска, помогая индексу повысить релевантность полученных результатов.

Вес ссылки на документ для слова из индекса. В индексе поисковой системы с каждым словом или фразой связан список ссылок на документы в которых это слово или фраза встречаются. Каждая ссылка снабжается весом — числовой оценкой её значимости.

При вычислении веса ссылки, связанной со словом из индекса, учитываются:

  • Индекс цитирования документа (ИЦ). Более весомым считается документ, на который есть много ссылок с других сайтов, причём цитирование с крупных популярных сайтов оценивается выше.

  • “Свежесть” страницы. Вес ссылки выше для страниц с более новой датой обновления.

  • Написание ссылки. Если слово, к которому привязана ссылка, входит в состав самой ссылки, то вес ссылки больше (например, слово microsoft входит в состав ссылки на сайт компании: www.microsoft.com).

  • Ссылка имеет повышенный вес, если слово, с которым она связана, входит в состав названия окна документа.

  • Вес ссылки повышается, если слово входит в состав списка ключевых слов страницы (тег META с атрибутом keywords) или в состав описания страницы (тег META с атрибутом description).

  • Ссылка имеет повышенный вес, если слово входит в состав альтернативного текста картинки (атрибут alt тега IMG).

  • При подсчёте веса ссылки учитываются разные параметры появления слова (к которому относится ссылка в индексе) в тексте документа:

    • Форматирование. Больший вес имеют документы, в которых слово встречается в заголовках и разного рода выделениях (жирность, курсив, повышенный размер шрифта).

    • Место слова в документе. Больший вес имеют документы, в которых слово встречается в начале документа, а также в навигационном меню сайта или страницы.

    • Частота появления слова в документе. Документ, в котором слово встречается чаще, имеет больший вес.

Индекс цитирования (ИЦ) — числовая характеристика, которая отражает число сайтов, ссылающихся на данный сайт. Индекс цитирования учитывается при подсчёте веса ссылки.

Релевантность — числовая характеристика, пытающаяся отразить степень соответствия полученных результатов ожиданиям пользователя. Обычно, результаты поиска сортируются по убыванию числового значения этой характеристики: первыми в список помещаются ссылки, имеющие большую релевантность.

Простой поиск — поиск, при котором в запросе (ключевой фразе поиска) не используются элементы языка запросов, задаваемые явно или при помощи интерфейсных элементов на странице Расширенный поиск поисковой системы.

Расширенный или сложный поиск — поиск ключевой фразы при дополнительных условиях, задаваемых интерфейсными элементами на странице Расширенный поиск поисковой системы.

Язык запросов — формальный язык, конструкции которого позволяют назначать различные условия на поиск по ключевой фразе, задаваемой в поле ввода поисковой системы.

Мультипоиск — поиск при помощи специальных мультипоисковых систем. У этих систем нет собственных баз данных. Они, как и метапоисковые системы, обращаются к “настоящим” поисковым системам (индексы, каталоги, рейтинги), переадресуя им запрос пользователя, а затем предлагает результаты в отдельных окнах (результаты каждого “настоящего” поисковика в отдельном окне).

Мультипоисковые системы не “суммируют” результаты, не удаляют дублирующие записи.

Метапоиск — поиск при помощи специальных метапоисковых систем.

У этих поисковиков нет собственных баз данных. Они обращаются к “настоящим” поисковым системам (индексы, каталоги, рейтинги), переадресуя им запрос пользователя, а затем суммируют результаты, удаляя дублирующие записи и сортируя сводный список по релевантности.

Портал — универсальный сайт, предлагающие пользователю широкий спектр услуг (индекс, каталог, ящик электронной почты, место под сайт, новости, афишу, телепрограмму, сводку погоды, другие услуги).

Азы информатики RU 2000/2006 © А.А.Дуванов

Вверх Оглавление книги Урок 7. Web-пространство Интернета Урок 9. Одностраничный документ Материал для учителя Письмо автору Об авторах