Поиск информации (на начало урока 8)
Регистрационная метка
Читальный зал Роботландии
Люди ищут информацию в коллекциях ссылок, в каталогах, в рейтингах, в индексах. Сетевые роботы тоже заняты поиском — они пополняют индексы Интернета.
 

Детективные агенства Интернета

— Петя, ты опять умыкнул мои тапочки!

— Не брал я твои тапочки!

— Как же не брал, а что у тебя на ногах?

— Это мои собственные тапочки. Посмотри, левый покусан собакой.

— А правый?

— В подошве кнопка, которую кошка сбросила на пол.

— Да? А где же мои тапочки?

— Откуда я знаю! Ищи! Может, Фрося отнесла на балкон или Анфиска засунула под кровать! И поскорее! Пора искать информацию в Интернете, а не тапочки!

— Интернет, конечно, мощная вещь! Но найти в нём что-либо конкретное будет посложнее тапочек, я пробовал! Ощущение — будто ищешь иголку в стоге сена. Утомительно и безнадёжно. Получается, что Интернет поедает сам себя. Я даже закон открыл, думаю назвать его законом Васи Кука:

Бесполезность Интернета пропорциональна квадрату его массы.

— Брат, не всё так безнадёжно! Для поиска существует специальный инструментарий. Нужно просто уметь им пользоваться.

Вверх

Поиск на странице

Вася. Давай начнём с самого простого — с поиска на странице сайта.

Мой школьный товарищ Коля говорит, что компьютер Привалова из повести “Понедельник начинается в субботу” братьев Стругацких, назывался “Эльбрус”. А я утверждаю — “Абакан”!

Я загрузил текст повести из широко известной в Интернете библиотеки Максима Мошкова (lib.ru). Вся повесть расположена на одной длинной гипертекстовой странице. Как побыстрее найти в ней название компьютера?

Петя. Для поиска на странице в браузере Internet Explorer (и во многих других) предусмотрен пункт Найти на этой странице в меню Правка (горячий аккорд Ctrl+F):

Вася. Ага. Исполняем этот аккорд и набираем в окне поиска слово “эльбрус”:

После щелчка на кнопке Найти далее искомое слово на странице выделяется:

Но это не название компьютера! Здесь говорится о пленении студентки снежным человеком с Эльбруса!

Петя. Щёлкни ещё раз на кнопке Найти далее или нажми Enter — браузер продолжит поиск.

Вася. Сделал. Теперь браузер сообщил о завершении поиска:

Значит…

Петя. Значит, слово “эльбрус” больше в тексте не найдено.

Вася. Этого следовало ожидать! Поищем-ка теперь слово “абакан”…

Слово “абакан” в тексте вообще не встретилось, как и слово “компьютер”. Петя заметил, что в те времена, когда Стругацкие писали книгу, слово компьютер было не в ходу, а чаще говорили: ЭВМ (Электронная Вычислительная Машина). Но и слова “эвм” в тексте не оказалось.

Тогда Вася стал искать текст “машин” (чтобы машина нашлась во всех падежных окончаниях).

Сначала попадались явно не те машины (“машина катилась по узкой дороге”, “машина затряслась и запрыгала”).

Наконец, фрагмент “машин” был найден в нужном контексте:

Потом горбоносый спросил: “А где вы работаете?” Я ответил. “Колоссально! — воскликнул горбоносый. — Программист! Нам нужен именно программист. Слушайте, бросайте ваш институт и пошли к нам!” — “А что у вас есть?” — “Что у нас есть?” — спросил горбоносый, поворачиваясь. “Алдан-3”, — сказал бородатый. “Богатая машина, — сказал я. — И хорошо работает?”

Вася. Оказалось, что мы оба с Колей были неправы! Компьютер назывался “Алдан”! Кстати, Петя, как это они всем институтом работали на одном компьютере?

Петя. В те времена (книга была написана в 1964 году) ещё не было персональных компьютеров! Люди, действительно, работали на одном компьютере, который занимал отдельную большую комнату.

Вася. Люди по очереди приходили в эту комнату, садились за стол с компьютером, и работали? А зачем комната была большой, если в ней стоял только один компьютер?

Петя. Для того чтобы вместить сам компьютер! Он не стоял на столе, как современные ПК, а состоял из нескольких шкафов с электроникой, магнитными лентами, барабанами. Устройства соединялись проводами, проложенными под полом:

Что касается поиска на странице, то лучше всего, на мой взгляд, им оснащён браузер FireFox.

Начинается поиск в этом браузере, как и в Internet Explorer, аккордом Ctrl+F (или пункт Найти на этой странице в меню Правка). Появляется специальная панель поиска внизу окна:

Отметка в тексте появляется во время набора образца поиска. Кроме того, можно включить режим Подсветить всё:

Когда образца в тексте нет, то это выясняется уже во время набора — браузер подаёт звуковой сигнал, а набранная часть подсвечивается красным:

Вася. А можно ли в образце поиска указывать подстановочные знаки, как в редакторе Word:

  • знак “?” для обозначения одного произвольного символа (образец к?т для поиска фрагментов “кот”, “кит”, “к т”);
  • знак “*” для обозначения любого числа произвольных символов (образец к*т для поиска фрагментов “кот”, “кит”, “к т”, “кт”, “комнат”, “конец от”, “казал себе, чт”)?

Петя. Нет. Страничный поиск браузера подстановочных знаков не понимает. Но можно, при необходимости, скопировать страницу в Word и использовать мощный поисковый механизм этого редактора.

Страницу можно скопировать в Word так:

  1. Выделить страницу в браузере (Ctrl+A).
  2. Запомнить в буфере обмена (Ctrl+C).
  3. Перейти в окно Word.
  4. Скопировать из буфера обмена (Ctrl+V).

Можно выделенную страницу просто перетащить в Word мышкой:

  1. Выделить страницу в браузере (Ctrl+A).
  2. Нажать левую кнопку мыши на выделенной странице.
  3. Не отпуская кнопку, перемещать указатель в окно Word.
  4. Отпустить кнопку.

Вверх

Поиск по сайту

Вася. Как искать на гипертекстовой странице понятно. А как найти информацию на сайте?

Петя. Можно использовать навигационное меню сайта. Пусть, например, нужно узнать дату создания предприятия “Роботландия”.

Загружаем роботландский сайт и щёлкаем в его меню на позиции “история”:

Первая фраза на этой странице намекает, что история Роботландии рассказана на странице “корни”. Значит, нам сюда.

И, действительно, видим нужную информацию в самом верху этой страницы:

Вася. Примерно так же я искал книгу Стругацких в виртуальной библиотеке Максима Мошкова.

На главной странице я выбрал раздел “Советская фантастика”:

На открывшейся странице с авторами выбрал позицию со Стругацкими:

На новой странице нашёл нужное произведение:

Петя. Информацию можно искать и при помощи системы поиска сайта, если она, конечно, присутствует. На страницах библиотеки Мошкова поиск предусмотрен.

Если набрать в окошке поиска слово “понедельник“ и нажать кнопку Искать, то увидим нужную книгу самой первой в списке найденных результатов:

Вася. Есть какие либо отличия системы поиска по сайту от системы поиска на странице средствами браузера?

Петя. Отличия могут быть очень существенные, и они зависят от конкретной поисковой машины, которая используется на сайте. Скажем, на сайте Мошкова поиск по основе “понедель” приводит к пустому результату. Значит, поиск выполняется по словам.

Ситуация изменится, если отметить позицию “включить полнотекстовый поиск”. Теперь при запросе “понедель” книга будет найдена.

Заметим, кстати, что положительный результат достигается и при помощи фразы с переставленными словами “начинается понедельник”.

Вася. А что означает позиция, в которой можно выбрать сортировку по релевантности или дате?

Петя. Здесь можно задать способ сортировки результатов поиска. При сортировке по дате первыми в список результатов попадут самые свежие поступления.

Вася. С датой примерно понятно, хотя я думал, что будет сортировка по датам выхода книг. А вот что такое релевантность?

Петя. Релевантность — это мера соответствия получаемого результата желаемому. Разные поисковые машины вычисляют релевантность по-разному (и, как правило, держат свои алгоритмы в секрете). Мы поговорим о релевантности подробнее немного позже.

Вверх

Поиск в Интернете

Вася. Итак, понятно, как искать информацию на сайте, на отдельной его странице… А как искать в бездонном Интернете? Это безнадёжно!

Петя. Ну, давай попробуем, например, узнать, что означает слово “алдан”.

Вася. Для поиска в Интернете я обычно использую Яндекс (www.yandex.ru). Набираю слово “алдан” в строке ввода на этом сайте и нажимаю кнопку Найти:

Яндекс радостно сообщает, что нашёл 115 469 страниц в Интернете, на которых упоминается слово “алдан”!

Первая запись в списке результатов намекает, что Алдан — город:

Но первая ссылка не работает (приводит на страницу с сообщением об ошибке). Вторая относится к ломбарду, третья к теплоходу. Четвёртая говорит о музее имени Алдана Маадыра в республике Тува, пятая — о предприятии “Алдан” в Екатеринбурге.

Петя. Если посмотреть результат поиска дальше, можно, конечно, найти сведения о городе Алдане. Но можно попробовать поискать в Рубиконе — крупнейшем энциклопедическом ресурсе русской части Интернета:

Первая запись в списке результатов содержит перевод выражения “река Алдан” (значит, есть и река Алдан!) на английский язык, вторая сообщает, что Алдан — районный центр в Якутии и расположен в бассейне одноимённой реки:

Нужную информацию содержит фрагмент, извлечённый Рубиконом со страницы своей энциклопедии “Города России”.

Вася. В данном случае Рубикон помог нам лучше, чем Яндекс.

Вверх

Инструменты поиска в Интернете

Вася. Какие поисковые службы существуют в Интернете и как они работают?

Петя. Поисковые инструменты Интернета можно распределить по следующим категориям:

  • Коллекции ссылок
  • Каталоги
  • Рейтинги
  • Индексы

Инструменты поиска в Интернете:

Азы информатики RU 2000/2006 © А.А.Дуванов

Вверх Выход из читального зала