Поиск информации (на начало урока 8)
Регистрационная метка
Выходим в Интернет (на оглавление книги)
На начало урока 8

Поиск картинок

На этой странице:

Как паук находит картинки

Пауки поисковых систем собирают информацию и о картинках, которые встречают на гипертекстовых страницах Интернета.

Сами картинки пауки, конечно, не видят! Но они читают содержимое атрибутов alt и title, которыми аккуратные сайтостроители снабжают тег IMG, задающий вывод изображения на экран.

Нам предстоит основательно заняться строительством сайтов, поэтому давайте посмотрим, как задаётся картинка в HTML-коде гипертекстовой страницы.

Ниже показана картинка и тег HTML, который эту картинку выводит на экран:

Козленок
<IMG src="./pic/08p85.gif" 
     width="152" 
     height="173" 
     border="0"
     alt="Козлёнок"
     title="Козлёнок, которого 
            проиндексировали">

Разберём подробно каждый элемент этого кода.

<IMG ... >
Тег HTML — это команда языка. Тег записывается в угловых скобках, имеет имя и набор атрибутов. Тег с именем IMG предназначен для вывода картинок.
src="./pic/08p85.gif"
Атрибут задаёт свойство тега. Он записывается в виде:

имя="значение"

Атрибут src задаёт имя файла с картинкой и место расположения файла. В данном случае файл имеет имя 08p85.gif и располагается в подкаталоге pic текущего каталога сайта (./ — указание на текущий каталог).

width="152" 
height="173" 
Атрибуты width и height задают соответственно, ширину и высоту картинки на экране в пикселах.
border="0"
Атрибут border задаёт толщину (в пикселах) рамки вокруг картинки. Для козлёнка рамка не задана.
alt="Козлёнок"
Козленок
Атрибут alt задаёт альтернативный текст для картинки. Если картинка не загружена (нет в каталоге или проблемы с Сетью), браузер рисует вместо неё на экране прямоугольник, в котором располагает альтернативный текст.
title="Козленок, 
       которого 
       проиндексировали"
Козленок
Атрибут title задаёт примечание (комментарий) для картинки. Текст, записанный в атрибуте, браузер выводит на экран при зависании курсора над картинкой.

Сетевые пауки, составляющие базу данных для поисковых систем, анализируют содержимое атрибутов alt и title, когда в коде страницы встречаются тег IMG.

Значит, если записать в качестве поискового запроса текст

козленок

или

козленок проиндексировали

в результатах поиска, среди многочисленных страниц с “текстовыми” козлятами, будут страницы с козлятами рисованными, если, конечно, заданные ключевые слова встречаются в атрибутах alt или title соответствующих картинок.

Таким образом, картинки можно искать при помощи обычных универсальных поисковых систем.

Но это не очень удобно. Вернее, совсем не удобно!

Ведь придётся долго щёлкать по ссылкам в результатах поиска, чтобы разобраться, какие козлята спрятались на страницах, текстовые или рисованные. Понятно, что текстовых козлят будет гораздо больше!

Да, поиск картинок в Сети был бы головной болью, если не было бы специализированных поисковых систем. Которые специально ищут не текст, а именно картинки.

Специалисты по поиску картинок

Такие специализированные поисковики анализирует не только атрибуты alt или title картинок на гипертекстовых страницах, они смотрят текст, который окружает изображение, интересуются именем картиночного файла (например, в файле dog.jpg, скорее всего, “зарыта” собака). Особо упорные специалисты, даже пытаются читать тексты на самих картинках (анализируя соответствующий графический файл).

А главное, в качестве результата поиска они выдают только картинки (“текстовые” козлята игнорируются), располагая на странице иконки — уменьшенные изображения. Если иконка подходит, можно посмотреть картинку в естественных размерах и загрузить её на свой компьютер.

Кроме того, хорошие специалисты предлагают дополнительные услуги:

  • сортируют изображения по релевантности поисковой фразы или дате;
  • снабжают результаты “паспортными” данными: указывают имя файла, его размер в килобайтах, формат картинки и её размер в пикселах.
  • ищут любые картинки или картинки с характерным размером (маленькие для экрана, большие для печати);
  • отсекают из результатов картинки “сомнительного” содержания;
  • предупреждают о том, что каждая картинка имеет автора и её использование без согласования с автором или без ссылок на источник (когда автор неизвестен) является противозаконным.

Давайте поближе познакомимся с несколькими популярными картинкоискателями.

Яндекс

Ну да, конечно! В службах этого портала есть и специализированный поиск картинок!

Зададим фразу поиска, но щёлкнем не на кнопке Найти, а на ссылке Картинки:

На странице с результатами Яндекс показывает меню, в котором можно указать желаемый размер картинок:

Смысл позиций меню:

  • Любые — картинки любого размера.
  • Огромные — свыше 1 000 000 квадратных пикселов.
  • Большие — от 100 000 до 1 000 000 квадратных пикселов.
  • Средние — от 10 000 до 100 000 квадратных пикселов.
  • Маленькие — от 1000 до 10 000 квадратных пикселов.
  • Мелочь — до 1000 квадратных пикселов.

Если нужна картинка для экрана размером примерно в 400x400 пикселов, то нужно выбрать позицию Большие (400 * 400 = 160 000).

А если картинка нужна для печати на бумаге в размерах 10x10 см с исключительно хорошим качеством в 300 dpi? Давайте подсчитаем.

Десять сантиметров это примерно 4 дюйма. Значит, в 10 сантиметрах при 300 dpi должно уместиться 10 * 4 * 300 = 12 000 пикселов.

Таким образом, нам нужны картинки размером 12 000 * 12 000 пикселов. А это — 144 000 000 квадратных пикселов.

Значит, искать такие картинки нужно в режиме Огромные. Не надо только забывать, что огромные по геометрии картинки имеют, как правило, огромные размеры и по килобайтам (вернее уже по мегабайтам). При копировании таких монстров нужно предварительно заглянуть в свой кошелёк!

На самом деле, качество печати с разрешением в 300 dpi — неразумно высокое. На практике печать с разрешением 150 dpi выглядит вполне прилично.

Рабочая формула для перевода линейных сантиметров в пикселы:

Lпикселы = (Lсантиметры*dpi)/2,5

Здесь:

  • Lпикселы — размер в пикселах
  • Lсантиметры — размер в сантиметрах
  • dpi — разрешение печати

Искать картинки в Яндексе можно с главной страницы, но можно сразу загружать соответствующую службу:

images.yandex.ru

Заметим, что когда на одном сайте Яндекс обнаруживает несколько картинок соответствующих запросу, он показывает только одну (самую релевантную) в рамке, напоминающей колоду, а под картинкой выводит ссылку “Ещё с сайта”:

В Яндексе отсутствует фильтр “семейного” поиска, поэтому даже для безобидного запроса козленок могут быть предъявлены для просмотра “сомнительные” картинки.

Google

Этот поисковик также имеет службу поиска картинок. Для перехода в неё щёлкнем по соответствующей позиции в меню на главной странице:

Прямой переход:

www.google.ru/imghp

Зададим фразу и запустим поиск:

Каждая картинка в результатах сопровождается указанием размера в килобайтах и пикселах. Имена файлов с картинками не называются, сообщается только формат. Но этого достаточно: сами имена не слишком-то и нужны.

Когда на сайте есть и другие картинки, об этом информируется дополнительно:

На странице с результатами можно выбрать вариант размера картинок:

В арсенале Google кроме простого, имеется расширенный поиск картинок. В этом режиме назначаются дополнительные условия:

Семейный фильтр в настройках Google отсутствует.

Picsearch

Это очень хорошая машина для поиска изображений. Компания Picsearch родом из Швеции. Не удивительно, что больше всего в её базе картинок западного производства.

Адрес в Интернете:

www.picsearch.com

Попробуем поискать козлят при помощи этого специализированного поисковика:

Как это не покажется странным, русские козлята тоже нашлись в загашнике этой системы (хотя и не слишком много):

Но, конечно, эта система даст гораздо больше результатов, если фразу поиска задать на английском языке.

Козленок по-английски — kid. Однако искать козлят на это слово бесполезно — так по-английски ласково называют детей. Будем искать по слову goat (козел). Среди картинок с большими козлами обязательно будут и маленькие козлики:

Ссылка Source загружает отдельную страницу с картинкой в исходных размерах, а ссылка Info страницу с более подробной информацией о картинке, в том числе со ссылкой на сайт, на котором картинка найдена:

А теперь внимание! Сайт компании Picsearch имеет русскую локализацию по адресу:

www.picsearch.ru

Для русскоязычных пользователей поисковик принимает более дружелюбный вид:

Можно искать в режиме расширенного поиска:

В ключевой фразе запроса можно использовать знаки + и - (как в Яндексе). Например, запрос mouse -computer уменьшит число результатов, если вы ищите картинки с обычными, а не компьютерными мышами.

Выбор языка интерфейса, конечно, не меняет базы данных поисковика, поэтому запрос по-английски даст гораздо больше результатов, чем тот же запрос по-русски. Например, для слова “goat” предлагается 119 070 результатов, а для слова “козел” — только 466.

Picsearch имеет собственный каталог (животные и столицы):

Прямая ссылка на каталог:

www.picsearch.ru/image-dir.html

Наконец, Picsearch обладает встроенным “семейным” фильтром, который на удивление хорошо работает. Создаётся впечатление, что картинки контролирует человек!

Пример картинки, которую Picsearch выдал в ответ на слово “секс”:

Сервис Фликр

Фликр — особое место в Интернете для хранения цифровых фотографий.

Адрес сервиса: flickr.com

Любой зарегистрированный пользователь может бесплатно разместить на этом сервере свои работы, указав их статус: для личного, семейного, группового или свободного использования. В последнем случае фотографии могут смотреть все желающие.

Сервис Фликр относят к сервисам Web 2.0 — второму поколению сервисов Интернета, более приспособленных для коллективного творчества, чем традиционные. Кроме Фликра (коллекции фотографий) к сервисам Web 2.0 относят делишес (коллекции ссылок), блоги (сетевые дневники), Вики (открытые гипертексты), а также Ютьюб (коллекции видеоклипов).

Фотографии, размещаемые на сервере Фликр, снабжаются названиями, описаниями и ключевыми словами — тегами, что существенно облегчает их поиск в базе данных Фликра.

Если на Фликре найдена интересная фотография:

можно поближе познакомиться с её автором (автор данной фотографии скрывается под ником Рhitar), узнать его профессию, интересы, пристрастия, посмотреть другие работы:

К каждой фотографии посетитель может оставить свой комментарий и прочитать комментарии других людей.

Кроме обычных описаний, фотография может снабжаться географическими координатами, поэтому снимки можно искать не только через обычную строку поиска системы Фликр, но и на географической карте:

Впрочем, система поиска Фликра весьма многообразна. Можно искать фотографии по наиболее популярным тегам (размер шрифта соответствует степени популярности):

А можно искать фотографии дня на специальном навигационном календарике:

Картинки на ftp

Картинка — этой файл. Также, как и музыка, видео, программа…

В силу этого картинки можно искать не только на гипертекстовых страницах, но и в богатых файловых кладовых ftp-серверов.

Как это делается, рассказано в следующем разделе Академии:

Поиск файлов

На начало урока 8

Азы информатики RU 2000/2006 © А.А.Дуванов

Вверх Оглавление книги Урок 8. Поиск информации Письмо автору Об авторах