О полной неопределённости и поиске в Интернете

Все о раскрутке сайтов.

Модератор: Andrej

Ответить
Аватара пользователя
And
Сообщения: 215
Зарегистрирован: Пт сен 15, 2006 1:19 am

О полной неопределённости и поиске в Интернете

Сообщение And » Пт дек 01, 2006 11:10 pm

Изображение


О полной неопределённости и поиске в Интернете


До сих пор мы пытались составить запрос так, чтобы сразу получить нужную нам информацию. Но так, «с налету», обнаружить нужную ссылку удается не всегда.

Семь раз отрежь

В некоторых случаях поисковая машина возвращает множество ссылок, и нужные теряются в их обилии. А какие дополнительные ключевые слова использовать, чтобы сузить область поиска, сразу непонятно. В этом случае придумать нужные ключевые слова помогают уже найденные ссылки.

Например, нам требуется найти биографию писательницы Жорж Санд. Попробуем использовать Rambler (www.rambler.ru) и отправим запрос «Жорж Санд биография». Ссылок находится несколько десятков, но дельных среди них, похоже, нет. Зато мы узнаем, что Жорж Санд – псевдоним, а настоящее имя писательницы – Аврора, фамилия по мужу – Дюдеван. Это позволяет составить новый запрос: «Жорж Санд Аврора Дюдеван». Уже теплее: биографии в результатах поиска опять не видно, зато мы находим год рождения. Теперь можно уточнить третий запрос: «Жорж Санд Аврора Дюдеван 1804» – и получить ссылки на три подходящих документа. Однако, незадача: две ссылки – куцые статейки из пары абзацев, а самая многообещающая (www.booksite.ru/fulltext/bro/kga/brokefr/4/4184.htm –статья в энциклопедии Брокгауза и Ефрона!) возвращает ошибку 404: «Документ с указанным Вами адресом на сервере отсутствует».

И все-таки шанс отыскать этот документ есть. Попробуем использовать метод усечения URL справа: будем отсекать по куску от адреса страницы, начиная справа, пока не попадем в точку, откуда сможем найти интересующий нас документ, либо пока не придем к корневой странице сервера и дальше усекать адрес уже будет невозможно.

Практически это выглядит так.
Сначала попробуем заглянуть на страницу www.booksite.ru/fulltext/bro/kga/brokefr/4 – возможно, наней окажутся ссылки на статьи из энциклопедии, а файл с нужной нам статьей просто переименовали... Не помогает, однако. Теперь пробуем адрес www.booksite.ru/fulltext/bro/kga/brokefr...и получаем знакомую ошибку 404. На очереди www. booksite.ru/fulltext/bro/kga– может быть, директория с энциклопедией теперь называется иначе (например,«brok_efr») и здесь мы найдем ссылку на нее... Не выходит.

И так далее, убираем из адреса директорию за директорией и,к сожалению, все время натыкаемся на ошибку 404. Но вот, наконец, когда пишем просто адрес сервера: www.booksite.ru, мы попадаем на главную страницу Вологодской областной библиотеки. Дальше дело техники.

Следуем в раздел «Полнотекстовая библиотека», а затем в «Алфавитный список», где и обнаруживаем ссылку на главную страницу энциклопедии. Кстати, путь к этой странице очень напоминает путь, который нам выдала поисковая машина. Только адрес сервера другой. Похоже, энциклопедия (да и вся текстовая библиотека) просто переместилась на другой сервер, а дерево директорий осталось прежним. Значит, нам нет необходимости дальше прыгать по www-ссылкам, а можно просто написать новый адрес, изменив только имя сервера: 193.223.132.202/fulltext/bro/kga/brokefr/4/4184.htm, и получить вожделенную статью. Метод усечения URL справа не всегда позволяет найти искомую страницу (может статься, что ее и вправду больше нет на этом сервере, и даже ссылок на нее не осталось), но нередко бывает очень полезен.

В условиях полной неопределенности

Иногда об объекте поиска почти ничего не известно. Допустим, вам нужно найти возраст главы компании, произведшей игру UltimaOnline. Но вы больше ничего не знаете об этой компании, тем более – о ее главе. Не беда, будем двигаться шаг за шагом.
Для начала используем русскую машину (например, Rambler) и введем: «разработчик Ultima Online». Мы выясняем, что это компания Origin. Вводим «президент Origin», узнаем, что его имя Джек Хейстен и что в свое время он «объявил о разработке... проектов на основе мира Privateer...». Ни проекты, ни название мира нам ни о чем не говорят, однако мы получаем характерное слово, которое поможет при дальнейшем поиске. Больше из Rambler ничего выжать не удается, но, раз компания зарубежная, имеет смысл поискать информацию по-английски, для чего обратимся к американскому поисковику Google (www.google.com). По русской транскрипции «Хейстен» английское написаниеимени определить трудно. К счастью, с именем «Джек» проще, кроме того, мы знаем название компании и кое-что об анонсе, который делал глава Origin.

Вводим «Origin Jack Privateer» и узнаем, что фамилия главы Origin – Heistand, а более точное название компании – Origin Systems. Документ, полученный Rambler, датирован весной прошлого года, так что хотелось бы знать, на посту ли еще Jack Heistand? Набираем «Jack Heistand «Origin Systems»» и уже в одном из первых полученных документов находим подтверждение: да, на посту. Кроме этого, обнаруживаем адрес веб-сайта компании. Однако поиски не окончены, поскольку на сайте нужной информации не находится. Ничего, снова используем Google.

Поищем биографию сего замечательного исполнительного директора Origin Systems. Поскольку биография его может быть в списке биографий других не менее замечательных людей, составим запрос так: «Jack Heistand (biogrpaphy OR biographies)» – и получаем нужную ссылку на первой странице.

Итак, подытожим:

- Если первый запрос недостигает цели, используйте полученные документы, чтобы подобрать ключевые слова для более точного запроса.
- Если сервер возвращает ошибку 404, попробуйте метод усечения URL справа.
- Если не нашли русскоязычной поисковой машиной, попробуйте поискать англоязычной.
© 2003-2005 Copyright by A. Danilyuk WebMaster
http://danilsitenew.narod.ru/

Admin
Site Admin
Сообщения: 62
Зарегистрирован: Ср сен 13, 2006 9:48 pm

Сообщение Admin » Сб апр 18, 2009 11:38 am

:!:

Ответить

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость