Сегодня уже трудно представить себе интернет без такого сервиса как возможность поиска нужной информации. А на заре появления интернета, в начале 1990-х годов, поиск осуществлялся через специальные сайты - каталоги, в которых в структурированном виде были представлены ссылки на некоторые сайты. Первый такой каталог располагался по адресу -
Но еще труднее себе представить что идеи о гипертексте и технологии поиска были сформулированы еще в середине прошлого века, в 1945 году, Вэннивером Бушем в его статье «Пока мы мыслим». Но отсутствие на тот момент технологий, оборудования, да и самого интернета как такового, не позволило реализовать идеи на практике.
Всё изменилось с 1995 года, когда на сцену начали выходить такие «монстры» как Alta Vista (1995), Yachoo (1995), Google (1998), Rambler (1996), Aport (1996), Яндекс (1997). Каждая из данных систем разрабатывала и внедряла свои уникальные алгоритмы поиска и структурирования информации. Но с течением времени происходил своего рода «обмен» и «заимствование», и в настоящий момент базами и алгоритмами поиска Google, Yahoo, Bing и Яндекс пользуются другие поисковые системы. То есть при поиске, скажем в том же
В настоящий момент поисковая система состоит из пяти программных компонентов.
1. «Паук» - программа для скачивания страниц сайта.
2. «Гусеница», которая «просматривает» весь сайт на предмет наличия на нем ссылок и дает «пауку» команды по какой ссылке ему идти и скачивать. Своего рода «гусеница» - это целеуказатель для «паука».
3. «Индексатор», в задачу которого входит анализ скаченных страниц и разбор их на составные части, такие, как например заголовки, текст, ссылки, стили оформления и так далее.
4. «База данных». В ней хранится вся скаченная информация и её анализ.
5. «Система выдачи результатов» - пожалуй самый важный для нас, как для пользователей, инструмент, который и выдает результаты поиска на наш запрос
.
Все поисковые системы выдают результаты поиска не по имеющейся в данный момент времени информации в интернет, а по тому что есть в базе поисковой системы. Поэтому актуальность информации напрямую зависит от того, насколько поисковая система быстро обнаружит и проиндексирует тот или иной сайт. Время на индексацию у разных систем разное, так, если Google достаточно несколько минут или часов, то Яндекс с такой операцией затягивает до нескольких суток или даже недель.
.
Существующие на сегодня алгоритмы выдачи результатов поиска ориентируются на массу параметров и характеристик - заголовок страницы, адрес сайта, ссылки, частота появления поисковой фразы в тексте и так далее, но точного совпадения результатов поиска с нашим запросом пока достичь не получается. Кроме того, поисковики сознательно идут на некоторые «упрощения» с целью достижения как можно меньшего времени поиска.
.
Помимо «традиционных методов поиска», некоторые поисковые системы разрабатываю и довольно успешно используют алгоритмы по организации выдачи результатов в графическом виде. Кто-то дает нам возможность осуществлять поиск по картинкам, графикам.
.
Одним словом, поисковые системы не стоят на месте, и постоянно появляются новые и новые алгоритмы, делающие поиск более интеллектуальным, а значит более точно отражающим наши поисковые запросы.
.
#ИсторияПоиска #ИсторияИнтернета #Поиск #Яндекс #Google
.
—
Сергей Истомин
Бизнес-тренер по развитию в Интернете
+7 928 107-35-93
Следующая запись: Что хотим от своего сайта, для чего он нам нужен? Прежде чем создавать свой сайт, необходимо ...
Лучшие публикации