Новый поисковик. Софт и сервисы для профессионального поиска

С каждым днем объем информации с сети, а значит и на компьютерах пользователей, увеличивается. На жестких дисках рядового юзера количество файлов может достигать нескольких сотен, и найти нужный в общей массе бывает совсем не просто. Стандартный поисковик Windows не всегда работает быстро и обладает весьма скудным функционалом, поэтому имеет смысл пользоваться сторонними программами.

В этом обзоре рассмотрим несколько программ, которые помогут отыскать нужные данные на компьютере.

Данная программа является, пожалуй, наиболее мощным инструментом для выполнения поиска на дисках ПК. Имеет множество тонких настроек, фильтров и функций. В состав дистрибутива также включены дополнительные утилиты для взаимодействия с файловой системой.

Одной из отличительных особенностей Search My Files является возможность полного удаления файлов путем перезаписи нулями или случайными данными.

SearchMyFiles

Search My Files часто путают с предыдущим софтом ввиду созвучного названия. Эта программа отличается тем, что более проста в использовании, но вместе с тем, в ней отсутствуют некоторые функции, например, поиск на сетевых дисках.

Everything

Простенькая поисковая программка со своими особенностями. Everything умеет искать данные не только на локальном компьютере, но и на ETP и FTP серверах. Из других представителей подобного софта выделяется тем, что позволяет отслеживать изменения в файловой системе компьютера.

Effective File Search

Еще один очень простой в настройке и работе софт. При совсем крошечном размере имеет достаточное количество функций, способен экспортировать результаты в текстовые и табличные файлы, может быть установлен на флешку.

UltraSearch

UltraSearch может находить не только файлы и папки, но и искать информацию в содержимом документов по ключевой фразе или слову. Главной отличительной чертой программы является автоматическая инициализация подключаемых носителей.

REM

REM отличается более дружелюбным интерфейсом, нежели предыдущие участники. Принцип работы программы заключается в создании зон, файлы в которых индексируются автоматически, что позволяет значительно ускорить процесс поиска. Зоны можно создавать не только на локальном компьютере, но и на дисках в сети.

Google Desktop Search

Разработанный всемирно известной компанией, Google Desktop Search представляет собой маленький локальный поисковик. С его помощью можно разыскивать информацию как на домашнем ПК, так и в интернете. В дополнение к основной функции, в программе предусмотрено использование информационных блоков – гаджетов для рабочего стола.

Все программы, приведенные в данном списке, отлично подходят для замены «родного» поиска Windows. Выбирайте сами: установить софт попроще, но с меньшим набором функций, или целый поисковый комбайн с возможностью обработки файлов. Если вы работаете с папками и дисками в локальной сети, то вам подойдут REM и Everything, а если планируете «носить программу с собой», то обратите внимание на Effective File Search или Search My Files.

Лучшие поисковые системы Интернета. Поисковая система интернетаэто специальные программы для поиска, установленные на целый комплекс специализированных машин. А по-простому — это тот же сайт с комплексом программ, только на специальной поисковой машине (сервере). Именно при помощи поисковых систем вы находите всю нужную вам информацию. Поисковых систем очень много.

1. Что такое поисковая система Интернета

2. Популярные поисковые системы нашей страны

3. Популярные поисковые системы Зарубежья

4. Необычные поисковые системы

5. Как правильно искать информацию в Интернете

Самые лучшие п оисковые системы в нашей стране:

http://www.yandex.ru

http://www.google.com

http://www.aport.ru

http://www.rambler.ru/

http://go.mail.ru

http://www.webalta.ru/

Самый всеми нелюбимый и навязчивый поисковик.

Популярные поисковики зарубежья

http://www.altavista.com

http://www.alltheweb.com

http://www. bing.com

http://www.google.com
http://www.excite.com
http://www.lycos.com
http://www.mamma.com

http://www.yahoo.com

http://www.dmoz.com
http://www.hotbot.com
http://www.dogpile.com
http://www.netscape.com
http://www.msn.com
http://www.webcrawler.com
http://www.jayde.com
http://www.aol.com
http://www.euroseek.com
http://www.teoma.com
http://www.about.com
http://www.ixquick.com
http://www.lookle.com
http://www.metaeureka.com
http://www.searchspot.com
http://www.slider.com
http://www.allthesites.com
http://www.clickey.com
http://www.galaxy.com
http://brainysearch.com
http://www.orura.com

У каждой страны существую свои популярные поисковые системы.

Необычные поисковые системы

  • DuckDuckGo (https://duckduckgo.com/)- гибридная поисковая система с политикой конфиденциальности пользователя и его поисковых запросов.

  • TinEye (http://tineye.com/) - поисковая система, специализирующаяся на поиске изображений в Интернете. С недавнего времени теряет свою актуальность, после того, как Google ввел такую же функцию в своем поиске по картинкам.

  • Генон (http://www.genon.ru/) - поисковая система, собирающая и создающая контент у себя на сайте.

Почти в каждой поисковой системе помимо окна поиска расположены ссылки на самые популярные новостные сайты, и сайты определенной тематики.

Как правильно искать информацию в Интернете

В каждой поисковой системе есть свои алгоритмы (правила) поиска информации.

Для того, чтобы найти какую-то информацию в Интернете через поисковую систему, необходимо в поле поиска ввести запрос . Если вы введете какое-то одно слово, то вам по этому запросу выдадут тысячи ссылок на сайты, в которых это слово упоминается.

Поэтому необходимо вводить как можно более конкретный запрос, состоящий из двух, трех и более словосочетаний.

Давайте рассмотрим пример запроса в поисковой системе Яндекс .

Допустим, вы хотите найти информацию по вопросу о покупке компьютера. Если вы напишите в окне поиска одно слово «Компьютер », то вам выдадут 133 млн ответов

Надо задать более конкретный запрос. Лучше указать какой именно компьютер вы хотите купить и где (в каком городе).

Тогда уже поисковая система выдаст вам намного меньше ответов на ваш запрос.

Поисковой системе совершенно без разницы, какими буквами вы введете запрос – большими или маленькими.

Яндекс различает существительные и прилагательные, но совершенно игнорирует окончания.

Также ему совершенно безразличны падежи, множественное число и тому подобное.

Для того чтобы поиск был более точным, необходимо взять запрос в кавычки или поставить перед словом восклицательный знак.

А теперь посмотрите на тот же самый запрос, но без восклицательных знаков.

Видите разницу? С восклицательными знаками количество ответов не 2 млн, а 186 тыс.

Если вы поставите восклицательный знак перед словом с большой буква, то вам выдадут ответы, в которых встречается именно это слово с большой буквы.

Если слово в именительном падеже, и вам необходима информация именно по такому слову, и именно так, как вы его написали, то поставьте перед этим словом два восклицательных знака. Например: !!Мяч .

Поиск выдаст вам ответы именно по этому слову «Мяч » так, как вы его написали. Не «мячик », не «мячи », и с большой буквы.

Если вы напишите словосочетание со словом «на », то Яндекс проигнорирует «на ». Например: «на полке ». Поиск будет производиться только по слову «полка ».

Для того, чтобы он его учел и не игнорировал, надо перед словом «на » поставить знак плюса – «+на ».

У каждой поисковой системы свой алгоритм поиска, поэтому если вы пользуетесь каким-то определенным поисковиком, и хотите научиться правильно составлять запросы, то надо просто набрать в поисковой строке «правила поиска в Google » или «правила поиска в Яндекс », перейти по ссылке ответа на ваш запрос и почитать нужную информацию.

Рунет представляет собой место, где можно найти практически все. Но только при условии пользования правильным поисковиком. Последних на сегодняшний день в российской части Интернета уже с десяток, но некоторые из них используются почти всеми пользователями, а другие – лишь небольшим процентом. Связано это как с особенностями самих поисковых систем, так и с устоявшимся мнением, что Яндекс и Goggle – это круто, а остальные лишь пытаются за ними угнаться.

А знаете кто придумал Яндекс и Goggle? Вот .

Что такое поисковик

Поисковая система – это сервис, осуществляющий поиск информации во Всемирной Сети Интернет по заданному поисковому запросу пользователя. Для того чтобы найти эту самую информацию, необходимо открыть сайт поисковика и сформулировать запрос. При этом не обязательно записывать целые предложения в поисковой строке. Поисковики сегодня уже настолько «умны», что могут понять запрос пользователя буквально с полуслова.

В современном мире практически не существует человека, который хоть раз в жизни не искал что-либо во Всемирной сети Интернет. Поисковики, с помощью которых мы и осуществляем поиск, уже прочно вошли в нашу жизнь – мы «гуглим» названия фильмов и книг, имена и адреса людей, кулинарные рецепты и студенческие работы.

Трудно представить, как трудно нам пришлось, если бы не было Яндекса, Гугла, Майла и других информационно-поисковых систем. Приходилось бы записывать названия сайтов или даже подбирать их из набора символов. Но несмотря на то, что поисковики являются неотъемлемой частью повседневной жизни современного человека, мало кто задумывается, как они работают и каким образом появились.

История возникновения поисковиков

Удивительно, но история поисковых систем началась еще в 1945 году. Именно тогда американский ученый Вэнивер Буш впервые в одной из своих статей привел идею гипертекста. Впоследствии он также участвовал в создании первого прототипа поисковика, но основную работу все же проделали другие люди.

В 1969 году ученые одного из агентств по работе над исследовательскими проектами США создали концепцию, позволяющую передавать информацию при помощи компьютерной сети. Данную разработку хотели использовать для военных целей, но выяснилось, что соединение слишком слабое и может возникнуть утечка информации. Работа над концепцией прекратилась, но была снова возобновлена в 1980 году. На этот раз удалось объединить библиотеку информации университетов США с помощью компьютерных сетей.

Первый настоящий прототип современных поисковиков появился в середине 1990-х годов, когда были созданы каталоги сайтов, по которым можно было осуществлять поиск. Также существовали боты поисковых систем, но они не смогли дальше справляться со своими обязанностями после развития Интернета и появления большого количества сайтов.

С 1995 года во Всемирной сети начали свою работу современные поисковики – Yahoo, Google, Яндекс и другие.

Принцип работы поисковых систем

Процесс нахождения информации в Интернете поисковиком состоит из трех этапов:

  • Изучение всех сайтов – сканирование;
  • Индексирование;
  • Ранжирование

На первом этапе поисковик блуждает по Всемирной сети, изучая содержимое каждого сайта. Учитывая, сколько сайтов представлено в Интернете и какое количество информации на них представлено, можно только предполагать с какой скоростью происходит сканирование. Ведь выдать результат нужно сразу после запроса пользователя.

Сканированием у поисковиков занимаются специальные роботы. Их также называют пауками. Они заходят на каждый сайт в Интернете и заносят информацию с них в свою базу данных. На старых сайтах это делается периодически, но именно сколько раз в месяц, решают уже сами поисковики. Когда же появляется новый сайт, роботы быстро сканируют весь его контент и забирают себе всю эту информацию. Дальше все происходит точно так же, как и на других сайтах.

На втором этапе и происходит процесс занесения найденной информации в базу данных. Здесь также каждая поисковая система работает по-своему. Например, Goggle забирает всю информацию, найденную на сайте, а Яндекс – лишь ту часть, которая кажется ему полезной. Затем поисковики классифицируют данные по темам, чтобы впоследствии было проще с ними работать.

На третьем этапе происходит выстраивание сайтов по порядку, в зависимости от того, насколько информация на них совпадает с поисковым запросом пользователя.

Количество пользователей поисковых систем растет с каждым днем, а значит, растет и популярность самих поисковиков. Возможно, совсем скоро позиции сервисов изменятся, они начнут работать в другом ключе или исчезнут вовсе. А простым пользователям остается лишь подстраиваться под них.

Итак, вот самые распространенные поисковые системы Рунета.

Яндекс: история возникновения

Как пользоваться поиском Google

Работа Goggle практически аналогична работе Яndex. Здесь также для нахождения нужной информации достаточно вбить письменный запрос на нужном языке в поисковую строку. Также можно задать и голосовую команду. Для этого достаточно нажать на значок микрофона и сделать запрос на поиск.

Поисковик поможет найти не только сайты с текстовой информацией, но и нужные картинки, видео или новости. Чтобы это сделать, нужно задать запрос и затем выбрать соответствующий раздел внизу поисковой строки.

Поисковая система Майл

– крупнейший интернет-портал Рунета, объединяющий в себе несколько сервисов. Один из них – поисковая система Mail, которая появилась сравнительно недавно – в 2003 году. Данный проект был запущен с намерением сделать его таким же успешным, как почту mail.ru, Одноклассники или Агент. Для этого были использованы разработки Google WebSearch, сервис интегрировали с List.mail.ru, но все же поисковик не стал таким популярным, как, например, Яндекс.

Несмотря на это mail.ru имеет свои особенности, выгодно отличающие его от других подобных сервисов. Так, поиск в нем ведется не только по всему Интернету, но и в самих сервисах Mail.Также поисковая система умеет различать названия фильмов и книг, запоминать предыдущие запросы пользователей, выдавать информацию по похожим запросам. В перспективе создание специального сервиса для вебмастеров, где можно будет получать информацию о:

  • запросах, интересующих пользователей поисковых систем;
  • посещаемых страницах;
  • скачанных файлах;
  • кэше посещаемых страниц;
  • рейтинге сайтов по посещаемости.

В настоящее время поисковая система Mail занимает 3 место по популярности в Рунете и обрабатывает почти 6% всех запросов в Интернете в РФ.

Как пользоваться поиском Mail

В отличие от Google и Яндекс, поисковая строка Mail расположена в верхней части главной страницы. А вот алгоритм поиска тот же. Для нахождения информации достаточно вписать запрос и нажать значок с лупой. Аналогичны главным поисковикам Рунета и разделы Mail. Здесь тоже можно найти картинки и видео, но кроме этого, доступны «приложения» и «ответы». Выбрав первый раздел, можно воспользоваться многочисленными инструментами сервиса. Второй позволит найти информацию в Mail.Ответы.

А в этой статье я писал про сервисы очень подробно.

Поисковая система Рамблер

Рамблер – самый первый поисковик Рунета и огромное информационное пространство. История его началась в 1991 году. В то время Интернет как таковой в России только начинал зарождаться и использовался только в крупных организациях. В число таких организаций входили институты РАН, и в одном из них стали использовать локальную сеть для передачи данных между сотрудниками. Позже сеть была подключена к Интернет.

После пяти лет успешного использования на базе сети под началом российского программиста Дмитрия Крюкова создали поисковую систему под названием Rambler, что в переводе означает «странник». Данное название полностью отражает суть не только этого поисковика, но и всех остальных.

Сейчас, спустя 16 лет, Рамблер существует как система с разнообразными инструментами – игры, погода, новости, товары, карты и т.д. На его долю приходится 0,4% поисковых запросов Рунета.

Наиболее существенные изменения сервис претерпел в 2012 году: поменялся дизайн, появился показ новостей по умолчанию. Но практически сразу после этого руководством было принято решение заключить договор с Яндексом и перейти на его поиск. То есть теперь запросы с Рамблер обрабатывает и выдает Яндекс, а сам сервис работает на основе других своих инструментов.

Как пользоваться поиском Рамблер

Поиск в Рамблер ничем не отличается от поиска в других аналогичных сервисах. Пользователем задается команда в поисковой строке и после нажатия «найти» отображаются результаты. Кроме текстовой информации, здесь можно найти также картинки.

Другие поисковые системы Рунета

Поисковая система Нигма

Нигма – самая интеллектуальная поисковая система, созданная программистами Виктором Лавренко и Владимиром Чернышовым в 2004 году. Он отличается от других аналогичных сервисов тем, что здесь используется не только собственный алгоритм поиска, но и данные других поисковиков. Также Нигма позволяет использовать фильтры для быстрого нахождения нужной информации.

Здесь можно отдельно искать фильмы, музыку, картинки, ссылки и даже инструменты, помогающие ученикам и студентам с домашними заданиями. Функция фильрации называется кластеризацией. Изначально Нигма задумывалась именно как умная поисковая система, экономящая время. Именно поэтому и были созданы фильтры.

Несмотря на все фишки Нигмы, она не так популярна, как Яндекс, Гугл, Майл и даже Рамблер. На ее долю приходится лишь 0,1% всех запросов в поисковых системах. Возможно, именно поэтому с сентября 2017 года сайт «нигма.рф» стал недоступен для использования, но никаких официальных объявлений о закрытии проекта пока не было.

Поисковая система Спутник

Спутник – российская официальная поисковая система, которая появилась на рынке в 2014 году. Создатель ее – компания «Ростелеком».

История «Спутника» началась еще в 2010 году, когда Правительство РФ объявило о необходимости создания национальной поисковой системы. Причиной этого стала невозможность контроля уже существующих поисковиков, так как они не государственные. В 2011 году Президент Дмитрий Медведев поддержал идею, а уже в 2013 проект имел название и готовился к запуску. 22 мая он был запущен в режиме бета-тестирования.

Кроме поиска информации, Спутник предлагает такие сервисы, как «Погода», «Медицина», «Телепрограмма», «Карты», «Финансы», «Афиша» и т.д. Но несмотря на это пользователи Интернета восприняли поисковик без особого энтузиазма и в 2017 году проект был признан неудачным.

Как пользоваться поиском Спутник

Еще один российский поисковик Спутник имеет простой и удобный интерфейс. Для поиска информации в нем достаточно ввести запрос в поисковую строку и нажать кнопку «найти». Единственное, чем данный сервис принципиально отличается от аналогичных – это качество результата. То есть Спутник не выдаст столько результатов поиска, сколько другие, более популярные.

Поисковая система Апорт

Я застал время, когда мы им активно пользовались. Мне он нравился. Апорт как поисковик был создан в 1996 году компанией «Агама» — одним из лидеров по разработке программного обеспечения. Изначально сервис осуществлял поиск только по одному сайту, но со временем их стало больше, а затем поиск стал возможен по всему Рунету.

До 2000 года Апорт занимал высокие позиции в Рунете наряду с Яндексом и Гуглом. Разработчики несколько раз меняли дизайн, внедряли и другие инструменты, кроме поиска, но все же он начал сдавать позиции.

В 2011 году Апорт заключил договор с Яндекс и перешел на его движок. С этого времени поисковая система перестала существовать как привычная пользователям. Сейчас это сервис поиска цен на различные товары и сравнения с таковыми в других магазинах.

Как пользоваться Апорт

Апорт – это поисковая система, но находит она только товары с ценами. Для этого нужно выбрать из каталога нужный товар, а сервис покажет цены на него в различных магазинах. Затем можно перейти в магазин с более выгодной ценой и купить нужную вещь.

В сервисе представлено множество разделов с самыми разнообразными товарами. Благодаря ему можно отлично сэкономить.

Поисковая система Bing

Bing – поисковик от Microsoft, ставший третьим подобным проектом компании и самым удачным. Руководство Microsoft давно мечтало создать свою поисковую систему и впервые мечта стала реальностью в 1998 году, когда на рынке появился проект MSN Search. Но задумка была совершенно не встречена с энтузиазмом пользователями Интернета. И неудивительно, поскольку поисковик не представлял из себя ничего стоящего.

В 2006 году появился Windows Live Search, через год ему на смену пришел Live Search, но оба также не имели успеха у пользователей.

Наконец, в 2009 году Microsoft анонсировал новый сервис – Bing. Несмотря на неудачи своих предшественников, поисковик за короткое время заработал себе поклонников. В течение года по числу пользователей он сравнялся с Yahoo, что само по себе явление удивительное, а еще через немного вошел в список лучших поисковых систем мира.

В Рунете Бинг популярен гораздо меньше, чем во всей Всемирной паутине. Главная причина этого состоит в том, что поисковик очень мало отображает русскоязычные сайты. К тому же, в Рунете практически уже невозможно подвинуть те поисковики, которые устоялись.
Кроме самых популярных, есть также большое количество поисковых систем, которые мало кому известны, но все же используются некоторыми пользователями. Так, в Китае более 60% поисковых запросов обрабатывает поисковик Baidu.

У Бинга неплохая панель для вебмастеров. Обязательно добавьте ваш сайт туда.

Как пользоваться Bing

Поиск в Bing такой же удобный, как и в большинстве других поисковиков. Чтобы здесь найти сайт с текстовой информацией, изображение, видео или новость, достаточно ввести соответствующий запрос в поисковую строку. Поисковая система находит информацию как на российских сайтах, так и на зарубежных.

Главное отличие Bing от других сервисов с аналогичным функционалом – интерфейс с красивым дизайном. В отличие от того же Google, здесь по умолчанию установлен красочный фон.

Сравнение популярных поисковиков Рунета: где что искать

Поисковики тем лучше, чем больше точной информации могут выдать в ответ на запрос пользователя. Сегодня самая популярная система в Интернете – Google, а в Рунете – Яндекс. Если судить именно по качеству выдачи, то оно у них примерно одинаковое, но все же про что-то легче найти в Goggle, про что-то – в Яндекс. То же самое касается и других поисковых систем. Каждая из них ориентирована на определенную категорию пользователей и запросы.

Задача всех поисковых систем – нахождение информации, но каждый из них делает это по-своему. У всех свой алгоритм поиска и свои особенности. Возьмем к примеру Яндекс. Здесь можно найти практически все, но он в большей степени ориентирован на русскоязычные сайты. То есть если вы ищете информацию на русском языке про русского писателя, другого источника точно не надо. А вот если требуется статья на английском, уже стоит обратиться к Goggle или Bing. То же самое можно сказать и про иностранные видео и новости. Их вдоволь в одноименных разделах этих поисковых систем.

Спутник также ориентирован на русскоязычных пользователей и здесь вы вряд ли найдете много информации на иностранных языках. Скорее всего, в результатах будет что-то похожее на разыскиваемую информацию, но на русском языке.

Майл и Рамблер похожи по результатам выдачи на Яндекс, но найти здесь то, чего нет в главном поисковике Рунета, получится в очень редких случаях. В то же время Майл можно использовать для поиска в сервисе «Ответы», где зачастую находится нужная информация.

Апорт – специфический поисковик и предназначен для поиска товаров. Поэтому если вы намерены заняться шоппингом и ищете выгодные предложения, данный сервис вам обязательно поможет. Сравнивая цены в популярных интернет-магазинах, можно найти самые оптимальные варианты.

А каким поисковиком пользуетесь вы?

А знаете , и когда был запущен первый сайт? Угадаете?. Всем пока.

Уже давно стали неотъемлемой частью российского Интернета. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса.

Большинство пользователей поисковых систем никогда не задумывались (либо задумывались, но не нашли ответа) о принципе работы поисковых систем, о схеме обрабатки запросов пользователей, о том, из чего эти системы состоят и как функционируют…

Данный мастер-класс призван дать ответ на вопрос о том, как работают поисковые системы. Однако, Вы не найдете здесь факторов, влияющих на ранжирование документов. И тем более не стоит рассчитывать на подробное объяснение алгоритма работы Яндекса. Его, по словам Ильи Сегаловича, - директора по технологиям и разработке поисковой машины «Яндекс», можно узнать, лишь «под пыткой» самого Ильи Сегаловича…

2. Понятие и функции поисковой системы

Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google» , «Yahoo» , «MSN» . В русском Интернете это – «Яндекс» , «Рамблер» , «Апорт» .

Рассмотрим подробнее понятие поискового запроса на примере поисковой системы «Яндекс». Поисковый запрос должен быть сформулирован пользователем в соответствии с тем, что он хочет найти, максимально кратко и просто. Допустим, мы хотим найти информацию в «Яндексе» о том, как выбрать автомобиль. Для этого, открываем главную страницу «Яндекса», и вводим текст поискового запроса «как выбрать автомобиль». Далее, наша задача сводится к тому, чтобы открыть предоставленные по нашему запросу ссылки на источники информации в Интернет. Однако, вполне можно и не найти нужную нам информацию. Если таковое произошло, то либо нужно перефразировать свой запрос, либо в базе поисковой системе действительно нет никакой актуальной информации по нашему запросу (такое может быть при задании очень «узких» запросов, как, например «как выбрать автомобиль в Архангельске»)

Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут. А научить пользователей делать «правильные» запросы к системе, т.е. запросы, соответствующие принципам работы поисковых систем, невозможно. Поэтому разработчики создают такие алгоритмы и принципы работы поисковых систем, которые бы позволяли находить пользователям искомую ими информацию.

Это означает, поисковая система должна «думать» так же, как думает пользователь при поиске информации. Когда пользователь обращается с запросом к поисковой машине, он хочет найти то, что ему нужно, максимально быстро и просто. Получая результат, он оценивает работу системы, руководствуясь несколькими основными параметрами. Нашел ли он то, что искал? Если не нашел, то сколько раз ему пришлось перефразировать запрос, чтобы найти искомое? Насколько актуальную информацию он смог найти? Насколько быстро обрабатывала запрос поисковая машина? Насколько удобно были представлены результаты поиска? Был ли искомый результат первым или же сотым? Как много ненужного мусора было найдено наравне с полезной информацией? Найдется ли нужная информация, при обращении к поисковой системе, скажем, через неделю, или через месяц?

Для того, чтобы удовлетворить ответами все эти вопросы, разработчики поисковых машин постоянно совершенствуют алгоритмы и принципы поиска, добавляют новые функции и возможности, всячески пытаются ускорить работу системы.

3. Основные характеристики поисковой системы

Опишем основные характеристики поисковых систем:

  • Полнота

    Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

  • Точность

    Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

  • Актуальность

    Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

  • Скорость поиска

    Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

  • Наглядность

4. Краткая история развития поисковых систем

В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.

Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.

Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!

В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.

В настоящее время существуют три основные поисковые системы (международные) – Google, Yahoo и , имеющие собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.

5. Состав и принципы работы поисковой системы

В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

  • URL страницы
  • дата, когда страница была скачана
  • http-заголовок ответа сервера
  • тело страницы (html-код)

Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных

База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

  • Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде , то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).
  • Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.
  • В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).
  • Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.
  • Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

6. Заключение

Теперь подытожим все вышесказанное.

  • Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.
  • Основные характеристики поисковых систем:
    1. Полнота
    2. Точность
    3. Актуальность
    4. Скорость поиска
    5. Наглядность
  • Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.
  • В состав поисковой системы входят компоненты:
    1. Модуль индексирования
    2. База данных
    3. Поисковый сервер

Надеемся, наш мастер-класс позволит Вам поближе ознакомиться с понятием ПС, лучше узнать основные функции, характеристики и принцип работы поисковых систем.

Программы для поиска информации в интернете.

Новое в категории "Поиск информации":

Бесплатная
Справочник предприятий Москвы АзимутЪ 1.0.4 является приложением, оптимизированным для любого пользователя. Приложение включает в себя структурированную базу данных организаций для Москвы, а также телефонную и адресную базу данных предприятий.

Бесплатная
vkontakte.ru Audio 1.0 является удобным приложением по поиску и закачке mp3 файлов с сервиса vkontakte.ru Приложение vkontakte.ru Audio полностью бесплатно и предлагает лишь добровольные пожертвования 1 - 2 WMZ автору на webmoney кошелек: Z195735503467

Бесплатная
VKontakte.DJ 3.40 является удобным приложением, которое даст возможность скачивать музыку и видео с сети ВКонтакте. Приложение Vkontakte.DJ даёт возможность осуществлять закачку отдельных файлов или целых альбомов.

Бесплатная
Torrent Searcher 9.0 RC1 является приложением-поисковиком, который выполняет поиск и загрузку с Torrent-сетей. Приложение Torrent Searcher поможет быстро найти музыку, графические файлы, фильмы, программы или любые иные файлы в сетях Fasttrack, Ares, OpenFT или Gnutella.

Бесплатная
ListTV 3.8.9.5 является приложение обеспечивающим качественный просмотр списка телепередач с выбором для дней недели или определённого канала. Приложение ListTV поможет просмотреть какие трансляции, и на каких каналах ведутся и что будет транслировать тот или иной канал в указанное время.

Бесплатная
Jobee 1.0.0.788 является удобным и качественным плеером, который обеспечит вам комфортное прослушивание большого числа интернет радиостанций или аудио-подкастов. Также приложение поможет просмотреть интернет-телевидение, прочитать RSS-ленты, а также найти и прочитать массу книг.

Бесплатная
Ссылки интернета 53.0 является приложением с базой силок на интернет страницы с наиболее интересной информацией. Приложение «Ссылки интернета» содержит больше 10600 ссылок.

Бесплатная
FREE Music Downloader Studio 2 build 2.2.4 является удобным приложением по скачиванию, поиску или прослушиванию MP3 файлов содержащихся на таких порталах, как Best-Mp3.Ru, TutMp3.Net, Zaycev.Net, MuzCafe.Net, Myzuka.Ru и MuzGruz.Ru.

Бесплатная
Etxt Антиплагиат 2.0.37 является приложением для оценки уникальности текста и поиска плагиата в сети. Приложение Etxt Антиплагиат поможет эффективно и быстро проверить любой текст на уникальность по отношению к другим сайтам.

Бесплатная
Auto TGP Explorer 3.14a является бесплатным приложением по удобному просмотру галерей фотографий с сайтов эротического содержания. Приложение Auto TGP Explorer проводит анализ содержимого указанного сайта и отсортировывает ссылки на галереи его фотографий.

Бесплатная
Vkontakte Audio Downloader 2.0 поможет пользователям, которые являются фанатами сайта ВКонтакте.ру или которым нравится музыка, которая там имеется.

Бесплатная
Robot-Damaku 0.0.2 поможет вам собрать электронные e-mail и web адреса из сети интернет. Программа Robot-Damaku может обойти большую часть капканов, ложных генераторов адресов, уловок и прочих защит, которые нацелены на предотвращение извлечения информации с web страниц. Большая часть адресов на страницах интернета находятся в защищённом или же закодированном состоянии от обработки их e-mail поисковиками, при помощи функции "анти-анти-спам" в роботе можно обучить получить, раскодировать или же снять большинство защит с адресов и тот час, добавлять их в вашу базу данных.

Бесплатная
IPNetlnfo предназначена для просмотра информации о IP-адресе, e-mail или телефоне. Берёт информации из баз данных WHOIS в интернете.

Платная
SiteSputnik – небольшое приложение, которое предназначено для поиска, анализа, сбора и мониторинга размещенной в Интернете информации. Утилита позволяет получать максимально полную информацию по заданным запросам, затратив на поиск намного меньше времени.

Бесплатная
LENIN INC Search Machine – небольшая программа, предназначенная для поиска практически любой информации в Интернете. Данное приложение работает на основе стандартных поисковых роботов крупнейших поисковых систем.

Платная
NetworkSleuth – система поиска различных файлов через Интернет. Программа позволяет производить поиск по имени файла, а также по конкретным типам формата, к примеру, искать MP3 файлы.



Статьи по теме