Блог о контекстной рекламе. Бегун, Директ и AdSense - как заработать вебмастеру.

Оцениваем индексы поисковиков при помощи редких слов 24 Август 2009

Можно ли получить представление о размере индекса поисковой машины, основываясь на данных о том, как много раз в нем встречаются редкие слова?

Несколько недель назад была предпринята попытка оценить количество упоминаний наиболее распространенных слов английского языка в индексах Google, Yahoo, Bing, Ask и Google Caffeine. Для исследования были взяты 50 наиболее часто употребляемых слов.

Впрочем, сравнение количества упоминаний этих слов в разных поисковых машинах вряд ли может дать представление об относительных размерах индексов этих поисковых машин. И тому есть несколько причин.

Во-первых, полученные цифры приблизительны. Также возможно, что разные поисковые машины используют различные методы подсчета. Некоторые из результатов выдачи могут оказаться дубликатами или опечатками, акронимами или аббревиатурами.

Некоторые страницы попадают в выдачу по поисковому термину даже не содержа этого термина в тексте. Например, ссылка на страницу загрузки Adobe Reader годами выводилась в топе Google по запросу «click here», хотя этих слов на странице нет. Они часто встречаются в якорях ссылок на эту страницу.

Возможно, более реалистичную оценку относительных размеров индексов поисковых машин можно будет получить на основе крайне редких запросов. Недавно основатель Cuil Том Костелло описал подобную методику в своем блоге. Основываясь на полученных им результатах, можно утверждать, что индекс Bing сейчас примерно равен 20% индекса Google.

У нас нет доступа к технологиям к которым может иметь доступ руководитель Cuil, так что мы использовали лишь небольшую выборку редко употребляемых слов. Найдены они были благодаря «Compendium of Lost Words», где перечислены наименее употребляемые слова английского языка. Так как многие из них встречаются в индексах поисковых машин менее 1000 раз, то можно просмотреть все страницы, на которых эти слова действительно присутствуют. Если бы была возможность сделать выборку побольше, то можно было бы довольно уверенно утверждать о пропорциях индексов ведущих поисковиков. Тем не менее, даже эта таблица позволит увидеть основные тенденции:

Запрос

Google Caffeine

Google

Yahoo

Bing

archiloquy

67

69

25

14

exipotic

54

56

22

10

historiaster

82

82

27

28

irredivivous

42

43

14

7

keleusmatically

59

60

20

13

melanochalcographer

13

15

6

6

phylactology

58

58

25

17

stibogram

14

15

8

6

tussicate

36

37

15

13

vicambulate

144

128

41

21

Переводной материал, источник

Рекомендую к прочтению:

Каталог партнерских программ Бегуна
7 основных ошибок в РРС
Максимизируем отдачу ключевых слов в AdWords
Сегментируем трафик в Google Analytics
Google Analytics и Бегун
SEO аудит за 60 минут
Консолидация ссылок и передача PageRank
Стоит ли использовать геотаггинг для локального продвижения?

Комментарии»

1. Marigirl - 27 Август 2009

А не могли бы Вы перевести список этих “наиболее распространенных слов английского языка”. К сожалению, даже мощный словарь Abbyy Lingvo таких слов не знает.