Оцениваем индексы поисковиков при помощи редких слов 24 Август 2009
Можно ли получить представление о размере индекса поисковой машины, основываясь на данных о том, как много раз в нем встречаются редкие слова?
Несколько недель назад была предпринята попытка оценить количество упоминаний наиболее распространенных слов английского языка в индексах Google, Yahoo, Bing, Ask и Google Caffeine. Для исследования были взяты 50 наиболее часто употребляемых слов.
Впрочем, сравнение количества упоминаний этих слов в разных поисковых машинах вряд ли может дать представление об относительных размерах индексов этих поисковых машин. И тому есть несколько причин.
Во-первых, полученные цифры приблизительны. Также возможно, что разные поисковые машины используют различные методы подсчета. Некоторые из результатов выдачи могут оказаться дубликатами или опечатками, акронимами или аббревиатурами.
Некоторые страницы попадают в выдачу по поисковому термину даже не содержа этого термина в тексте. Например, ссылка на страницу загрузки Adobe Reader годами выводилась в топе Google по запросу «click here», хотя этих слов на странице нет. Они часто встречаются в якорях ссылок на эту страницу.
Возможно, более реалистичную оценку относительных размеров индексов поисковых машин можно будет получить на основе крайне редких запросов. Недавно основатель Cuil Том Костелло описал подобную методику в своем блоге. Основываясь на полученных им результатах, можно утверждать, что индекс Bing сейчас примерно равен 20% индекса Google.
У нас нет доступа к технологиям к которым может иметь доступ руководитель Cuil, так что мы использовали лишь небольшую выборку редко употребляемых слов. Найдены они были благодаря «Compendium of Lost Words», где перечислены наименее употребляемые слова английского языка. Так как многие из них встречаются в индексах поисковых машин менее 1000 раз, то можно просмотреть все страницы, на которых эти слова действительно присутствуют. Если бы была возможность сделать выборку побольше, то можно было бы довольно уверенно утверждать о пропорциях индексов ведущих поисковиков. Тем не менее, даже эта таблица позволит увидеть основные тенденции:
|
Запрос |
Google Caffeine |
|
Yahoo |
Bing |
|
archiloquy |
67 |
69 |
25 |
14 |
|
exipotic |
54 |
56 |
22 |
10 |
|
historiaster |
82 |
82 |
27 |
28 |
|
irredivivous |
42 |
43 |
14 |
7 |
|
keleusmatically |
59 |
60 |
20 |
13 |
|
melanochalcographer |
13 |
15 |
6 |
6 |
|
phylactology |
58 |
58 |
25 |
17 |
|
stibogram |
14 |
15 |
8 |
6 |
|
tussicate |
36 |
37 |
15 |
13 |
|
vicambulate |
144 |
128 |
41 |
21 |
Переводной материал, источник
Рекомендую к прочтению:
Каталог партнерских программ Бегуна
7 основных ошибок в РРС
Максимизируем отдачу ключевых слов в AdWords
Сегментируем трафик в Google Analytics
Google Analytics и Бегун
SEO аудит за 60 минут
Консолидация ссылок и передача PageRank
Стоит ли использовать геотаггинг для локального продвижения?
- Рубрики : SEO, Переводы, Поисковые системы, Секреты мастерства
- Автор : admin

Комментарии»
А не могли бы Вы перевести список этих “наиболее распространенных слов английского языка”. К сожалению, даже мощный словарь Abbyy Lingvo таких слов не знает.