|
|
||||||||||||||||||
| Оптимизация сайта под MSN. | ||
| Оптимизация сайта под MSN.
Сейчас многие ищут новые пути получения трафика, чаще всего оптимизаторым забывают про трафик который могут дать альтернативные поисковики, например MSN, а зря. На данный момент MSN проиндексировал большую часть страниц моего сайта, несмотря на то что я даже не добавлял свой сайт. Но к сожалению посетителей с него так и не приходило. В недавней заметке где я привел данные о популяроности поисковых систем в различных европейских странах. Таким образом если вы ведете блог или англоязычный сайт то вам необходимо прочесть частичный перевод статьи Optimizing for MSNТs RankNet Technology Последним крупным изменением в MSN Search, является добавление такой вещи как RankNet. Это нововведение приняло силу с Июля прошлого года. Этот алгоритм свежий и недавно начались его обсуждение у огромного колличества оптимизаторов. В этой статье Jennifer Sullivan продолжает свой обзор поисковых систем и их алгоримов, сегодня мы сфокусируем внимание на технологии MSN RankNet. MSN RankNet: Что это такое? RankNet, в сущности, является обучающийся машиной, которая берёт образец попыток поиска человека из его аккаунта, и смотрит в каком порядке предоставить наиболее релевантные результаты при следующем поиске. Он основывается на прогнозе, который будет получен при обработке данных через нейронную сеть. Один из представителей MSN сказал: "Мы берем пучек данных, прогоняем через сеть и определяем ценность данных поотдельности". Они делают свои прогнозы при помощи 'контролируемого обучения', таким образом машина учится создавать функцию обучающих материалов. Обучающие материалы состоят из пары объектов на входе(чаще всего векторов) и принятых выходных данных. Данные на выходе из функции могут иметь длительный вес(называемый возвратом), или может прогнозировать метку объекта на выходе(называемой классификацией). Задача контролируемого обучения в заключается в том, чтобы предсказать значение функции для нескольких правильных вводимых объектов после просмотра небольшого колличества учебных примеров(пар ввода и целевых выводов). Чтобы это выполнить, обучающийся должен обобщить из представленой информации невстречавшиеся ранее ситуации. MSN использует 569 разных обобщенных свойств чтобы предугадать релевантность документа, как часть входных объектов своей сети, в течении ‘контролируемого обучения’ или просто обучения. Это не то же самое в случае с 569-ми различными факторами, которые взвешиваются, когда обрабатывается релевантность отдельной страницы под отдельный запрос, в данном случае точные характеристики документа будут смодерированы на релевантность. Поговорим об оптимизации под MSN: Мы видим что для заводевания более высокого MSN Rank, сайт должен вписываться в несколько основным концепций. MSN больше всего полагается на текст в ссылках, так что контент продолжает оставаться королём. Из этого следует, что алгоритм MSN полагается как и раньше на высокую плотность ключевых слов, даже более чем Yahoo. Присутствие файла robots.txt в последнее время стал более важен для MSN роботов, и MSN стал относиться более безразлично к сайтам которые не содержат файла robots.txt. Трудно сказать что этому послужило, обычный фильтр или нейронная сеть. Ключевые слова в meta тегах теперь не содержат никакой важности, и MSN теперь больше не индексирует данные из этих тегов, потому что они не видимы пользователю в стандартном браузере, тем более дорвеи почит всегда используют этот тег для спама. Но не смотря на это, всегда нужно включать title и description теги. Ключевые слова в ссылках очень важны, они встречаются в 85% сайтов из top10 выдачи. Остальные теги, на которые смотрит MSNBot это header, alt в изображениеях, или в название свойства ссылки. MSN не имеет различия больше между тегами b и strong. MSN обслуживает 15% из всех поисковых запросов сделаных в интернете. Все поисковые машины пока что не индексируют flash, но в данном случае индексация страниц основана на обратной связи со стороны пользователей. MSN так же не знаком с редиректом 302. Когда страница перенаправляется, MSN индексирует страницу на которой пользователь окажется в конечном счете, но не ту с которой произошел редирект. MSN более хорошо относится к статичным страницам, нежели к динмаическим, хотя он не плохо ранирует динамичные страницы. Сложно навредить сайту в MSN Search таким способом как 'чистка' (попытка создать страницы с одинаковым контентом что и у исходного сайта и вытеснение исходного сайта с первых страниц выдачи), или попытка установок ссылок с дорвеев. Ещё не совсем ясно даётся ли какой-либо приоритет старым страница в системе MSN RantNet. Фильтры Многие люди очень хотели бы узначть что у MSN нет фильтра на дублирование уникального контент. Но это не совсем так. В действительности, фильтр по дублируемому контенту который имеет лично от меня один голос. Некоторое время назад я провел небольшой эксперимент. Я написал статью с полностью уникальным контентом и добавлением этого сайта в директории со статьями. Через несколько недель Yahoo отсеил сайты на которых был продублирован мой контент. Google через, несколько недель, так же отсеил сайты на которых была продублирована моя статья, но как ни странно среди этих сайтов были и мой. Но с MSN ситуация получилась совершенно иной. MSN не только фильтруем сайты, которые имеют чужой контент, но и даёт дополнительные очки тем сайтам у кого он уникален. Это говорит, что только MSN имеет рабочий фильтр который может правильно определять, какой контент оригинальный и ворованый. Идет молва что MSN Search даёт фору тем сайтам которые расположены на базе Microsoft Servers с IIS. Одна из возможны проблем с MSN Search является проблемы с комментариями в блогах и сообщениях на форумах, но сотрудники MSN говорят, что они информаированы об этой проблеме и занесли в список проблем которые нужно исправить. Новость добавлена 14:54:49, 2006-03-19 | ||
Комментарии| Thnx 2006-03-19, 16:39:06 | |
(unreg) | Хорошая выжимка, спасибо.
Alexei A. Korolev http://www.stableversion.com |
| 2006-03-19, 16:59:40 | |
root icq: 940208 | MSN очень хорошая поисковая машина, наравне с гуглом, жаль что в россии не получила соответсвубщего доверия со стороны пользователей. Меня интересует - как часто обновляется RankNet? |
Veilhost crew | |