banner

Полностью отказался от apache


Полностью отказался от apache, теперь на всех проектах стоит nginx+php-fpm и nginx+tornado.
Связка nginx+tornado просто летает, быстрее и не придумать :) .
Осталось отказаться от php в пользу python и было бы вообще сказочно.
Памяти стало потреблять на 40% меньше, насчет нагрузки пока сказать сложно, но её явно будет меньше.

P.S. В очердном выпуске журнала хакер (154)  вышла моя новая статья, называется «СПЛОГИ НА WORDPRESS ОТ А ДО Я».

Активность вебмастеров по часам

Занимательный график, показывающий пиковую активность вебмастеров в течении дня. Для анализа я позаимствовал статистику по 10000 запусков r-dorgen. Часовые пояса к сожалению не учитываются, используется один – msk.
Из статистики видно, что большинство предпочитает начинать работать только после обеда :) .
Читать далее…

R-dorgen Free edition

С момента издания одних из первых платных версий R-dorgen прошло уже два года, теперь у вас есть возможноcnm частично попробовать самую  первую платную версию :) .  Здесь отключен парсинг и морфология, остальное осталось прежним. В readme.txt вы сможете найти описание макросов и пояснения по некоторому функционалу. Все вопросы по работе можно задавать здесь, в icq и e-mail отвечаю на вопросы только по платным версиям R-dorgen. Разумеется в этой версии множество недочётов и ошибок, ведь она самая первая и ожидать стопроцентной работы всего заложенного функционала не стоит.

Читать далее…

Парсим яндекс без капчи

В предыдущей статье я написал как парсить wordstat без капчи, в этой статье заметки я расскажу как можно парсить саму выдачу яндекса.
Тут всё очень просто, парсим не сам яндекс, а его партнёров.

www.tut.by
search.livetool.ru
webalta.ru
rambler.ru

Парсим wordstat без капчи

Не все знают, как можно парсить wordstat без бана, сегодня я расскажу как это можно сделать.  Вся фишка в сервисе kiks.yandex.ru, который используется для идентификации реального пользователя, через него мы и будем парсить сколько нам влезет. Из кода вырезаны пару интересных особенностей, поэтому он может не правильно работать, проверяйте сами, если что поправлю. Многопоточно реализовывать можете не пробовать, там нужна ещё одна хитрость, иначе получите бан по ip :) .
Читать далее…

Клоакинг как средство выживания в поисковых системах

Собственно моя статья из сентябрьского выпуска журнала Хакер. Мой первый опыт написания статей для крупных изданий, статья прошла редакторские правки, поэтому стиль написания не совсем такой, какой хотелось бы мне оставить :) .
Читать далее…