Для работы потребуется pycurl и grab. Поддерживаемые выдачи: Яндекс, Гугл, Гугл за 24 часа, Гугл за неделю, Гугл за месяц. Яндекс можно чекать без прокси, примерная скорость без прокси при 100 потоках 10 ссылок в секунду.
06.12Сканер портов
Давно ничего не писал, совсем разленился, да и писать не о чём. Зашёл тут недавно глупый спор о скорости работы сокетов на perl и python, пришлось написать простой многопоточный скриптик. Пригодится может кому, для изучения python. В результате мой метод оказался хитрее и быстрей # coding:utf-8 # author: Rushter # site: http://rushter.com import socket,Queue,threading from [...]
Простейший парсер google через api. Кому надо, тот сам доведёт до ума, с меня только идея . Позволяет парсить примерно 60к ссылок без бана и капчи с 1 Ip, для большей работоспособности без бана можно попробовать добавить задержку. Все файлы должны быть в utf-8. # coding:utf-8 # author: Rushter # site: http://rushter.com import urllib2,random,re,time,json,urllib ff [...]
Простейший чекер, ftp акки кидать в ftp.txt вида ftp.narod.ru:21|user|password.Порт указывать обязательно.В начале скрипта можно установить количество потоков,разделитель и таймаут.Если при подключении к ftp возникает ошибка, то аккаунт попадает в bad.txt, иначе в good.Ошибками может служить:таймаут подключения,неправильный логин и т.д. # coding:utf-8 # author: Rushter # site: http://rushter.com from ftplib import FTP import Queue import threading [...]
Небольшой апдейт паблик версии доргена.В этой версии исправлено множество недочётов и добавлен макрос IMG. Параметры макрос IMG: useimg - Использовать картинки. maximg – Максимально количество копируемых картинок. imgdir – Подпапка папки img,с картинками. dorimgdir – Папка с картинками на самом доре. Т.к в дорах используется много страниц, копировать столько же картинок не очень удобно из [...]
07.21Yandex прямой эфир
Понадобился парсер прямого эфира яндекса. Написал на python, его я начал изучать недавно,поэтому код далеко не идеальный. Результат сохраняется в файл efir.txt , может кому-то пригодится… # coding: utf-8 # author: Rushter # site: http://rushter.com import httplib,re,time count = 200 # сколько парсить print "[*]Parsing has started" print "[*]Parsing "+str(count)+" acc" for i in range(count/20): [...]
