Заполняем формы используя BeautifulSoup

Думаю не надо объяснять зачем заполнять всевозможные формы на сайтах. В данной статье я покажу простую реализацию автозаполнения форм с использованием модуля BeatifulSoup. Она лишь покажет примерный план действий и принцип работы многих универсальных постилок на более «Высокоуровневом» коде». Для того, чтобы скрипт знал какие формы заполнять, нам потребуется база с признаками для заполнения. Я [...]

Парсер wikipedia.org

Многопоточный парсер естественных предложений wikipedia.org. Поддерживает как Английские запросы, так и Русские. По кейвордам указанным в программе происходит поиск статей с таким словом и дальнейших их парсинг. Язык кейворда определяется автоматически. Всем кто работает под яндекс такой контент будет очень кстати. Пример контента: http://dl.dropbox.com/u/1579946/priroda.rar Купить:http://www.plati.ru/asp/pay.asp?idd=992619 После покупки вы получайте уникальную ссылку, по которой можно будет [...]

Уникализация шаблонов

Уникализация происходит за счет генерации уникальных стилей для дивов шаблона. Полезность такого метода сомнительна, но всё же. Основываясь на этом примере, можно придумать другие методы уникализации. #coding:utf-8 #Author: Rushter #Site: http://rushter.com from BeautifulSoup import BeautifulSoup import random # Функция генерации стиля def getstyle(): # Всевозможные параметры css params = ["font-size: %spx;"%(random.randint(10,11)), "color:#%s;"%(random.randint(0, 16777215)), "clear:%s;"%(random.choice(["none","left","right","both","inherit"])), "float:%s;"%(random.choice(["none","left","right","both","inherit"])), [...]

Многопоточный чекер проиндексированных страниц Яндекс,Google

Для работы потребуется pycurl и grab. Поддерживаемые выдачи: Яндекс, Гугл, Гугл за 24 часа, Гугл за неделю, Гугл за месяц. Яндекс можно чекать без прокси, примерная скорость без прокси при 100 потоках 10 ссылок в секунду.

Скрещиваем A-poster и R-dorgen

Многие те, кто используют a-poster, наверняка знают о возможности использования своих функций. В данном примере я рассмотрю использование функции, которую предоставляет сам автор и передачу ей данных с помощью плагина для R-dorgen. Так как функция берет файлы со ссылками прямо из своей папки, то приходится заливать эти файлы туда. Конечно, эту функцию для удобства можно [...]

Сканер портов

Давно ничего не писал, совсем разленился, да и писать не о чём. Зашёл тут недавно глупый спор о скорости работы сокетов на perl и python, пришлось написать простой многопоточный скриптик. Пригодится может кому, для изучения python. В результате мой метод оказался хитрее и быстрей # coding:utf-8 # author: Rushter # site: http://rushter.com import socket,Queue,threading from [...]

Парсер google через ajax search api

Простейший парсер google через api. Кому надо, тот сам доведёт до ума, с меня только идея . Позволяет парсить примерно 60к ссылок без бана и капчи с 1 Ip, для большей работоспособности без бана можно попробовать добавить задержку. Все файлы должны быть в utf-8. # coding:utf-8 # author: Rushter # site: http://rushter.com import urllib2,random,re,time,json,urllib ff [...]

Простейший многопоточный чекер ftp

Простейший чекер, ftp акки кидать в ftp.txt вида ftp.narod.ru:21|user|password.Порт указывать обязательно.В начале скрипта можно установить количество потоков,разделитель и таймаут.Если при подключении к ftp возникает ошибка, то аккаунт попадает в bad.txt, иначе в good.Ошибками может служить:таймаут подключения,неправильный логин и т.д. # coding:utf-8 # author: Rushter # site: http://rushter.com from ftplib import FTP import Queue import threading [...]