2008-11-12 12 views

Odpowiedz

8

Na coś takiego jak Twitter, można zaoszczędzić mnóstwo czasu, nie wymyślać koła. Wypróbuj bibliotekę taką jak python-twitter. W ten sposób możesz napisać swój skrypt, a nawet pełną aplikację, która łączy się z Twitterem i nie musisz przejmować się szczegółami implementacji.

Jeśli chcesz toczyć własne biblioteki interfejsu, będziesz musiał zapoznać się z urllib i w zależności od formatu zapewniają rezultaty, albo lxml (lub innej parsera XML) lub simplejson.

+1

+1 Simplejson jest istotnym elementem tutaj. –

+2

urllib, lxml i simplejson brzmią jak narzędzia, których potrzebuję. Dzięki! –

+0

@Rich: jeśli uznałeś to za pomocne, to wiesz, co musisz zrobić ... –

2

Python ma bardzo ładne moduł httplib jak również moduł url które razem będą prawdopodobnie osiągnąć większość tego, co trzeba (przynajmniej jeśli chodzi o funkcjonalność wget).

4

Z całego serca polecam mechanize dla Pythona. Jest to programowalna przeglądarka internetowa, z której możesz korzystać z Pythona, który również obsługuje formularze i pliki cookie! Sprawia, że ​​każda strona jest pełzająca.

Zobacz przykłady na tym łączu, aby zobaczyć, co może zrobić.

+0

Mechanize jest idealny w sytuacjach, w których NIE masz API, ale OP określa witrynę taką jak Twitter, która ma interfejs API, więc urllib2 jest zwykle drogą do zrobienia. – bouvard

+0

ah, nie zrozumiałem dokładnie, co masz na myśli, mówiąc "ma API" - ale masz na myśli to, że ma szeroki wachlarz możliwości komunikowania się z nim za pośrednictwem adresów URL. w takim przypadku tak, urllib2 powinno wystarczyć. – Claudiu

+0

"Sprawia, że ​​wszelkiego rodzaju indeksowanie strony jest proste." - z wyjątkiem sytuacji, w której witryna ustawia wartości plików cookie za pomocą JavaScript i polegając na nich, co znajduje się w stanie mojego zmartwienia. –

0

Jeśli jesteś przyzwyczajony do czynienia z cURL, rozważ PycURL.