Ktoś wie o dobrym parserze kanałów dla Pythona 3.1? Używałem feedparsera dla wersji 2.5, ale nie wydaje się, aby było ono przeniesione do wersji 3.1, i jest to najwyraźniej bardziej skomplikowane niż uruchamianie 2to3.py na tym. Każda pomoc?Parser RSS Python 3.1?
Odpowiedz
Możesz rzucić okiem na blogu Atom Models autorstwa Iana Bickinga. Proponuje, aby nie używać żadnej specjalnej biblioteki "analizowania pliku danych", ponieważ Atom i RSS to tylko tylko XML, więc Twój model jest w rzeczywistości drzewem XML, a nie klasą. Możesz spróbować his code w Pythonie 3.
Rozpocznij przenoszenie feedparser
do Python 3.1.
hehe, próbowałem. Nie udało się. Jestem raczej pytonem "hack" niż programistą. – matthew
Pracowałem nad portowaniem źródła danych do Pythona 3, a na stronie GitHub opublikowałem a feedparser/Python 3 development branch z wynikami tej pracy.
Istnieje również otwarty raport o błędzie na temat portowania programu Feedparser do Pythona 3, ale ponieważ jestem nowym użytkownikiem w StackOverflow, jestem obecnie ograniczony do jednego linku. Link do raportu o błędzie znajdziesz u góry strony GitHub (prowadzi do strony code.google.com).
feedparser
jest teraz dostępne dla Pythona 2.4 do 3.3- https://code.google.com/p/feedparser/
te dni, w każdej chwili ktoś mówi „tylko XML”, zwykle podejrzewają oni żartował. Takie podejście będzie działało dobrze, jeśli pobierzesz dane z jednego kanału w bardzo spójny sposób. Ale jeśli w ogóle istnieje jakiś element ludzki, to nie zadziała. Kanały są notorycznie złe, jeśli chodzi o nieprzestrzeganie standardów, a nawet o to, że są poprawnym XML-em. Czasami ktoś podaje ci identyfikator URI strony HTML zamiast pliku danych. Poradzenie sobie z tym wszystkim bzdurami jest czymś, za czym chcesz dbać biblioteka "feedparser". –
Tak, jestem świadomy funkcji 'feedparser'. To była tylko inna opinia na ten temat. –
Dam ci szansę, dzięki! – matthew