Próbuję analizować stronę internetową i uzyskać pewne informacje z BeautifulSoup.findAll ale nie znaleźć je wszystkie .. Używam python3Piękne Soup findAll ich nie znaleźć wszystko
kod jest to
#!/usr/bin/python3
from bs4 import BeautifulSoup
from urllib.request import urlopen
page = urlopen ("http://mangafox.me/directory/")
# print (page.read())
soup = BeautifulSoup (page.read())
manga_img = soup.findAll ('a', {'class' : 'manga_img'}, limit=None)
for manga in manga_img:
print (manga['href'])
to tylko drukuje połowę z nich ...
dziękuję! to się udało! :) – Clepto
Wow. To mnie uratowało przed uderzeniem głową o stół. Skąd wiesz, że parser LXML miał problemy (inne niż oczywiste, że zwrócił tylko 18 wierszy). tj. jak powinienem wiedzieć, że to był problem inny niż to, że w milczeniu ma on niewłaściwą liczbę wierszy? – FuriousGeorge
Doświadczenie; głównie poprzez pomaganie ludziom tutaj na SO. –