Mam problemy z wyświetlania treści, mój program:Zmień & # 39 do normalnego charakteru
#! /usr/bin/python
import urllib
import re
url = "http://yahoo.com"
pattern = '''<span class="medium item-label".*?>(.*)</span>'''
website = urllib.urlopen(url)
pageContent = website.read()
result = re.findall(pattern, pageContent)
for record in result:
print record
wyjściowa:
Masked teen killed by dad
First look in 'Hotel of Doom'
Ex-NFL QB's sad condition
Reporter ignores warning
Romney's low bar for debates
Więc pytanie, co należy uwzględnić w kodzie w aby przekształcić & nr 39 w postaci
może powielony z http://stackoverflow.com/questions/57708/convert-xml-html-entities-into-unicode- string-in-python – charlee