Przepraszam, jeśli to proste pytanie, wciąż jestem do tego nowicjuszem, ale spędziłem trochę czasu szukając odpowiedzi i niczego nie znalazłem. Mam listę, która wygląda mniej więcej tak przerażający bałagan:W Pythonie, w jaki sposób usunąć z listy element zawierający pewne rodzaje znaków?
['Organization name} ', '> (777) 777-7777} ', ' class="lsn-mB6 adr">1 Address, MA 02114 } ', ' class="lsn-serpListRadius lsn-fr">.2 Miles} MORE INFO YOUR LISTING MAP if (typeof(serps) !== \'undefined\') serps.arrArticleIds.push(\'4603114\'); ', 'Other organization} ', '> (555) 555-5555} ', ' class="lsn-mB6 adr">301 Address, MA 02121 } ', ' class="lsn-serpListRadius lsn-fr">.2 Miles} MORE INFO CLAIM YOUR LISTING MAP if (typeof(serps) !== \'undefined\') serps.arrArticleIds.push(\'4715945\'); ', 'Organization} ']
I muszę go przetworzyć tak, że HTML.py może przekształcić informacje w nim na stole. Z jakiegoś powodu, HTML.py po prostu nie może obsłużyć elementów potworów (np. "Class =" lsn-serpListRadius lsn-fr ">. 2 mile} WIĘCEJ INFORMACJI O SWOJEJ MAPIE LISTY, jeśli (typeof (serps)! == \ ' undefined \ ') serps.arrArticleIds.push (\' 4603114 \ ');', itp.). Na szczęście dla mnie nie dbam o informacje w elementach potworów i chcę się ich pozbyć.
Próbowałem pisać regex, które pasują do wszystkich bardziej niż dwuliterowy wszystkie kapitalizacji słowy, aby zidentyfikować elementy potwór, i dostaje to:
re.compile('[^a-z]*[A-Z][^a-z]*\w{3,}')
Ale ja nie wiem jak zastosuj to do usunięcia elementów zawierających dopasowania do tego wyrażenia regularnego z listy. Jak mam to zrobić/czy jest to właściwy sposób postępowania?
Czy są jakieś różnice w prędkości między tymi dwoma liniami? – NumenorForLife