Mamy system cms, który zapisuje bloki zawartości html w bazie danych serwera SQL. Znam nazwę tabeli i nazwę pola, w którym znajdują się bloki zawartości html. Niektóre html zawiera linki() do plików pdf. Oto fragment:Jak wyodrębnić nazwy plików z pola zawierającego treść HTML na serwerze sql?
<p>A deferred tuition payment plan,
or view the <a href="/uploadedFiles/Tuition-Reimbursement-Deferred.pdf"
target="_blank">list</a>.</p>
Potrzebuję wyodrębnić nazwy plików pdf ze wszystkich takich bloków treści html. Na koniec muszę uzyskać listę:
Tuition-Reimbursement-Deferred.pdf
Some-other-file.pdf
wszystkich nazw plików PDF z tej dziedziny.
Każda pomoc jest doceniana. Dzięki.
UPDATE
Otrzymałem wiele odpowiedzi, bardzo dziękuję, ale zapomniałem wspomnieć, że nadal jesteśmy przy użyciu programu SQL Server 2000 tutaj. Musiało to zostać wykonane przy użyciu SQL SQL SQL.
Czy wszyscy mają folder, który poprzedza nazwy pliku? –
Czy musisz to zrobić w TSQL? Jest to bardzo słaby język do analizowania tekstu, a byłoby znacznie łatwiej w innym języku, który ma bibliotekę analizy parsowania HTML. – Pondlife
Zgadzam się, to tylko szybkie opcje. W razie potrzeby użyję HTMLAgilityPack w moim kodzie C# do przeanalizowania zawartości. – monstro