Pracuję nad projektem bazy wiedzy przy użyciu SQL Server 2008 Full Text Search Engine. Projekt zawarty w artykułach i plikach, w których każdy artykuł ma wiele plików. W tych artykułach cała treść to czysty html.Jak ignorować znaczniki html w Sql Server 2008 Wyszukiwanie pełnotekstowe
Właśnie z powodzeniem stworzyłem katalog pełnotekstowy i indeks na serwerze SQL Server 2008, a moja baza danych jest zgodna z wersją 10.
Oto moje pytania:
1) Czy to możliwe, aby ignorować znaczniki HTML, teksty zawierające bardziej wyraźnie w „< ...>”, podczas poszukiwania w tych artykułach, bo jeśli chciałbym, aby szukać div , tabela itp. nie powinno być zwracanych wyników?
2) Artykuły będą aktualizowane w dowolnym momencie, więc pełny indeks tekstowy musi zostać zaktualizowany po włożeniu nowego rekordu. Czy wystarczy ustawić tylko "ZMIANY ŚCIEŻKI AUTOMATYCZNEJ" podczas tworzenia pełnego katalogu tekstowego?
3) Możemy korzystać z funkcji FILESTREAM poniżej, czy SQL Server 2008 ma dobrą wydajność na plikach przy użyciu pełnotekstowego indeksu? Jakie konkretne typy dokumentów obsługuje indeksowanie SQL Server 2008?
Pozdrowienia
Hi friend, myślę, że najlepszym rozwiązaniem jest zastąpienie HTML z regex«<(.|\n)*?>»z czekiem montażowej sql clr ten link http://justgeeks.blogspot.com/2008/08/adding-regular-expressions-regex-to-sql.html –