Istnieje kilka sposobów, w jakie można tutaj przejść - wiele z nich będzie zależeć od tego, czy chcesz zachować formattting (tj. Akapity i inne elementy układu) oryginalnego pliku PDF.
Jeśli rozważasz komercyjne rozwiązania, oferujemy dwa produkty, które mogą spełnić Twoje wymagania. Jednym z nich jest pakiet SDK EasyPDF, który zawiera pojedyncze wywołania funkcji ExtractText() i ExtractText2(), które pobierają tekst z plików PDF jako zwykły tekst.
Należy zauważyć, że wynik tych wywołań jest dość prosty i spowoduje utratę wielu oryginalnych elementów układu. Są dobre do prostego ekstrakcji tekstu, ale mogą nie być świetne, jeśli plik PDF zawiera dane tabelaryczne.
Jeśli masz do czynienia z tabelami, ładniejszą alternatywą może być zamiast tego wyciągnięcie go w postaci tekstu sformatowanego. Mamy narzędzie o nazwie EasyConverter SDK przystosowane do dokumentów biznesowych, które robi to za pomocą pojedynczego wywołania funkcji.
W pakiecie EasyConverter SDK układ oryginalnego pliku PDF zostanie zachowany.
Oba obsługują C#, więc zachęcamy do zapoznania się z wersjami eval na stronie www.pdfonline.com, jeśli jesteś zainteresowany. Pracuję dla sprzedawcy, więc weź tę sugestię jako rodzaj matki kochającej własne dziecko :-) Przeglądam stackoverflow.com w poszukiwaniu fragmentów kodu przez długi czas, ale dopiero niedawno zacząłem publikować, więc jeśli masz wszelkie pytania z jednym z interfejsów API po prostu mi pozwolą i mogę pomóc. Twoje zdrowie!
+1 za darmo jest dobre. –