Potrzebuję przeczytać duży plik w Scali i przetworzyć go w blokach k bitów (zazwyczaj k może być 65536). Jako prosty przykład (ale nie tego, czego chcę):Odczytywanie bardzo dużych plików (~ 1 TB) w blokach sekwencyjnych
bloki plików to (f1, f2, ... fk)
.
Chcę obliczyć SHA256(f1)+SHA256(f2)+...+ SHA256(fk)
Takie obliczenia mogą być wykonywane przy użyciu tylko stopniowo stały przechowywanie i aktualny blok bez potrzeby innych bloków.
Jaki jest najlepszy sposób na odczytanie pliku? (być może coś, co używa kontynuacji?)
EDYCJA: Połączony rodzaj pytania rozwiązuje problem, ale nie zawsze, ponieważ plik, którego szukam, zawiera dane binarne.
@Christian Nie, to nie jest duplikatem pytanie przywołane. – Biswanath
Nie mogę zrozumieć, jak jest to duplikat z przytoczonym pytaniem. Inne pytanie dotyczy pliku csv opartego na tekście, to pytanie dotyczy "pliku CSV opartego na braku tekstu". Odpowiedzi na drugie pytanie nie powinny mieć zastosowania. Naprawdę wątpię, kto kiedykolwiek zaznaczył to jako duplikat, jeśli w pełni przeczyta oba pytania. – Biswanath