Mam aplikację Spring MVC z możliwością przesyłania plików. Pliki są przesyłane do kontrolera jako MultipartFile, z którego łatwo jest uzyskać InputStream. Przesyłam pliki zip, które zawierają pliki CSV i staram się znaleźć sposób na otwieranie plików CSV i odczytywanie ich po linii. Istnieje wiele przykładów na "sieć odczytu do bufora o ustalonych rozmiarach. Próbowałem, ale bufory nie złączyć się bardzo dobrze i szybko wychodzi z synchronizacją i zużywa dużo pamięci:Odczytywanie plików CSV z pliku zip po linii w czasie
ZipEntry entry = input.getNextEntry();
while(entry != null)
{
if (entry.getName().matches("Data/CSV/[a-z]{0,1}[a-z]{0,1}.csv"))
{
final String fullPath = entry.getName();
final String filename = fullPath.substring(fullPath.lastIndexOf('/') + 1);
visitor.startFile(filename);
final StringBuilder fileContent = new StringBuilder();
final byte[] buffer = new byte[1024];
while (input.read(buffer) > 0)
fileContent.append(new String(buffer));
final String[] lines = fileContent.toString().split("\n");
for(String line : lines)
{
final String[] columns = line.split(",");
final String postcode = columns[0].replace(" ", "").replace("\"", "");
if (columns.length > 3)
visitor.location(postcode, "", "");
}
visitor.endFile();
}
entry = input.getNextEntry();
}
musi istnieć lepszy sposób, że faktycznie działa.
Aplikacja Jackson CsvMapper będzie analizować strumień wejściowy po linii na obiekt []. Może warto rzucić na to okiem. Będzie szybszy niż split (",") i będzie również obsługiwał ucieczkę. – tom