Określanie formatów plików jest trudne. Jeśli dane, które chcesz przechowywać, są trywialne, zwykle są banalne. Ogólnie jednak tak się nie dzieje. Możesz użyć struktury RFC i słów kluczowych, ale zawsze uważałem, że określanie formatu pliku w prozie to powolne, trudne i nudne zadanie, także dlatego, że czytanie go jest równie trudne.
Moja sugestia, jeśli chcesz podążać tą drogą, to skupić się na blokach informacji. Większość problemów dotyczy podmiotów, które są opcjonalne i są obecne tylko w przypadku wystąpienia innego warunku, więc staraj się wykorzystać to przy partycjonowaniu danych.
Najlepszy spec, IMHO, to prawdziwy kod z uberperfect testsuite.
Jeśli chodzi o standaryzację, jeśli wystarczająca liczba osób go używa, staje się ona standardem de facto. nie potrzebujesz do tego oficjalnej pieczęci, chociaż jeśli format jest wystarczająco używany, możesz skorzystać z oficjalnego rodzaju mime.
Aby o tym mówić, to zależy. Uznałem, że przydatne jest mówienie w kategoriach podmiotów zorientowanych obiektowo, a także w kategoriach relacji. Diagramy bazy danych są bardzo przydatne w tym względzie.
Wreszcie, spróbuj najpierw znaleźć przyzwoitą już standardową alternatywę lub przynajmniej staraj się nie radzić sobie z nieprzetworzonymi bitami. Istnieje wiele doskonałych formatów kontenerów, które pozwalają uwolnić się od wielu irytujących zadań. Wybór kontenera zależy od faktycznego rodzaju formatu pliku (np. Jeśli potrzebujesz szyfrowania, przeplatania, transakcji itp.).
Reprezentować dane w jakiej formie? Jakie dane? Czy mówisz o kompresji? – Nifle
Binarny. Zaszyfrowane dane. Niekoniecznie, choć może w pewnym momencie. –
Opublikuj RFC. – Artelius