2012-02-22 15 views
5

Interesujące jest to, jakie oprogramowanie wykorzystuje firmy takie jak Dropbox, rapidshare, hotfile i inne do zarządzania ogromną ilością plików? Czy istnieje system open source? Przyjrzałem się gridFS, który opiera się na mongo-db. Wygląda na to, że nie jest to najlepszy wybór ze względu na szybkość (w porównaniu do nginx). Czy ja się mylę?Czy są dostępne skalowalne systemy przechowywania plików typu open source?

Chcę system, który może skalować w nieskończoność. Podłączając serwery do systemu. Na liście do 100 TB.

+0

Gdzie przeczytałeś o ograniczeniu pojemności magazynu GridFS? – Nerian

+0

Przepraszam, to jest zdanie wrang. Miałem na myśli problem, gdy ilość danych jest duża. – Pol

Odpowiedz

3

Zamówienie systemu plików MogileFS - http://danga.com/mogilefs/ - systemu plików open source opracowanego przez firmę Danga Interactive do użytku z usługami LiveJournal.com.

Jeśli nie chcesz/nie możesz korzystać z usług w chmurze, takich jak Amazon S3 i uruchamiać własne serwery, wówczas dobrym wyborem może być MogileFS. MogileFS jest niezawodny, zarządzanie i skalowanie jest bardzo łatwe i tanie.

Niestety, nie mogę dostarczyć żadnego porównania wydajności ani testów porównawczych do innych systemów plików. Ale nie powinieneś oczekiwać, że MogileFS zajmie pierwsze miejsce, ponieważ działa na poziomie aplikacji, co również może być zaletą.

Zobacz także stronę kodową Google wiecej informacje o: http://code.google.com/p/mogilefs/

0

Dla Googler tam kto uważa, że ​​to pytanie:

FB ma tak wiele plików, które musieli napisać swój własny system plików; wiele plików jest przechowywanych w 1 gigantycznym pliku ze znacznikami między nimi. Odbywa się to w celu zmniejszenia liczby plików w systemie.

Co trzeba Wygląda Google File System

0

Co masz na myśli przez gridFS ma swoje granice pojemności duży stół jest? Czy mógłbyś bardziej konkretnie lub wskazać na jakąś dokumentację, w której to czytasz, ponieważ nie jestem świadomy ograniczeń pojemności z gridFS.

+0

http://mashable.com/2010/10/07/mongodb-foursquare/ – Pol

+0

+ gridFS ma pewne ograniczenia prędkości: http://www.coffeepowered.net/2010/02/17/serving-files-out-of -gridfs/ – Pol

+0

Ponownie, nie widzę żadnego odniesienia do pojemności gridFS (skalowanie w nieskończoność, jak pytałeś) limitów. Pierwszy odnośnik odnosi się do wydajności systemu (sprzętowego) działającego w trybie mongo, a drugi dotyczy prędkości sieci gridFS. Myślałem, że twoje pytanie dotyczy skalowalności, której wciąż nie widzę. – Sid

2

Hadoop na HDFS jest skalowalnym systemem plików. Inną opcją jest GlusterFS

2

GlusterFs to rozproszony system plików open source. W przeciwieństwie do HDFS nie ma scentralizowanych metadanych. Co oznacza, że ​​GlusterFS nie ma pojedynczego punktu awarii.