我们可以利用hadoop来存储大规模的数据,并且能够在很多时候保证数据的可靠性,而对于map/reduce运算,这些数据也能很好的被利用,这里说的就是HDFS(Hadoop Distibuted Filesystem)——hadoop自己的分布式文件系统。
先来看看什么叫做文件系统:
a file system (or filesystem) is a type of data store which can be used to store, retrieve and update a set of files.