随着数据体积越来越大,实时处理成为许多机构需要面对的首要挑战。Storm是一个开源的分布式实时计算系统,可以简单、可靠地处理大量的数据流。Storm有很多使用场景:如实时分析,在线机器学习,持续计算,分布式RPC,ETL等等。Storm支持水平扩展,具有高容错性,保证每个消息都会得到处理,而且处理速度很快(在一个小集群中,每个结点每秒可以处理数以百万计的消息)。Storm的部署和运维都很便捷,而且更为重要的是可以使用任意编程语言来开发应用。
大数据丛书(规划中)的一本。由淘宝数据分析专家奉献,有第一手的实际操作经验。市面上尚无同类书。