时序数据库
基于快速增长的时序数据应用需求以及区别于传统关系型数据的特征,时序数据库应运而生,时序数据库一般具有以下特点:
高吞吐量数据高速写入能力。由于时序业务会持续产生海量数据,并且对写入的速度有很高的要求,写入的并发量大,这就要求时序数据库系统实现高吞吐量的数据高速写入功能。
高压缩率。时序数据库需要存储大量的数据,并且有的监控数据可能需要存储很长时间,5 年到 10 年都有需求,因此需要根据时序数据的特征对数据进行压缩。
业界典型时序数据库解析
近2年来时序数据库正处于高速发展的阶段。国内外云市场各大主流厂商已经从整个时序生态的不同角度切入,形成各自特色的解决方案完成布局,开始抢占流量。
而以Facebook Gorilla为代表的时序数据库则是脱胎于满足自身业务发展的需要。学术上,在时序领域里面更是涌现了一大批黑科技,把时序数据的技术深度推向更高的台阶。
阿里的TSDB团队自2016年首版时序数据库落地后,逐步服务于DBPaaS,Sunfire等等集团业务,在2017年中旬公测后,于2018年3月底正式商业化。
在此过程中,TSDB在技术方面不断吸纳时序领域各家之长,开启了自研的时序数据库发展之路。
时序数据的概念
经济计量学独用名词。
例如:某省从1940年至1999年各个年末的人口数是由50个时点数组成的时序数列,而各年的粮食产量数则是由时期数组成的时序数据列。时点数据列中的每一个数必须是同范围、同一时点上的统计数据;时序数据列中的每一个数也必须是同范围的、同一时期长度上的统计数据。上述两例中,人口数据列必须是同一范围内、行政区划不变动(如有变动应当调整),在各年同一时刻的人口数;粮食产量数据列必须是在同一范围内,每年按照相同的统计口径和计算方法得到的粮食产量数量数。如果行政区划,统计口径或计算方法变化了,在使用时都必须经过调整处理。如果是价值量数据,数据列中的各个数据的计价标准要求是可比的,也要进行调整处理。
版权所有©2024 产品网