下一个→ ←上一页

Elasticsearch汇总数据

Elasticsearch提供了一个rollup特性，可以帮助汇总索引中的数据，并将其滚动到一个新的索引中。这些存储的数据可以在将来需要时用于分析，但其存储成本只是原始数据的一小部分。在分析过程中保留历史数据是非常有用的。然而，由于归档大量数据的财务成本，有时会避免使用这种方法。

例如，假设一个系统每天生成4700万个文档，这需要大量内存来存储它们。每一秒，这些数据都对实时分析有用。在历史分析的情况下，如果我们正在寻找超过5年的数据，我们需要在一个大的间隔工作，如每小时或每天的趋势。我们可以通过将这4700万份文档压缩成每小时的摘要来节省大量的空间。

Elasticsearch6.3提供了卷起功能。elasticsearch的rollup特性对于在汇总之后存储历史数据非常有用。这样在总结之后需要更少的内存来存储。请注意，rollup作业是一个周期性任务。

从rollup开始

要开始使用rollup特性，我们必须创建一个或多个“汇总工作”汇总数据。这些作业汇总您指定的索引，并将汇总的文档放在二级索引中。您可以选择您所选择的二级索引来放置这些卷过的文档。这些卷取作业在后台持续运行。

创建索引

首先，我们将创建一个包含不同时间戳的索引。创建索引之后，我们将使用cron作业周期性地创建rollup作业。你的文档可能是-

复制代码

            PUT /rollupexample/_doc/01 {"timestamp": 1516729294000， "temperature": 200， "voltage": 5.2， "node": "x"}
           

响应

通过执行上面的索引创建查询和时间戳，您将得到与下面给出的相同的响应

            {“_index”:“rollupexample”、“_type”:“_doc”、“_id”:“01”、“_version”:1、“结果”:“创建”、“_shards”:{“总”:2,“成功”:1,“失败”:0},“_seq_no”:0,“_primary_term”:1,}
           

添加更多文档到rollupexample索引。

复制代码

            向rollupexample索引添加更多文档。PUT /rollupexample-2020-01-01/_doc/02 {"timestamp": 1413729294000， "temperature": 201， "voltage": 5.9， "node": "x"}
           

创建一个卷起作业

现在我们将使用_rollup API创建一个rollup作业。这些文件按小时汇总成摘要。汇总数据的代码可能看起来像-

复制代码

            把_rollup /工作/ rollupexample{“index_pattern”:“传感器- *”、“rollup_index”:“sensor_rollup”、“cron”:“* 30  * * * * ?", " 页大小”:1000年,“团体”:{" date_histogram ":{“字段”:“时间戳”,“时间间隔”:“60 m”},“条款”:{“字段”:[“节点”]}},“指标”:[{“字段”:“温度”、“指标”:[“分钟”,“马克斯”,"和"]},{“字段”:“电压”、“指标”:[“avg”]}]}
           

cron参数有助于控制作业激活。它控制作业激活的时间和频率。当一个rollup作业的cron调度触发时，它将开始从上次激活后离开的位置开始rollup数据的过程。

汇总搜索

一旦作业开始运行并处理了一些数据，我们就可以使用DSL Query来搜索一些数据。查看下面的查询来搜索滚动的数据-

复制代码

            GET /rollupexample/_rollup_search {"size": 0， " aggreations ": {"max_temperature": {"max": {"field": "temperature"}}}}
           

下一个话题 AWS Elasticsearch

←上一页下一个→

视频加入我们的Youtube频道:现在加入

反馈

将你的意见发送至(电子邮件保护)

帮助别人，请分享

学习最新教程

Splunk

SPSS

2022世界杯赛程安排

transact - sql

Tumblr

ReactJS

正则表达式

强化学习

世界杯2022赛程时间表最新

RxJS

反应本地

Python设计模式

Python的枕头

Python的乌龟

Keras

准备

资质

世界杯2022赛程时间表

语言能力

面试问题

公司的问题

b .技术/马华

2022世界杯预选赛

数据结构

DAA

操作系统

计算机网络

编译器设计

计算机组织

离散数学

道德黑客

计算机图形学

软件工程

网络技术

网络安全

自动机

C编程

c++

Java

net

Python

项目

控制系统

数据挖掘

数据仓库

2022世+D11837:D11850界杯八强让球

JavaTpoint提供了太多高质量的服务。邮件地址:(电子邮件保护)，以获取有关特定服务的更多信息。

网站设计
网站开发
世界杯欧洲杯小组赛
PHP开发
WordPress
平面设计
标志
2022卡塔尔世界杯赛程图
页面上和页面外的SEO
PPC
内容开发
企业培训
课堂和在线培训
数据输入

大学校园培训

JavaTpoint提供核心Java、高级Java、。net、Android、Hadoop、PHP、Web技术和Python的大学校园培训。请将您的要求寄至(电子邮件保护)．
持续时间:1 - 2周

^{喜欢/订阅我们以获取最新更新或通讯}

Elasticsearch教程

下载安装

Elasticsearch api

Elasticsearch先进

差异

面试问题

Elasticsearch汇总数据

从rollup开始

创建索引

创建一个卷起作业

汇总搜索

反馈

帮助别人，请分享

学习最新教程

准备

热门的技术

b .技术/马华

2022世+D11837:D11850界杯八强让球

大学校园培训