日志服务数据加工：规则场景概述

编程语言 2019-06-10 09:41:48 阅读次数: 0

使用场景1：自由编排

通过一个简单的类Python风格的配置文件进行编排，一般情况下不需要写代码即可达到80%的数据加工的需求和自由度：

提供内置的编排能力包括如下，并具备扩展能力：

赋值字段
提取字段
通用操作
分派转换
串联转换
分裂事件
保留事件
丢弃事件
保留字段
丢弃字段
自动提取KV
重命名字段
输出(复制)事件

使用场景2：使用内置转换模块

日志服务数据加工功能提供了完整的内置的处理模块，尤其对于正则表达式、KV、JSON、Lookup等支持灵活且完整。总体内置转换模块对常规数据加工转换支持度完整，可以覆盖总体80%的转换需求：

设置列值(静态/复制/UDF)：各种函数计算支持
正则提取列：正则的完整支持，包括动态提取字段名等
CSV格式提取：CSV标准的支持
字典映射：直接字段映射
外部OSS多列映射：从外部OSS上的CSV关联对数据进行富化，支持增量刷新、宽匹配等。
外部数据库多列映射：从外部数据库关联对数据进行富化，支持动态刷新、宽匹配等。
外部Logstore多列映射：从外部logstore关联对数据进行富化，支持增量刷新、宽匹配等。
自动KV：自动提取KV，也支持自定义分隔符、auto-escape场景
JSON自动展开：支持自动展开JSON内容，包括数组，支持展开过程的定制。
JSON-JMES过滤：支持基于JMES的动态选择与计算后再处理。
分裂事件(基于JSON数组或字符串)：基于字符串数组或JSON数组进行事件分裂
多列合并(基于JSON数组或字符串)：基于字符串数组或JSON数组进行多字段合并

使用场景3：使用内置表达式函数

目前日志服务对外的插件编写尚未开放，但提供了内置150种函数，基本覆盖了主流的数据加工的需求，包括：

基本操作函数: 字段取值, 控制, 比较, 容器判断, 多字段操作等
转换函数: 基础类型转换, 数字转换
算术函数: 基础计算, 多值计算比较, 数学计算, 数学参数等
字符串函数: 多字段操作, 编码/解码, 排序、倒叙、替换, 常规规整, 查找判断, 切分, 格式化, 字符集判断等
日期时间函数: 智能日期时间转换, 获取日期时间属性, 获取日期时间, 获取Unix时间戳, 获取日期时间字符串, 修改日期时间, 修改日期时间, 比较日期时间等
正则表达式函数: 字段提取, 匹配判断, 替换, 切分等
JSON与XML函数: 提取过滤等
其他高阶函数: Syslog函数等

使用场景4：扩展插件或UDF

底层目前采用Python引擎，理论上任意Python的库都可以稍加包装即可进入日志服务的数据加工，目前自定义UDF功能，尚未开放，但外部客户使用内置的150+函数（持续增加）基本完成完成大部分工作，不能满足需求的，可以提工单并获得及时支持。

进一步参考

欢迎扫码加入官方钉钉群 (11775223)获得实时更新与阿里云工程师的及时直接的支持:

猜你喜欢

转载自yq.aliyun.com/articles/704937

日志服务数据加工：规则场景概述

日志服务数据加工：快速开始（SLB日志加工实战）

日志服务数据加工：权限配置指南

日志服务数据加工：原理篇

日志服务数据加工：作业诊断指南

日志服务数据加工：语法框架与样例

日志服务新功能：数据加工上线！（内测）

日志服务数据加工：控制台操作

日志服务数据加工最佳实践: 从其他logstore拉取数据做富化

日志服务数据加工最佳实践: 字符串动态键值对的提取

数据挖掘——关联规则分析（一）概述

SMT贴片加工的服务

大数据场景-用户行为日志分析

数据库服务概述

阿里云日志服务(SLS)SDK混淆规则

数据加工（二）------数据计算

数据加工（一）-------数据抽取

Centos7构建Redis高性能数据库——Redis概述，应用场景分析，数据回收策略，结合PHP测试Redis服务

Redis概述详解 - 数据类型 -指令 - 应用场景

VMware vsphere esxi 服务器日志文件概述

MySql日志--日志概述

大数据场景下数据的存储，读写应用场景的概述

OpenSSL编码规则概述

Python 数据加工之 Matplotlib

瑞克斯外汇平台聚焦数据、场景、服务

iptables场景二概述

场景文字识别概述

遥测数据收集服务概述-Ceilometer

数据分片概述、部署MyCAT服务

加工并存储数据的数据结构

今日推荐

周排行

django中south支持多数据库

2、实时同步项目

http协议状态码解析

codeup 又一版 A+B(C++)

js三座大山之外的其他知识点

正向代理VS反向代理总结

规范的测试流程（转自51testing）

3、python-连接sql server

转~Jenkins pipeline：pipeline 使用之语法详解

cookie与sessio系列（一）：基本知识入门

每日归档

更多

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)