VictoriaLogs 和 Vector 的使用分享|elasticsearch|log|vector|yaml|使用分享|分组

新钛云服已累计为您分享891篇技术干货

PART.01

victoriaLogs 介绍与对比

victoriaLogs 是什么

VictoriaLogs是 VictoriaMetrics 体系里的日志数据库，目标是把“写入吞吐、存储成本、查询效率、运维复杂度”这四个维度做到更均衡：一个服务就能跑起来，HTTP 端口默认9428，常见的采集侧（Vector / FluentBit / Filebeat 等）可以直接对接它的写入 API。

核心数据模型

消息字段：_msg
时间字段：_time
流字段（stream fields）：决定日志如何被分组与存储（类似 Loki 的 labels，但语义更贴近“分流/分桶”）

并且在写入时，你可以通过 query 参数/headers 显式指定：

_msg_field：哪一个字段是日志正文
_time_field：哪一个字段是时间戳
_stream_fields：哪些字段作为 stream fields

stream fields 不要高基数

stream fields 必须“稳定、低基数，比如 host / instance / pod / container / service / env 这种。把 trace_id / user_id / ip 之类高基数放进去，会制造海量 streams，显著增加资源消耗与查询成本。

这点后面会直接影响我们怎么设计 labels/fields（尤其是 filepath）。

什么时候更适合用 victoriaLogs？

vs Elasticsearch / OpenSearch

ES 强在生态与全文检索、聚合分析，但运维与成本通常更重（集群、shard、mapping、冷热分层、性能调优）。
VictoriaLogs 更像“把日志存起来并快速检索/聚合”，强调更简单的落地与更好的性价比（尤其是规模上来之后）。

vs Grafana Loki

Loki 是 label + chunk，label 设计同样要避免高基数。
VictoriaLogs 的 stream fields 也怕高基数，但它把“message/time/stream”的概念讲得更清晰，且写入 API 的兼容面（如 ES bulk / jsonline）让你更容易接入。

PART.02

VictoriaLogs 的搭建

Docker 方式启动

  -storageDataPath=victoria-logs-data

-storageDataPath：数据目录（默认 victoria-logs-data）
-httpListenAddr：默认 :9428
-retentionPeriod：日志保留期，默认 1w（按需改）

验证查询（LogsQL）

起服务后，可以用 /select/logsql/query 直接查：

  -d 'query=error' -d 'limit=10'

这会返回包含 error 的最新 10 条。

你后续常用的 LogsQL 习惯是：

时间范围：_time:5m / _time:1h / _time:1d
排除词：-kubernetes
排序：| sort by (_time)
取最新 N 条：| first 10 by (_time desc)

PART.03

Vector 介绍与对比

Vector 是什么

Vector是一个高性能的可观测数据管道：把 logs/metrics/traces 从各种 source 收进来，经过 transform（核心是 VRL），再发往各种 sink。它本质是一个单一可执行文件，部署和运维路径很“平台友好”。

我们本文会用到：

sources

journald：从 systemd journal 读日志（需要权限）
file：tail 文件日志（带 checkpoint）

transform

remap：用 VRL 做字段清洗/补齐/路由（但也是坑最多的部分）

sink

elasticsearch：发往 VictoriaLogs 的 /insert/elasticsearch/（官方推荐路径之一）

Vector vs Fluent Bit / Fluentd / Logstash / OTel Collector

vs Fluent Bit

Fluent Bit 更“采集器”，轻量、插件多，但复杂变换要么写 Lua，要么链路拆很多 filter。
Vector 的强项是VRL：写得好非常强，写得不好非常痛苦。

vs Fluentd / Logstash

Fluentd/Logstash 生态成熟，但运行时更重（Ruby/JVM）。
Vector 更偏“一个 Rust binary 的工程化组件”。

vs OpenTelemetry Collector

OTel Collector 适合统一 traces/metrics/logs，但日志处理表达力与生态取舍和 Vector 不同。
你可以理解为：Vector 更像“日志/可观测数据路由器 + 可编程 transform。

PART.04

Vector 的搭建

安装（Linux 常见方式）

官方提供安装脚本/包管理方式（不同发行版略有差异）。

安装后默认配置路径通常是：

/etc/vector/vector.yaml

基础运维命令

校验配置：

vector validate /etc/vector/vector.yaml

（强烈建议每次改配置先跑它）

systemd 管理（包安装通常自带 service）：

journalctl -u vector -f

Vector 也支持通过信号触发 reload 的方式（具体以你的部署方式为准）。

PART.05

Vector 的注意事项

fail-safe + fallible

VRL 是fail-safe的——只要存在潜在运行时错误没被处理，编译期就不让你过。这在日志这种“脏数据”有优势，但会显著抬高配置难度。

建议把 VRL 流程固定成下面 3 种：

能不用 fallible 函数就不用：优先用 exists() / is_nullish() 这类 infallible 的逻辑兜底。
本地 REPL：vector vrl 可以进交互 REPL，先把片段跑通再放进配置。
Playground：VRL Playground 适合分享/对照输入输出

可选加速：打开 API 后用 `vector tap` 抽样观察某个组件的事件流，定位字段长什么样。

journald 的 include\_units / exclude\_units

journald source 默认要能执行 journalctl，且运行用户通常需要在 systemd-journal 组里。
include_units 的规则里，“没带点号的 unit 会自动补 .service”。

labels / stream fields 设计——尤其是 filepath

这里要区分两个概念：

Vector 里你随便加字段（比如 filepath），这是为了后续查询过滤更方便。
VictoriaLogs 的_stream_fields是“用来分组存储的关键字段”，不能高基数。

建议

filepath：只做普通字段，不要进_stream_fields（k8s/nomad 场景会爆炸式增长）。
额外做一个低基数的 file_group（或 app/component）：

例如把 /var/log/nginx/access.log、/var/log/nginx/error.log 归到 file_group=nginx
把 /var/log/myapp/*.log 归到 file_group=myapp

stream_fields 推荐起步：host,service,env,source,file_group（再按场景微调）

PART.06

Vector 部署到 Linux

配置步骤

下面介绍 Vector 部署到 Linux，并发送 journald + file 日志到 VictoriaLogs

前置：确保 Vector 能读 journald

sudo systemctl restart vector

/etc/vector/vector.yaml（journald + file → vlogs）

你只需要改两块： 1）file include 路径 2）VictoriaLogs 地址（endpoints）

      # debug: "1"

这份 sink 的写法是 VictoriaLogs 官方“Vector → VictoriaLogs（Elasticsearch 协议）”推荐配置的同款思路：

写入地址：/insert/elasticsearch/
_msg_field=message、_time_field=timestamp、_stream_fields=...

也可以用 HTTP jsonline 的方式写入（/insert/jsonline + newline_delimited），官方也给了模板。

启动与验证

1. 校验配置：

vector validate /etc/vector/vector.yaml

2. 重启 Vector：

journalctl -u vector -f

3. 制造两种日志：

journald：

logger -t demo "hello from journald"

file：

echo "hello from file" >> /var/log/myapp/app.log

4. 在 VictoriaLogs 查：

  -d 'query=hello _time:1h' -d 'limit=20'

LogsQL 里 _time:1h、limit 这类用法是最常用的排障入口。

常见问题

写入侧出现 “missing _msg field”

先确认 sink 里 _msg_field 指向的字段确实存在（本文用 message）
如果你在 remap 里改过字段名，确保最后还有 message
VictoriaLogs 对 _msg/_time/_stream 的概念解释在 Key Concepts 里，值得快速扫一遍。

stream 爆炸、写入变慢、查询变慢

99% 是 _stream_fields 里塞了高基数字段（最常见就是 filepath / trace_id / user_id）
回到“低基数、稳定”的原则：host/service/env/source/(container/pod) 这类。

VRL 写不动

用 vector vrl REPL / Playground 先把局部片段跑通再粘贴进配置。

如有相关问题，请在文章后面给小编留言，小编安排作者第一时间和您联系，为您答疑解惑。

VictoriaLogs 和 Vector 的使用分享

热搜

热门跟贴

热搜

热门跟贴

相关推荐

生活的重复度太高了

河南瓜农含泪发声，2200斤西瓜，瓜贩只愿给20元

给Transformer变个形，LLM竟能变得更聪明

河南老君山月薪6万招人每天看云海，需在山顶住30天，每天至少发一条短视频，景区：咨询报名者众多，全国仅选一人

"梅超锋"大赛已上演三次绝杀 送走克罗斯C罗德布劳内

亚马尔赛后发声

大模型解剖图火了，30多个开源模型架构差异一目了然，还可接入AI

株洲首届电竞大赛第一轮初赛分组对战分布表公布

温网｜三盘完败于辛纳无缘男单决赛，39岁的德约再夺大满贯几无可能

2027女篮亚洲杯分组：中国女篮和菲律宾、日本、黎巴嫩同组

35岁女高管立遗赠，千万资产全部赠予小姨

英挪大战未开打，英格兰与挪威两国航空公司“开战了”：输的换LOGO一天

ICLR 2026 Oral | Revela：用语言建模重新定义稠密检索器训练

中方投了反对票

“草帽当安全帽”？考核巡查组连说6个“乱”

“两倍的价格，我买100吨西瓜！”

受巴威影响瀑布惊现飞瀑倒流景象

一年辐射≈650次胸片，身边2个隐形辐射源，很多人忽略

现实中的Vector凭什么让特种兵又爱又恨？

中国代表：中方将继续推动全球互联互通

"梅超锋"大赛已上演三次绝杀送走克罗斯C罗德布劳内