cut 和 tr 可能是 Linux 世界里最不起眼的工具。它们没有华丽的界面,没有 viral 的营销,却每天都在处理别人留下的混乱数据。
cut 干一件事:从文本里切出你要的列。CSV 文件太宽?日志格式不统一?用它指定分隔符,直接提取第 3 列或第 7 到 12 个字符。不需要写正则,不用开 Excel。
打开网易新闻 查看精彩图片
tr 更沉默。字符替换、大小写转换、删除控制字符——这些脏活累活它全包。管道里进,管道里出,从不抱怨。
打开网易新闻 查看精彩图片
真正有意思的是它们的设计哲学:只做一件事,但做到极致。没有 flag 能帮你解决所有问题,组合起来却能应付 90% 的数据清洗场景。awk 和 sed 当然更强,但很多时候你根本不需要那么重的火力。
打开网易新闻 查看精彩图片
这两个工具诞生于 1970 年代的贝尔实验室,至今几乎没变。技术圈追逐新框架的速度越来越快,但 cut 和 tr 依然稳坐在每一台服务器的 /usr/bin 里。它们的存在本身就在提醒:解决复杂问题,有时候只需要一把锋利的刀。
热门跟贴