当前位置：首页 > news >正文

Linux命令：对文本文件的内容进行排序的工具sort详解

news 2026/1/8 9:25:19

目录

一、概述

二、用法

1、基本语法

2、常用选项

3、获取帮助

三、示例

1. 基本用法

2. 按数字排序

3. 按第二列排序

4. 逆序排序

5. 删除重复行

6. 忽略大小写排序

7. 按人类可读的数值排序

8. 按版本号排序

四、高级用法

1. 与 uniq 结合使用去重

2. 与 grep 结合使用过滤

3. 与 awk 结合使用进行文本处理

4. 综合示例：排序、去重、过滤和文本处理

5. 使用 sort 的 -k 选项进行复杂排序

五、其他事项

一、概述

sort 命令是 Linux 和 Unix-like 操作系统中一个非常有用的命令行工具，用于对文本文件中的行进行排序。它可以按照不同的标准对数据进行排序，包括字母顺序、数值大小、月份、随机顺序或者其他定制的方式对文本文件中的行进行排序。并提供了多种选项来定制排序过程。

sort 命令非常灵活且强大，可以与其他命令管道配合使用，以完成各种复杂的文本处理任务。

二、用法

1、基本语法

sort [选项] [文件名]

如果没有指定文件名，则默认从标准输入读取数据。

2、常用选项

1）. -n 或 --numeric-sort：

   - 按照数字进行排序，而不是按字母顺序。

2）. -r 或 --reverse：

   - 逆序排序，即从大到小排列。

3）. -k 或 --key：

   - 指定排序的关键字字段。例如 -k2 表示以第二列作为排序依据。

4）. -t 或 --field-separator：

   - 指定字段分隔符。默认情况下，sort 使用空白字符（空格或制表符）作为分隔符。

5）. -u 或 --unique：

   - 排序后删除重复的行。

6）. -m 或 --merge：

   - 合并已排序的文件。

7）. -d 或 --dictionary-order：

   - 字典排序，忽略大小写，并且区分连字符（-）和撇号（'）。

8）. -b 或 --ignore-case：

   - 忽略每行开头的空白字符。

9）. -f 或 --ignore-case：

   - 排序时忽略大小写差异。

10）. -o 或 --output：

    - 将排序结果输出到指定的文件。

11）. -g 或 --general-numeric-sort：

    - 按照通用数值排序规则进行排序，可以识别带有逗号和点的数值。

12）. -h 或 --human-sort：

    - 按照人类可读的格式对数值进行排序（例如 1K < 1024 < 2G）。

13）. -V 或 --version-sort：

    - 按照版本号顺序进行排序。

14）. -m 或 --merge：

    - 合并已经排序的文件，不进行排序。

15）. -S 或 --buffer-size：

    - 指定用于排序的缓冲区大小。

3、获取帮助

输入如下命令：

Sort –-help

出现如下图所示的帮助信息：

三、示例

1. 基本用法

使用如下命令：

echo -e "apple\nbanana\ncherry" | sort

实际操作如下图所示：

2. 按数字排序

使用如下命令：

echo -e "100\n20\n3" | sort -n

实际操作如下图所示：

3. 按第二列排序

使用如下命令：

echo -e "100 apple\n20 banana\n3 cherry" | sort -k2

实际操作如下图所示：

4. 逆序排序

使用如下命令：

echo -e "apple\nbanana\ncherry" | sort -r

5. 删除重复行

使用如下命令：

echo -e "apple\napple\ncherry" | sort -u

6. 忽略大小写排序

使用如下命令：

echo -e "Apple\napple\nBanana" | sort -f

实际操作如下图所示：

7. 按人类可读的数值排序

使用如下命令：

echo -e "1K\n1024\n2G" | sort -h

8. 按版本号排序

使用如下命令：

echo -e "1.2.3\n2.0\n1.9" | sort -V

四、高级用法

sort 命令在 Linux 和 Unix 系统中常与其他文本处理命令结合使用，以实现更复杂的文本处理任务。以下是几个将 sort 与其他命令（如 uniq、grep、awk）结合使用的示例：

1. 与 uniq 结合使用去重

当想要去除文件中的重复行时，uniq 命令非常有用，但它只能去除连续出现的重复行。因此，常与 sort 命令结合使用，以确保所有重复行都是连续的。

sort input.txt | uniq

实际操作如下图所示：

从结果可以看出，这个命令首先对 file.txt 的行进行排序，然后使用 uniq 去除排序后的重复行。

2. 与 grep 结合使用过滤

grep 命令用于搜索文件中匹配指定模式的行。可以将 grep 与 sort 结合使用，先过滤出感兴趣的行，然后再进行排序。

grep 'is' file.txt | sort

实际操作结果如下图所示：

这个命令从 file.txt 中搜索包含 'pattern' 的行，并对这些行进行排序。

3. 与 awk 结合使用进行文本处理

awk 是一个功能强大的文本处理工具，可以对文本进行复杂的分析和转换。可以将 awk 的输出传递给 sort，以对处理后的文本进行排序。

awk '{print $2}' file.txt | sort

这个命令使用 awk 打印 file.txt 中每行的第二个字段，并将这些字段传递给 sort 进行排序。

4. 综合示例：排序、去重、过滤和文本处理

假设有一个日志文件 log.txt，想提取出所有唯一的 IP 地址，并按字典顺序排序。

awk '{print $1}' log.txt | sort | uniq

这里，awk '{print $1}' log.txt 提取每行的第一个字段（假设它是 IP 地址），sort 对这些 IP 地址进行排序，uniq 去除排序后的重复 IP 地址。

5. 使用 sort 的 -k 选项进行复杂排序

如果需要根据文件中的多个字段进行排序，可以使用 sort 的 -k 选项。例如，有一个以逗号分隔的 CSV 文件，想先根据第一列（用户ID）排序，然后根据第二列（分数）进行次级排序。

sort -t, -k1,1 -k2,2n users.csv

这里，-t, 指定了字段分隔符为逗号，-k1,1 表示根据第一列排序，-k2,2n 表示在第一列相同的情况下，根据第二列（作为数字）进行次级排序。

这些高级用法示例展示了 sort 命令如何与其他文本处理命令结合使用，以完成各种复杂的文本处理任务。

五、其他事项

1、当使用 sort 处理大型文件时，它可能会消耗大量内存。如果内存不足，sort 可能会使用外部排序算法，这会增加排序所需的时间。

2、如果需要对多个文件进行排序，可以使用 -m 选项来合并已排序的文件。

3、使用 -S 选项可以指定排序时使用的缓冲区大小，这有助于优化排序过程。

文章正下方可以看到我的联系方式：鼠标“点击” 下面的 “威迪斯特-就是video system 微信名片”字样，就会出现我的二维码，欢迎沟通探讨。

http://www.mrgr.cn/news/30394.html

相关文章：

代码随想录算法训练营43期 | Day 21 —— 108.将有序数组转换为二叉搜索树、 538.把二叉搜索树转换为累加树

Vue2接入高德地图API实现搜索定位和点击获取经纬度及地址功能

多路径文件批量下载工具V1.0.3-支持批量下载文件到单独文件夹的工具-供大家学习研究参考

命令可选参数说明

利用条件编译解决vivado下verilog代码中ila与仿真的共存问题

感知笔记：ROS 视觉- 跟随红球

Redis集群知识及实战

攻防世界---＞debug

HBase初探笔记

macOS平台编译MAVSDK源码生成mavsdk库与mavsdk_server服务可执行文件

计算机网络32——Linux-文件io-2文件系统

前端面试题——token安全问题处理与大数据列表展示

借助keepalived配置高可用nginx集群

数字自然资源领域的实现路径

小程序uniapp元素动态样式的写法

如何使用 Next.js 进行服务端渲染（Server-Side Rendering, SSR）

兔子检测系统源码分享

代码随想录 | Day22 | 二叉树：二叉搜索树中的搜索验证二叉搜索树

JavaScript在数据可视化领域的探索与实践