Linux网络开发者面临的问题往往比较复杂,因此需要使用一些工具和命令来进行定位和解决。在本篇博客中,我将总结一些常用的Linux网络开发者工具和命令,包括网络包观测、各层网络状况快速诊断、网络关键统计计数收集、性能诊断、问题复现等方面的命令总结。
分类 | 命令、工具 | 作用 | 备注 |
包观测 |
tcpdump |
用于抓取网络数据包。通过 tcpdump 命令可以捕获网络数据包,并进行分析和诊断。 |
|
wireshark&&tshark |
分析网络数据包。 |
wireshark可视化分析,tshark命令行分析。 |
|
tcpflow |
用于抓取 TCP 流量并保存到文件。通过 tcpflow 命令可以捕获 TCP 流量,并将每个 TCP 连接的数据保存到不同的文件中。 |
比如可以快速将每个连接的包分发到不同文件保存。 | |
ngrep |
用于过滤和显示网络数据包。通过 ngrep 命令可以过滤和显示满足特定条件的数据包。 |
比如快速过滤http GET和POST请求。 | |
快速验证各层网络情况 |
ping |
用于测试主机之间是否能够互相通信。通过向目标主机发送 ICMP 报文,可以确定网络连接是否正常。 |
检查ip层是否ok。 |
telnet |
用于远程登录和测试网络服务。通过 telnet 命令可以远程登录主机、测试网络服务是否可用,并进行交互式操作。 |
检查tcp握手是否ok。 |
|
curl |
用于从命令行发送 HTTP 请求。通过 curl 命令可以发送 GET、POST 等 HTTP 请求,并查看服务器返回的响应。 |
检查http是否ok。 |
|
openssl |
OpenSSL 是一个常用的加密工具库,可以用来实现 SSL/TLS 通信、数字证书签发和管理、密码学算法等功能。 |
检查ssl握手情况,证书内容等。 |
|
网络路径状况查看 |
traceroute |
用于确定数据包从一个主机到另一个主机所经过的路由路径。 |
|
mtr |
用于网络故障定位和性能分析。mtr 命令可以连续发送 ICMP 报文,并在每一跳的路由器上进行网络延迟和丢包率的统计,用于找出网络故障的根源。 |
||
网络状态和计数查看 |
netstat |
用于查看网络连接、路由表、网络接口状态等信息。通过 netstat 命令可以了解当前系统的网络状况。 |
|
ss |
ss 命令是 netstat 的替代品,用于查看网络连接状态、监听端口、网络接口等信息。与 netstat 不同的是,ss 命令提供了更快的速度和更多的选项。 |
||
ifconfig |
用于查看和配置网络接口。通过 ifconfig 命令可以查看网络接口的 IP 地址、MAC 地址、网络状态等信息。 |
||
ip |
配置和管理网络接口、路由表、ARP 缓存和其他网络相关的属性。 |
||
curl cip.cc |
查看网络出口地址。 |
||
ethtool |
用于查看和配置网络接口的驱动程序。通过 ethtool 命令可以查看网络接口的状态、速度、双工模式等信息,并进行网络性能调优。 |
||
iftop |
用于实时监控网络流量。iftop 命令可以显示每个网络接口的实时流量、连接数、连接速度等信息,用于快速诊断网络瓶颈和流量异常。 |
||
nethogs |
用于查看进程占用的网络带宽。通过 nethogs 命令可以查看每个进程占用的网络带宽、连接数和流量等信息,用于找出网络资源占用高的进程。 |
||
dns相关 |
nslookup |
用于查询 DNS 服务器上的主机名和 IP 地址信息。通过 nslookup 命令可以查看主机名对应的 IP 地址、反向 DNS 解析等信息。 |
|
dig |
查询 DNS 服务器上的主机名和 IP 地址信息。与 nslookup 不同的是,dig 命令提供了更多的选项和功能。 | ||
系统异常查看 |
dmesg |
用于查看内核日志。通过 dmesg 命令可以查看系统内核的日志信息,包括硬件检测、设备驱动加载等信息,用于排查和分析系统硬件和驱动问题。 |
比如oom、segment fault都可以在这里面看到相应的记录。 |
systemctl |
用于管理 systemd 服务。通过 systemctl 命令可以启动、停止、重启和查询 systemd 服务的状态,用于排查和处理系统服务异常问题。 |
||
journalctl |
用于查看系统日志。通过 journalctl 命令可以查看系统日志、过滤日志信息、按时间戳或者进程名等条件搜索日志信息,用于排查和分析系统异常和错误。 |
||
内存异常 |
valgrind |
检查程序在运行时的内存访问错误、泄漏等问题。 | 无需修改代码 |
asan |
可以检测常见的内存安全问题,例如缓冲区溢出、使用未初始化的内存等。 | ||
性能定位 |
top |
实时监控系统 CPU、内存、进程等资源的使用情况,用于找出系统资源占用高的进程。 |
看出是用户态高还是内核态高,是否是io高等。 |
vmstat |
用于显示系统虚拟内存(VM)的使用情况。它提供了对系统内存、进程、CPU 等性能数据的实时监控。 |
可快速看出上下文切换次数。 |
|
pidstat |
进程级别统计cpu、io、上下文切换等信息。 |
看出上下文切换中自愿切换和非自愿切换次数。 | |
sar |
监测 CPU 使用率、磁盘 I/O、网络流量、内存使用情况、进程活动等多个方面的数据,并将这些数据保存到本地或远程系统中,以供后续分析和处理。 |
可快速统计流量。 | |
perf |
可以用于测量和分析系统各个方面的性能数据,包括 CPU、内存、磁盘、网络等方面的数据。 |
cpu采样一把好手,看哪些函数是高频出现。还可以结合其他工具生成火焰图。 |
|
pprof |
用于分析 Go 应用程序性能的工具,可以分析 CPU、内存和代码分布等方面的性能问题。 |
go语言专用更强大的采样工具。 | |
strace |
用于跟踪进程的系统调用和信号。 |
||
bpftrace |
动态跟踪工具,它使用 BPF(Berkeley Packet Filter)技术来实现高效的内核和用户空间跟踪功能。 |
比如打印某个函数的系统调用栈和用户空间调用栈。脚本的方式使用ebpf工具。 | |
bcc |
基于 BPF(Berkeley Packet Filter)技术的动态跟踪和性能分析工具集,主要用于 Linux 系统的内核和用户空间程序分析。 |
比bpftrace更灵活。 | |
网络场景构造 |
iptables |
用于设置和管理 Linux 内核的防火墙。通过 iptables 命令可以设置网络连接的规则、过滤数据包、进行网络地址转换等操作。 |
可以对特定特征进行丢包,转换。 |
tc |
流量控制、网络流量调度和队列管理的工具,可用于实现各种 QoS(Quality of Service)和网络流量控制功能 |
比如对特定流量增加丢包率、时延等。 |
|
postman |
一款流行的 API 测试工具,可以帮助开发人员快速创建、测试、调试和共享 API。 |
||
流量复制和重放 |
goreplay |
一个 HTTP 实时流量复制工具。支持流量的放大、缩小,频率限制,还支持把请求记录到文件,方便回放和分析,也支持和 ElasticSearch 集成。 |
|
tcpreplay |
一种 pcap 包的重放工具,它可以将用 ethreal、wireshark工具抓下来的包原样或经过任意修改后重放回去。它允许你对报文做任意的修改指定重放报文的速度等,这样tcpreplay 就可以用来复现抓包的情景以定位 bug,以极快的速度重放从而实现压力测试。 |
||
tcpcopy |
一种请求复制工具 ,通过复制在线数据包,修改 TCP/IP 头部信息,发送给测试服务器,达到欺骗测试服务器的TCP 程序的目的。 |
||
性能压测 |
iperf |
用于测试网络带宽和性能。通过 iperf 命令可以在两个主机之间进行带宽测试和性能测试,用于评估网络的实际性能。 |
适合传输层压测、带宽压测等场景。 |
ApacheBench (ab) |
一个基于 Apache HTTP 服务器的性能测试工具,用于测试 Web 服务器的负载能力 |
适合应用层压测。 |
|
wrk |
一个高性能的 HTTP 压力测试工具,支持多线程和支持 Lua 脚本扩展。 |
||
stress |
一个简单但功能强大的 Linux 压力测试工具,可以测试 CPU、内存、I/O、网络等方面的性能。 |
在我的公众号中有一篇文章—怎样进行问题定位,总结了开发者定位问题的方法论。熟悉工具和命令只能帮我们快速收集信息和对假设做出验证。除了熟悉工具,更重要的是具备过硬的基础知识、熟悉代码流程,并懂什么时候收集什么信息,然后将这些命令和工具熟练的应用到工作中。