性能测试中服务器关键性能指标浅析--慧智精品网

性能测试中服务器关键性能指标浅析

业务指标：如吞吐量(QPS、TPS)、响应时间(RT)、并发数、业务成功率等

资源指标：如CPU、内存、Disk I/O、Network I/O等资源的消耗情况

本⽂主要介绍⼀些⼴泛适⽤的、基本的资源指标以及这些指标在Linux服务器的获取⽅式。

⼀. CPU

关于CPU资源，有三个重要概念是我们需要关注的：使⽤率、运⾏队列和上下⽂切换，这⾥借助⼀张描述进程状态的图来进⾏简要说明：

Process state -via wikipedia

Running：正在运⾏的进程

Waiting：已准备就绪，等待运⾏的进程

Blocked：因为等待某些事件完成⽽阻塞的进程，通常是在等待I/O，如Disk I/O，Network I/O等。中秋和教师节双节祝福

这⾥的Running和Waiting共同构成Linux进程状态中的可运⾏状态(task_running)，⽽Blocked状态可以对应Linux进程状态中的不可中断睡眠状态(task_uninterruptible)

在Linux可以使⽤vmstat来获取这些数据：

[hbase@ecs-097 ~]$ vmstat 1

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----

r b swpd free buff cache si so bi bo in cs us sy id wa st

6 0 0 4591436 176804 1185380 0 0 0 0 7915 1035

7 83 5 12 0 0

CPU使⽤率(CPU Utilization Percentages)：有进程处于Running状态的时间/总时间。在vmstat主要通过us、sys和id三列数据来体现：

us：⽤户占⽤CPU的百分⽐

sy：系统(内核和中断)占⽤CPU的百分⽐

id：CPU空闲的百分⽐

性能测试指标中，CPU使⽤率通常⽤us + sy来计算，其可接受上限通常在70%~80%。另外需要注意的是，在测试过程中，如果sy的值长期⼤于25%，应该关注in(系统中断)和cs(上下⽂切换)的数值，并根据被测应⽤的实现逻辑来分析是否合理。

运⾏队列进程数(Processes on run queue)：Running状态 + Waiting状态的进程数，展⽰了正在运⾏和等待CPU资源的任务数，可以看作CPU的⼯作清单，是判断CPU资源是否成为瓶颈的重要依据。vmstat通过r的值来体现：

r：可运⾏进程数，包括正在运⾏(Running)和已就绪等待运⾏(Waiting)的。

如果r的值等于系统CPU总核数，则说明CPU已经满负荷。在负载测试中，其可接受上限通常不超过CPU核数的2倍。

上下⽂切换(Context Switches)：简单来说，context指CPU寄存器和程序计数器在某时间点的内容，(进程)上下⽂切换即kernel挂起⼀个进程并将该进程此时的状态存储到内存，然后从内存中恢复下⼀个要执⾏的进程原来的状态到寄存器，从其上次暂停的执⾏代码开始继续执⾏⾄频繁的上下⽂切换将导致sy值增长。vmstat通过cs的值来体现：

cs：每秒上下⽂切换次数。

另外还有⼀个指标⽤来作为系统在⼀段时间内的负载情况的参考：

平均负载Load Average：在UNIX系统中，Load是对系统⼯作量的度量。Load取值有两种情况，多数UNIX系统取运⾏队列的值(vmstat 输出的r)，⽽Linux系统取运⾏队列的值 + 处于task_uninterruptible状态的进程数(vmstat输出的b)**，所以会出现CPU使⽤率不⾼但Load值很⾼的情况。Load Average就是在⼀段时间内的平均负载，系统⼯具top、uptime等提供1分钟、5分钟和15分钟的平均负载值。

[hbase@ecs-097 ~]$ top

top - 19:23:28 up 18:05, 3 users, load average: 0.80, 0.60, 0.53

上⾯⽰例中的0.80即是1分钟内的Load average，以此类推。

皱蹙的意思当我们需要了解当前系统负载情况时，可以先查看Load average的值，如果系统持续处于⾼负载(如15分钟平均负载⼤于CPU总核数的两倍)，则查看vmstat的r值和b值来确认是CPU负荷重还是等待I/O的进程太多。

⼆. Memory

Memory资源也有三⽅⾯需要关注：可⽤内存，swap占⽤，页⾯交换(Paging)，仍然借助⼀张图来说明：

Virtual Memory

这⾥讲到的内存，包括物理内存和虚拟内存，如上图所⽰，物理内存和硬盘上的⼀块空间(SWAP)组合起来作为虚拟内存(Virtual Memory)为进程的运⾏提供⼀个连续的内存空间，这样的好处是进程可⽤的内存变⼤了，但需要注意的是，SWAP的读写速度远低于物理内存，并且物理内存和swap之间的数据交换会增加系统负担。虚拟内存被分成页(x86系统默认页⼤⼩为4k)，内核读写虚拟内存以页为单位，当物理内存空间不⾜时，内存调度会将物理内存上不常使⽤的内存页数据存储到磁盘的SWAP空间，物理内存与swap空间之间的数据交换过程称为页⾯交换(Paging)。红星照耀中国好句

可⽤内存(free memory)：内存占⽤的直观数据，vmstat输出free的值，可⽤内存过⼩将影响整个系统的运⾏效率，对于稳定运⾏的系统，free可接受的范围通常应该⼤于物理内存的20%，即内存占⽤应该⼩于物理内存的80%。在压⼒测试时，系统内存资源的情况应该⽤可⽤内存结合页⾯交换情况来判断，如果可以内存很少，但页⾯交换也很少，此时可以认为内存资源还对系统性能构成严重影响。

页⾯交换(Paging)：页⾯交换包括从SWAP交换到内存和从内存交换到SWAP，如果系统出现频繁的页⾯交换，需要引起注意。可以从vmstat的si和so获取：

si：每秒从SWAP读取到内存的数据⼤⼩

so：每秒从内存写⼊到SWAP的数据⼤⼩

SWAP空间占⽤：可以从vmstat的swpd来获取当前SWAP空间的使⽤情况，应该和页⾯交换结合来分析，⽐如当swpd不为0，但si，so持续保持为0时，内存资源并没有成为系统的瓶颈。

三. Disk

仙剑3外传攻略磁盘通常是系统中最慢的⼀环，⼀是其⾃⾝速度慢，即使是SSD，其读写速度与内存都还存在数量级的差距，⼆是其离CPU最远。另外需要说明的是磁盘IO分为随机IO和顺序IO两种类型，在性能测试中应该先了解被测系统是偏向哪种类型。

随机IO：随机读写数据，读写请求多，每次读写的数据量较⼩，其IO速度更依赖于磁盘每秒能IO次数(IOPS)。

顺序IO：顺序请求⼤量数据，读写请求个数相对较少，每次读写的数据量较⼤，顺序IO更重视每次IO的数据吞吐量。

对于磁盘，⾸要关注使⽤率，IOPS和数据吞吐量，在Linux服务区，可以使⽤iostat来获取这些数据。

[hbase@ecs-097 ~]$ iostat -dxk 1

Linux 2.6.32-504.3.3.el6.x86_64 (ecs-097) 08/01/2016 _x86_64_ (4 CPU)

avg-cpu: %user %nice %system %iowait %steal %idle

0.52 0.00 0.13 0.06 0.00 99.28

Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await svctm %util

xvda 0.10 6.63 0.40 2.57 6.22 36.80 29.00 0.04 14.63 1.19 0.35

(设备)使⽤率：统计过程中处理I/O请求的时间与统计时间的百分⽐，即iostat输出中的%util，如果该值⼤于60%，很可能降低系统的性能表现。

IOPS：每秒处理读/写请求的数量，即iostat输出中的r/s和w/s，个⼈PC的机械硬盘IOPS⼀般在100左右，⽽各种公有云/私有云的普通服务器，也只在百这个数量级。预先获取到所⽤服务区的IOPS能⼒，然后在性能测试中监控试试的IOPS数据，来衡量当前的磁盘是否能满⾜系统的IO需求。

数据吞吐量：每秒读/写的数据⼤⼩，即iostat输出中的rkB/s和wkB/s，通常磁盘的数据吞吐量与IO类

型有直接关系，顺序IO的吞吐能⼒明显优与随机读写，可以预先测得磁盘在随机IO和顺序IO下的吞吐量，以便于测试时监控到的数据进⾏⽐较衡量。

四. Network

⽹络本⾝是系统中⼀个⾮常复杂的部分，但常规的服务端性能测试通常放在⼀个局域⽹进⾏，因为我们⾸先关注被测系统⾃⾝的性能表现，并且需要保证能在较少的成本下发起⾜够⼤的压⼒。因此对于多数系统的性能测试，我们主要关注⽹络吞吐量即可，对于稳定运⾏的系统，需要为被测场景外的业务流出⾜够的带宽；在压⼒测试过程中，需要注意瓶颈可能来⾃于带宽。

在Linuxf服务器，可以使⽤iptraf来查看本机⽹络吞吐量，如：

[root@ecs-097 ~]# iptraf -d eth0

x Total rates: 67.8 kbits/sec Broadcast packets: 0 x

x 54.2 packets/sec Broadcast bytes: 0 x

x x

x Incoming rates: 19.2 kbits/sec x

x 25.4 packets/sec x

x IP checksum errors: 0 x

x Outgoing rates: 48.7 kbits/sec x

x 28.8 packets/sec

运动会加油稿30字五. 总结

性能测试中，数据收集很重要，但是更重要的是快速抓住关键数据，读懂数据的含义。

张爱玲经典爱情语录本⽂主要介绍服务端性能测试中，对于CPU、内存等各种系统资源，通常⾸要关注的数据，以及这些数据在Linux服务器上的获取⽅式。在实际测试中，通常会持续收集这些数据，如使⽤nmon，JMeter的PerfMon插件，以及zabbix等专门的系统监控⼯具，这就不在本⽂展开了。

作者：阿羅

链接：www.jianshu/p/62cf2690e6eb

來源：简书

著作权归作者所有。商业转载请联系作者获得授权，⾮商业转载请注明出处。

慧智精品网

性能测试中服务器关键性能指标浅析

发表评论

推荐文章

【中国历史十五讲】读书说明与指导(吴树国)

中药泡脚的历史典故

关于司马迁的历史评价

3-真题专练-沈阳历史中考中国古代史-材料解析题

历史上对陶渊明的评价

热门文章

山西汉代政治,文化名人及作品

唐装的起源和历史演变

中国古代史阶段特征

中国历史上的汉朝文化发展

[汉代历史简介]汉代历史故事

历史汉代全部知识点总结

汉代经济发展对中国经济史的影响

汉代的文学体裁

汉源名字来历

简述汉代艺术的基本特征和美学风格

汉代文学的风格和特征

汉代陶瓷知识点归纳总结

汉代经济发展与中外贸易

中国古代史完整版

汉代的科学技术与数学发展

汉代的录囚名词解释

汉代对中国文化的影响-概述说明以及解释

汉代的思想大一统知识点

汉学与宋学的名词解释

汉唐文化交融研究

最新文章

3-真题专练-沈阳历史中考中国古代史-材料解析题

历史上对陶渊明的评价

互动训练B—《汉武帝巩固大一统王朝》

汉代耧车的历史价值

红星照耀中国汉代青铜读书笔记

湖南马王堆汉墓的发掘与研究

标签列表