第九章 软件可靠性
9.1 基本概念
9.1.1 软件可靠性定义
定义:软件在规定的条件、规定的时间内完成所要求的功能的能力。
- 规定的时间:运行时间被视为随机变量,因为失效是软件运行过程中的随机事件。
- 规定的条件:主要指软件的运行环境,包括硬件平台、操作系统、中间件、输入数据要求等,决定了在这些条件下软件的可靠性。
- 所要求的功能:软件可靠性与其执行的具体任务有关,不同的功能需求会影响软件的可靠性。
软件与硬件的四大不同点:
- 复杂性:软件逻辑复杂,错误多发于设计阶段,而硬件相对简单。
- 物理退化:软件不存在物理退化现象,硬件失效则主要是由于物理退化所致。
- 唯一性:软件复制不改变软件本身,而任何两个硬件不可能绝对相同,所以概率方法适用于硬件可靠性领上。
- 版本更新:软件更新频繁,可靠性评估更具挑战性,而硬件通常保持稳定性。
9.1.2 软件可靠性的定量描述
1.规定时间:使用执行时间来度量可靠性更准确。
- 执行时间:指软件运行过程中CPU执行程序指令所用的时间总和。
2、失效概率F(t)
F(t) 表示软件从运行开始到时间 t时出现失效的累积概率,F(0)=0。在时间域 (0,+∞)上,F(t) 单调递增。F(+∞)=1,即“任何软件都存在缺陷”。
3、可靠度R(t):即不发生失效的概率,R(t)=1-F(t) 。
4、失效强度f(t):单位时间软件系统出现失效的概率,f(t)=F'(t),即失效概率求导。
5、平均失效前时间MTTF:从t=0时到故障发生时系统的持续运行时间的期望值。
6、平均恢复前时间MTTR:就是从出现故障到修复成功的时间,MTTR越短易恢复性越好。
7、平均故障间隔时间:MTBF=MTTF+MTTR
9.1.3 可靠性目标
软件失效的严重程度不仅取决于失效概率,还有失效的严重程度,常按照对成本影响、对系统能力的影响来划分严重程度类。
- 对成本的影响:失效可能导致额外的运行和维护成本、修复与恢复成本、以及由于系统中断而带来的业务损失或客户流失。
- 对系统能力的影响:失效可能影响系统的功能可用性、响应时间、吞吐量等关键性能指标。
可靠性目标
是指客户对软件性能满意程度的期望。通常用可靠度、故障强度和平均失效时间 (MTTF) 等指标来描述,根据不同项目的不同需要而定。
9.1.4 可靠性测试的意义
-
软件失效的潜在灾难性后果: 软件系统的失效可能导致严重后果,例如重大经济损失,危害生命和国家安全。
-
软件失效在系统失效中的高比例: 研究表明,在计算机系统的整体失效中,约有80%与软件有关,完全消除软件缺陷几乎是不可能的。
-
相对硬件可靠性技术的不足: 软件可靠性技术还不够成熟,缺乏标准化的可靠性技术和方法,使软件可靠性问题更加突出。
-
软件费用的增长趋势: 随着硬件元器件成本不断下降,软件费用却在不断上升,主要原因就是软件可靠性问题,维护和修复因软件缺陷而产生的成本,推动了开发和维护预算的增加。
-
对系统和社会的影响日益加深: 计算机技术的广泛应用和软件在应用系统中比例的增加,使得系统对软件的依赖性愈发强烈。软件失效不仅会影响生产和经济活动,还会对社会日常生活造成广泛影响,凸显了软件可靠性的重要性。
9.1.5 广义的可靠性测试与狭义的可靠性测试
1. 广义的软件可靠性测试
广义的软件可靠性测试
是全面评估软件可靠性的一系列步骤,包括目标设定、运行剖面定义、测试用例设计、执行测试、问题分析、模型选择及最终评价。
2.狭义的软件可靠性测试
指在预期使用环境中执行测试,收集可靠性数据,模拟用户实际操作,目的是发现缺陷并验证软件是否达到可靠性要求。
可靠性测试的目的:
- 发现和纠正软件缺陷。
- 提供可靠性数据支持使用和维护。
- 验证软件是否符合可靠性目标。