环境为centos 7.4 使用openiscsi 连接浪潮的iscsi存储.
iscsi客户端一开始可以正常工作. 但在工作了几天之后. 其中一小部分服务器会出现故障 . 表现形式为.
- iscsi日志中记录iscsi连接断开. 之后重连. 重复 10次以上. 最后重连成功.不再断.
- 这里iscsi的块设备可以继续读写操作. 但读写性能都降到7Mbytes/s 左右的级别.
- 重连iscsi连接, 性能无变化.
- 断开iscsi连接.删除掉内核中相关模块(包括网卡驱动).再重连iscsi客户端. 性能无变化.
- 重启客户端服务器的操作系统. 性能恢复正常.
- 故障不定期出现. 个别服务器出现得比较多. 有些服务器一直不出现这类问题.
- 故障出现机率很低. 几十台服务器一般也要等1-2周才会出现.
- 多台服务器的故障现像完全相同.
- 出现故障时. 用其它计算机连接存储进行性能测试. 一切正常.
由于是生产服务器. 出现故障的机率也比较低. 判断过程也相对比较复杂.
从各种 现像判断都像是 centos7.4系统中存在软件bug. 最后更换centos7.9进行测试. 一切正常. 同类型的问题没有再次出现过.



