glusterfs运维经验：挑战与解决方案

需积分: 0 167 浏览量更新于2024-08-05 收藏 167KB PDF 举报

"glusterfs运维经验分享，包括挂载掉线和brick进程异常的问题分析及解决方案" 在深入探讨glusterfs运维过程中遇到的问题及其解决策略之前，首先要理解glusterfs作为一个分布式文件系统的重要性。它提供了高可用性和可扩展性，广泛应用于大规模存储环境。然而，随着版本的快速迭代，新功能的引入也可能带来新的挑战。本文主要讨论两个运维过程中遇到的实际问题：挂载突然掉线和brick进程异常。 1) 挂载突然掉线这个问题在使用k8s+glusterfs+heketi的组合时尤为突出。当挂载点显示"transportendpointisnotconnected"时，尽管volume状态正常，但容器pod已无法进行读写操作。经过分析，这可能是由于一个版本bug导致的，即文件句柄未正确管理，可能会导致仍在使用的连接被意外销毁。该问题在glusterfs 7.7之前的版本中存在。为避免此问题，可以考虑升级到7.7或更高版本，或者关闭open-behind参数，以此作为临时解决方案。参考资料：Issue 1225文档详细解释了这个问题的原因和解决方案。 2) brick进程异常关闭在尝试将minio部署到k8s并使用glusterfs作为底层存储时，有时会发现brick进程异常关闭，日志中出现"Shutting down connection"的信息。此问题最初被认为是客户端触发的，但在客户端日志中并未找到相应记录。经过与官方沟通，确认这是一个遗留问题。此外，minio官方的issue中也有用户报告类似情况，但具体复现条件尚不清楚，使得问题的定位和修复变得困难。为了应对这些问题，运维人员需要保持对glusterfs新版本的关注，及时升级以获得修复和改进。同时，建立完善的监控和日志分析机制至关重要，以便快速发现并解决问题。在规划和设计glusterfs集群时，应充分考虑稳定性、兼容性以及与应用的适配性，以降低故障发生的风险。总结，glusterfs虽然在分布式存储领域表现出色，但其运维工作并非易事。面对版本更新带来的挑战，运维人员需要不断学习，跟踪社区动态，以及充分利用官方文档和社区资源来解决问题。此外，对于潜在的bug和已知问题，提前预防和制定应急方案是保障生产环境稳定的关键。

221

6. 第六章运维之路

6.1. 难受的运维经历

对于 glusterfs 的使用，在生产环境中使用的版本是 7.5,而到了写下这段话的时候，目

前最新的版本已经是 9.2 了,短短的一两年时间内,glusterfs 的版本迭代非常的迅速，同时

也有了很多的优化改进，而因为生产环境的追求稳定，加上当时对 glusterfs 的熟悉程度不

够，还有使用场景的特殊性，遇到了很多惨痛的生产环境问题和棘手的需求，下面分享其中

一些故事和事故，希望能够给大家在日常运维使用过程中规避一些问题。同时如果你是准备

使用 glusterfs，那么能够很好地规划与设计集群的使用。

1) 挂载突然掉线

这个问题是当时生产环境在使用 k8s+glusterfs+heketi 的时候遇到的，时不时会出

现挂载掉线的问题，挂载点提示 transport endpoint is not connected,而容器 pod 也并

不会因为这个而重启，并且已经无法正常读写数据了，但是这时候 volume 状态是正常的。

后来通过排查日志和官方的 issue 发现，这里是因为存在了一个版本 bug 导致的，这

里出现问题的原因是以前实现的时候，文件句柄在使用时并没有添加引用到 fd_t 这个结构

中，导致可能还在被使用的连接被销毁。这个问题如果感兴趣的话，可以查看 issude 为

1225 的文档

[1]

，这里给出了相关的内容。

这个问题在 7.7 以前的版本中会存在，对于旧版本的集群，可以通过关闭 open-behind

这个参数来进行规避。

2) brick 进程突然收到关闭信号

这个问题是一个很有趣的问题，当时是计划打算把 minio 放到 k8s 中运行，然后底层

下载后可阅读完整内容，剩余6页未读，立即下载

老许的花开

粉丝: 33
资源: 328

glusterfs运维经验：挑战与解决方案

glusterfs安装包-centos6.6

glusterfs-server-7.9-1.el7.x86_64.rpm

glusterfs-fuse-7.9-1.el7.x86_64.rpm

错误:软件包:glusterfs-api-6.0-61.el7.x86_64 (updates)

glusterfs-api-6.0-56.4.el8.x86_64.rpm

glusterfs-fuse-6.0-37.el7.x86_64.rpm

glusterfs.tar.gz

OpenStack-mitaka部署（手把手一步一步教你搭建）

1基于STM32的智能气象站项目.docx

技术资料分享SH-HC-05蓝牙模块技术手册很好的技术资料.zip

最新资源