GlusterFS实战

预装glusterfs软件包

yum -y install centos-release-gluster37.noarch

yum --enablerepo=centos-gluster*-test install glusterfs-server glusterfs-cli glusterfs-geo-replication

1.理论基础

1.1 分布式文件系统的出现

  计算机通过文件系统存储数据

  分布式文件系统可以有效解决数据存储和管理的难题,将固定于某个地点的文件系统,扩展到任意多个地点,只有

有网络的地方就可以访问

1.2典型代表NFS

  NFS及网络文件系统

  1,节约磁盘空间

  2,节约硬件资源

  3,用户目录设定

1.3面临的问题

  存储空间不足,需要更大容量的存储

  有一定风险,存在单点故障

  某些场景不能满足要求,大量的访问磁盘IO是瓶颈

1.4GlusterFS概述

  GlusterFS是Scale-Out存储解决方案Gluster的核心,它是一个开源的分布式文件系统,具有强大的横向扩展能力

,通过扩展能够支持数FB存储容量和处理数千客户端。GlusterFS借助TCP/IP或InfiniBand RDMA网络将物理分布的存

储资源聚集在一起,使用单一全局命名空间来管理数据。

1.5GlusterFS在企业的应用场景

  GlusterFS目前主要适用大文件存储场景,对于小文件尤其是海量小文件,存储效率和访问性能表现不佳。海量小文件LOSF问题是工业界和学术界公认的难题,GlusterFS作为通用的分布式文件系统,并没有对小文件做额外的优化措施,性能

不好也是可以理解的。

    Media

    - 文档,图片,音频,视频

   Shared storage  

    - 云存储,虚拟化存储,HPC(高性能运算)

   Big data

    - 日志文件,数据

2.GlusterFS安装

2.1GlusterFS安装前准备

虚拟机(CentOS6.5)数台

关闭iptables和selinux

修改主机名

10.0.0.153 mystorage1

10.0.0.154 mystorage2

修改hosts添加解析

2.2安装

yum -y install centos-release-gluster37.noarch

PS:如果是centos7则可以先使用yum list|grep gluster查看最新的版本然后再安装

  使用CentOS7.4需要安装yum -y install centos-release-gluster39.noarch否则在下一步安装的时候会报依赖错误

yum --enablerepo=centos-gluster*-test install glusterfs-server glusterfs-cli glusterfs-geo-replication

2.3启动(CentOS6和7启动命令不同)

启动:/etc/init.d/glusterd start

停止:/etc/init.d/glusterd stop

查看版本

glusterfs -V

2.3存储主机加入存储池

 gluster peer probe 10.0.0.154

PS:在其中一台主机操作即可,其次这里需要使用IP不能使用主机名,使用主机名可能会导致挂载不成功报错为Mount failed. Please check the log file for more details

查看主机状态

gluster peer  status

第一台主机查看

可以看到有一台IP是另外一台主机的IP 状态是连接状态

 

第二台主机查看

安装xfs支持包(centos7系统不需要安装,ext4也可以,大容量需要xfs) 

yum -y install xfsprogs

新加一块数据盘(可以不分区直接格式化)

mkfs.xfs /dev/sdb

建立挂载的目录

mkdir -p /storage/brick1/

挂载

mount /dev/sdb /storage/brick1/

自动挂载

创建volume及其他操作

分布式卷,复制式卷,条带式卷,分布式条带卷,分布式的复制卷

创建分布卷

gluster volume create gv1 10.0.0.153:/storage/brick1 10.0.0.154:/storage/brick1 force

启动卷

gluster volume start gv1

查看状态

gluster volume info(两台机器都能看到)

挂载

mount -t glusterfs 127.0.0.1:/gv1 /mnt

PS:对应glusterfs客户端需要安装支持glusterfs文件的软件才能挂载

 mount -t glusterfs 192.168.0.13:/gv1 /mnt

测试分布式

在期中一台机器的mnt什么随便创建几个文件在另外一台机器能看见

在挂载的目录一次性创建10个文件

touch {1..10}

节点1的挂载目录

节点2的挂载目录

PS:分布式卷创建文件将分别在各个节点上面,假如一个节点宕机该节点存储的文件将暂时无法访问,所以在生产中一般不适应分布式卷而使用分布式复制卷

   挂载以后如果gluster宕掉,只要不卸载挂载对挂载不影响,如果卸载了重新挂载那么宕机的那台服务器存储的文件将无法访问,如果是分布式复制卷则没影响

也可以使用NFS方式挂载

创建分布式复制卷

再分别新加一块硬盘(15G)

格式化,挂载

mkfs.xfs /dev/sdc

mount /dev/sdc /storage/brick2/

gluster volume create gv2 replica 2 10.0.0.153:/storage/brick2/ 10.0.0.154:/storage/brick2 force

 查看信息

启动gluster volume start gv2

mount -t glusterfs 127.0.0.1:/gv2 /opt

同样在其中一台/opt创建文件在另外一台可以同步

PS:分布式复制卷在节点各复制一份完整文件

创建分布式条带卷

在新加一块硬盘

mkfs.xfs /dev/sdd
mkdir -p /storage/brick3
mount /dev/sdd /storage/brick3/
gluster volume create gv3 stripe 2 10.0.0.153:/storage/brick3/ 10.0.0.154:/storage/brick3/ force

gluster volume start gv3

新建一个文件夹用于挂载

mount -t glusterfs 127.0.0.1:/gv3 /gv3/

在gv3创建文件测试

dd if=/dev/zero bs=1024 count=10000 of=/gv3/10M.file

dd if=/dev/zero bs=1024 count=20000 of=/gv3/20M.file

然后在到原始的挂载目录可以看到文件大小平分了

同理gv2是复制卷就没有切片

添加卷(需要停止原来的卷,添加完重新启动并挂载)

新加卷以后文件还会存储在旧的节点上面,需要做磁盘平衡

gluster volume rebalance gv2 start

移除brick(工作中使用少,复制卷需成对移除)

删除卷

先停止再删除

gluster volume stop gv1

gluster volume delete gv1

3,构架企业级分布式存储

3.1 硬件需求

一般选择2U,STAT磁盘,如果I/O要求比较高可以选择ssd硬盘,磁盘阵列卡,推荐raid10

企业一般使用分布式复制卷,不使用条带卷

GlusterFS文件系统优化

 

排错:

  分布式复制卷

  使用mount挂载gluster卷不成功提示为Mount failed. Please check the log file for more details

  原因:开始使用同样的磁盘做了分布卷,然后删除分布卷再重新创建分布式复制卷,可能原因是重装时新建的卷组和逻辑卷,导致分区后主机的uuid变了

  解决办法:两个节点卸载挂载umount /storage/brick1/

       把主机移除存储池gluster  peer detach 192.168.0.14

        重新加入存储池gluster peer probe 192.168.0.14

       两个节点挂载mount /dev/vda /storage/brick1/

       按照相同的步骤创建分布式复制卷

原文地址:https://www.cnblogs.com/minseo/p/6919421.html