磨磨的技术博客

暂未分类

发表于2016-01-142024-01-05 暂未分类

在找这个资料的时候，基本没几个能用的或者过时了的，或者是换了概念，做的不是需要的那种盘，只有少数文章有提到关键部分应该怎么去操作，现在还是自己总结一下内存盘tmpfs和ramdisk的区别这个在网上的很多资料里面都有提到，很多文章去写怎么做ramdisk的时候，都是去做的tmpfs，两者虽然都是使用的内存来存储东西，但是是完全有区别的 tmpfs这个只需要mount挂载就可以分配一个目录使用内存了，只是一个目录 ramdisk这个是真的分配一个空间，这个分区是可以格式化的（这个格式化是关键） tmpfs卸载再挂载数据会消失，ramdisk卸载再挂载数据还在二者共同点是，系统重启后，里面的东西会消失本文章主要是讲怎么去做ramdisk ramdisk是依赖于内核模块brd的，首先可以查看下这个模块的信息 12345678910111213[root@lab8106 src]# modinfo brdfilename: /lib/modules/3.10.0-229.el7.x86_64/kernel/drivers/block/brd.koalias: ...

暂未分类

未读

删除osd的正确方式

发表于2016-01-122024-01-05 暂未分类

在ceph的集群当中关于节点的替换的问题，一直按照以前的方式进行的处理，处理的步骤如下：停止osd进程1/etc/init.d/ceph stop osd.0 这一步是停止osd的进程，让其他的osd知道这个节点不提供服务了将节点状态标记为out1ceph osd out osd.0 这个一步是告诉mon，这个节点已经不能服务了，需要在其他的osd上进行数据的恢复了从crush中移除节点1ceph osd crush remove osd.0 从crush中删除是告诉集群这个点回不来了，完全从集群的分布当中剔除掉，让集群的crush进行一次重新计算，之前节点还占着这个crush weight，会影响到当前主机的host crush weight 删除节点1ceph osd rm osd.0 这个是从集群里面删除这个节点的记录删除节点认证（不删除编号会占住）1ceph auth del osd.0 这个是从认证当中去删除这个节点的信息这个一直是我处理故障的节点osd的方式，其实这个会触发两次迁移，一次是在节点osd以后，一个是在crush remove以后，两次迁移对于集群来 ...

暂未分类

未读

ceph写osd的配置文件ceph.conf

发表于2016-01-112024-01-05 暂未分类

ceph在部署过程中是先进行部署，再去写配置文件的，而一些新手在部署完了后，并没有写配置文件，在重启服务器后，因为挂载点没有挂载，所以服务无法启动，所以需要写好配置文件还有一种情况是集群有几百个osd，在新加入或者修改的时候，再去进行变更配置文件就是一个很麻烦的事情，所以写配置文件这个如果脚本来处理，就可以节约很多时间，所以写了一个脚本如下，这个地方如果熟悉python的可以用python写，我这个是自己使用，并且使用的频率不会太高，因此，怎么方便怎么来脚本里面用了一个二进制文件是解析json用的，这个拷贝到运行的机器上就可以了解析的二进制文件在这里下载：http://stedolan.github.io/jq/ 备用下载地址：http://pan.baidu.com/s/1pKgefmr 下载后拷贝到linux机器的/sbin/下面，为了方便重命名为 /sbin/jq 后面的输出可以方便的修改，原理是获取当前的osd状态，然后去osd上获取信息 1234567891011121314151617#! /bin/sh#注意要配合js使用htt ...

暂未分类

未读

centos6安装calamari

发表于2015-12-192024-01-05 暂未分类

安装操作系统首先安装操作系统centos6,安装过程选择的是base server，这个不相同不要紧，出现缺少包的时候去iso找出来安装就可以了 calamari的简单介绍首先简单的介绍下calamari的这个软件系统的组成，主要是calamari-server,romana，salt-minion，salt-server，diamond，这些模块各自的作用： calamari-server这个是提供一个与集群进行交互，并且自己封装了一个自己的API，做集中管理的地方，这个只需要在集群当中的某一台机器上安装，也可以独立安装 romana就是原来的calamari-client，这个叫client,其实是一个web的界面，这个叫calamari-web更好，现在已经更名为romana，这个也是只需要在集群当中的某一台机器上安装，也可以独立安装，这个需要跟calamari-server安装在一台机器上 salt-server是一个管理的工具，可以批量的管理其他的机器，可以对安装了salt-minion的机器进行管理，在集群当中，这个也是跟calamari-server安装在一起的 sa ...

暂未分类

未读

xenserver使用ceph的rbd的方法

发表于2015-12-162024-01-05 暂未分类

首先安装的xenserver6.5的环境，看到有地方有提到这个上面可以安装rbd的支持，网上有一种方式是libvirt+kvm方式，因为ceph对libviet是原生支持的，但是xenserver底层是xen的，这个就不去研究太多，这个用最简单的方式最好 https://github.com/mstarikov/rbdsr这个是个第三方的插件，最近才出来的实现原理是ssh到ceph的机器上获取到可以使用的rbd信息，然后在xenserver的图形界面上通过配置iscsi的方式去配置rbd，里面套用了iscsi的界面，实际去xenserver机器后台同样做的是map的操作这个试了下，界面的操作都可以实现，都可以获取到rbd的信息，但是在最后提交的一下的时候，后台会报错误的信息，这个有可能才出来，还有点问题这个地方可以用其他的方式实现，xenserver在添加硬盘的时候本来就支持的命令行模式，下面为实现方式先检查内核的信息，这个有rbd模块，并且用的是3.10的，这个是用的centos7同等的内核，问题不大 1234567891011[root@xenserver ]# modinfo ...

暂未分类

未读

如何在所有的mon的损坏情况下将数据恢复如初

发表于2015-12-132024-01-05 暂未分类

本篇主题在mon无法启动，或者所有的mon的数据盘都损坏的情况下，如何把所有的数据恢复如初写本章的缘由在ceph中国的群里有看到一个技术人员有提到，在一次意外机房掉电后，三台mon的系统盘同时损坏了，这个对于熟悉ceph的人都知道这意味着什么，所有的集群数据将无法访问，关于这个的解决办法目前没有在哪里有看到，这个对于大多数人是用不上的，但是一旦出现了，这个损失将是无法估量的，当然谁都不希望这个情况的发生所以在研究了下ceph的一些操作后，自己尝试去找了一些关于集群的故障修复的，目前看到了一个是关于单个rbd镜像的恢复的文章，那个需要将数据映射本地的loop设备后重新读取，这个我曾经验证过一遍，确实可以实现，在周末的时候我尝试了另外一个办法，实现了在mon完全失效的情况下全集群的完整数据的恢复，并且保留了原来的数据结构和数据信息，当然这中间需要进行一定的操作去完成它，这个我准备写成一个标准的操作流程，并用视频的方式来记录这个恢复的流程

暂未分类

未读

ceph集群的安装和配置教程

发表于2015-12-122024-01-05 暂未分类

本篇主题： 1、怎样配置ssh免登陆访问 2、为什么搭建集群要关闭防火墙和selinux，如何关闭 3、从哪里获取ceph的安装包，怎样安装才是快速正确的 4、为什么要配置时间同步服务，怎样配置 5、怎样创建集群 6、怎样使用不同的方式增加osd（这里我总结了五种）默认方式磁盘journal 目录配置方式 btrfs文件系统 disk+ssd方式 7、怎样配置文件系统 8、怎样配置块设备系统 9、怎样配置S3服务 10、如何干净的将集群清理到初始状态（本篇基于centos7,其他系统除了安装方式其他通用）本篇资源:包括了视频，操作文档，相关安装包资源，S3的windows客户端付费资源有需要联系

暂未分类

未读

在线调整ceph的参数

发表于2015-11-182024-01-05 暂未分类

能够动态的进行系统参数的调整是一个很重要并且有用的属性ceph的集群提供两种方式的调整，使用tell的方式和daemon设置的方式一、tell方式设置调整配置使用命令：调整mon的参数1#ceph tell mon.* injectargs '--{tunable value_to_be_set}' 调整osd的参数1#ceph tell osd.* injectargs '--{tunable value_to_be_set}' 调整mds的参数1#ceph tell mds.* injectargs '--{tunable value_to_be_set}' 例子： 12[root@lab5134 ~]# ceph tell mon.* injectargs '--mon_osd_report_timeout 400'injectargs:mon_osd_report_timeout = '400' 除了上面的tell的 ...

暂未分类

未读

验证rbd的缓存是否开启

发表于2015-11-162024-01-05 暂未分类

简单快速的在客户端验证rbd的cache是否开启首先修改配置文件在ceph.conf中添加： 123[client]rbd cache = truerbd cache writethrough until flush = true 开启以后，在这台机器上进行测试 1234[root@node8109 ~]# rbd -p rbd bench-write zp --io-size 4096 --io-threads 256 --io-total 102400000 --io-pattern seqbench-write io_size 4096 io_threads 256 bytes 102400000 pattern seq SEC OPS OPS/SEC BYTES/SECelapsed: 0 ops: 25000 ops/sec: 26830.05 bytes/sec: 109895890.09 可以看到io达到了26830每秒下面进行关闭后再测试： 1234567[root@node8109 ~]# rbd -p rbd ...

暂未分类

未读

如何删除一台OSD主机

发表于2015-11-122024-01-05 暂未分类

在ceph的一台OSD主机出现故障的时候，数据可以通过副本的机制进行恢复，之后通过删除osd的操作也能够将故障osd从osd tree当中删除掉，但是故障的 osd 的主机仍然会留在集群当中，通过 ceph osd tree 或者打印 crush map 都可以看到这个损坏的节点主机名，所以这里讲下怎么删除掉这个无用的host 首先集群环境为两台主机 node8109 node8110 , node8110主机出现故障需要清理掉先看下当前的osd tree状态12345678910[root@node8109 webui]# ceph osd treeID WEIGHT TYPE NAME UP/DOWN REWEIGHT PRIMARY-AFFINITY -1 4.00000 root default -3 4.00000 rack localrack -2 2.00000 ...

zphj1987