首页 运维干货硬件运维:使用IPMITOOL解决服务器底层维护难题

硬件运维:使用IPMITOOL解决服务器底层维护难题

运维派隶属马哥教育旗下专业运维社区,是国内成立最早的IT运维技术社区,欢迎关注公众号:yunweipai
领取学习更多免费Linux云计算、Python、Docker、K8s教程关注公众号:马哥linux运维

硬件维护工具我常用的就2个:倚天剑ipmitool以及屠龙刀MegaCli。今天我们来介绍Ipmitool。

注意:Ipmitool是针对硬件底层进行操作管理,对于电源相关的操作请三思!

1. IPMI简介

IPMI (intelligent platform management interface)智能平台管理接口是一种开放标准的硬件管理接口规格 ,定义了嵌入式管理子系统进行通信的特方法。 IPMI信息通过基板管理控制器 (BMC)(位于 IPMI规格的硬件组上)进行交流。使用低级智能管理而不使用操作系统 进行管理, 用户可以利用IPMI监视服务器的物理健康状态,如温度、电压、风扇工作状态、电源状态等。硬件维护工具我常用 多久2个,倚天剑ipmitool以及屠龙刀MegaCli。今天我们来介绍ipmitool

2. IPMI优点

  • IPMI 把系统管理软件从系统的硬件平台管理任务中分离出来,并且把底层的服务器管理功能与高层软件分开。这样,推出一个通用的、跨系统的平台管理监控软件就成为可能;
  • IPMI 是可扩展的并且能够快速简单地在其上附加新功能,如增加更多的传感器、管理控制器或特定的配件设备;
  • 在加入IPMI 技术的系统里,CPU 只需要与IPMI 就事件进行通信,形成IPMI 事件记录(Event Log)。在系统上的每个设备直接通过IPMI 与事件记录文件通信,而事件记录文件以统一的方法为每个特定的设备记录所有的事件状态。这一特点进一步简化了代理(Agent)的处理任务,提高了系统的整体运行性能。

3. IPMI工作原理

        IPMI 的核心是基板管理控制器(BMC),其并不依赖于服务器的处理器、BIOS 或操作系统来工作,可谓非常地独立,是一个单独在系统内运行的无代理管理子系统,只要有BMC 与IPMI 固件其便可开始工作,而BMC 通常是一个安装在服务器主板上的独立的板卡,现在也有服务器主板提供对IPMI 支持的。IPMI 良好的自治特性便克服了以往基于操作系统的管理方式所受的限制,例如操作系统不响应或未加载的情况下其仍然可以进行开关机、信息提取等操作。

在工作时,所有的IPMI 功能都是向BMC 发送命令来完成的,命令使用IPMI 规范中规定的指令,BMC 接收并在系统事件日志中记录事件消息,维护描述系统中传感器情况的传感器数据记录。在需要远程访问系统时,IPMI 的SOL 特性很有用。SOL 改变IPMI 会话过程中本地串口传送方向,从而提供对紧急管理服务、Windows 专用管理控制台或Linux 串行控制台的远程访问。BMC 通过在LAN 上改变传送给串行端口的信息的方向来做到这点,提供了一种与厂商无关的远程查看启动、操作系统加载器或紧急管理控制台来诊断和维修故障的标准方式。

4. BMC的功能

  • 系统的串行端口进行访问
  • 故障日志记录和 SNMP 警报发送
  • 访问系统事件日志 (System Event Log ,SEL) 和传感器状况
  • 控制包括开机和关机
  • 独立于系统电源或工作状态的支持
  • 用于系统设置、基于文本公用程序和操作系统控制台的文本控制台重定向

5. BMC工作原理

BMC 基板管理控制器 (baseboard management controller) 的缩写,这是一个在 IPMI结构下提供智能管理的控制器,BMC 因为多集成于主板而得名,系统管理软件对各个被管理器件的管理,都是通过与BMC 通信来实现的。BMC 通过与主板上的不同传感器通信来监视系统是否有严重事件,并在某些参数超出其预置阈值时发出警报和日志事件。BMC 支持工业标准的 Intelligent Platform Management Interface (IPMI) 协议,可以实现远程配置、监测和恢复系统。BMC 芯片就相当于计算机中的中央处理器,通过BMC 芯片上一对SMBus 接口连接网络,用户可通过网络访问实现对远程服务器接管的带外管理(Out-of-band)功能,例如远程接管服务器(Pre-OS),在客户端实现对远程服务器的完全接管;通过RS-232 接口连接Modem,在远程服务器宕机情况下,用户可以通过拨号访问获取SDR、SEL 数据,分析诊断故障原因;BMC 通过IPMB 接口访问模组风扇背板、电源背板等上的SMC,实现对各种背板的温度电压风扇转速等关键参数管理;BMC 通过系统接口(多用SMIC:ServerManagement Interface Chip),实现IPMI 消息传输机制,控制LCD 显示和实现上层软件与底层F/W 通信,实现告警、数据采集。SDR、SEL、FRU(Field Replacement Unit)物理实体可以是做在芯片内的存储体,也可以是外挂的E2PROM。

硬件运维:使用IPMITOOL解决服务器底层维护难题插图硬件运维:使用IPMITOOL解决服务器底层维护难题插图1

BMC 从不同的传感器收集信息,然后可以存到本地的SEL 里面,便于以后查询,也会把重要的信息显示到服务器前面板上面的那个小的LCD 显示器上(需要硬件支持)。同时还能通过网卡(LAN),串口(Serial)、本地(Host)来访问这些信息

6. Ipmitool的实现方式

硬件运维:使用IPMITOOL解决服务器底层维护难题插图2硬件运维:使用IPMITOOL解决服务器底层维护难题插图3

6.1 本地调用系统结构图

硬件运维:使用IPMITOOL解决服务器底层维护难题插图4硬件运维:使用IPMITOOL解决服务器底层维护难题插图5

6.2 远程调用系统结构图

硬件运维:使用IPMITOOL解决服务器底层维护难题插图6硬件运维:使用IPMITOOL解决服务器底层维护难题插图7

6.3 配置本地啊哦做系统支持IPMI

载入系统功能模块(2.6 kernels):

modprobe ipmi_msghandler
modprobe ipmi_si
modprobe ipmi_devintf

注意:必须先载入模块,这样内核才能识别 ipmidev 设备。如果是2.4kernels 载入模块有所区别,请参考文档结尾附录部分。

7. 各品牌服务器对于Ipmitool的支持

如下命令都是在本地调用,如果需要配合远程调用使用,则改为

ipmitool -I lanplus -H $ILO_IP -U $USERNAME -P $PASSWORD XXXXXXXX

硬件运维:使用IPMITOOL解决服务器底层维护难题插图8

8、利用Ipmitool实现linux的SOL串口重定向

这东西功能很强大,相当于把你的CRT或者XShell工具当成显示器,直接接到了需要维护的服务器上,不用跑机房,不用显示器、键盘鼠标神马的,设置好了这个等同于有了千里眼,至于如何设置,请一步步看。

8.1 BMC设置

  • 设置ILO IP(这里我们用DHCP接入DDNS,不做介绍)
  • 设置IPMI Over LAN此次测试机型为DELL R410

    开机按CTRL+E进入BMC设置界面,选择ipmi over lan ,选中 On

硬件运维:使用IPMITOOL解决服务器底层维护难题插图9

设置ILO账号密码 开机按CTRL+E进入BMC设置界面

选择LAN User Configuration->Account User Name [root]/Enter Password [****]/Confirm Password[****]

硬件运维:使用IPMITOOL解决服务器底层维护难题插图10

8.2 设置串口重定向

开机按F2进入BIOS设置,选择Serial Communication,选择On with Console Redirection via COM2

硬件运维:使用IPMITOOL解决服务器底层维护难题插图11

8.3 修改grub配置文件

  • 在主要配置部分添加:serial –unit=0 –speed=57600 –word=8 –parity=no –stop=1

    terminal –timeout=5 serial console

  • kernel后,添加console=ttyS1,115200n8
  • 注释掉splashimage图形显示,否则在字符模式下无法显示菜单 实际效果如下硬件运维:使用IPMITOOL解决服务器底层维护难题插图12

8.4 设置linux参数以允许通过串口登陆

  • 修改/etc/inittab文件激活串口登录参数如下

co2:12345:respawn:/sbin/agetty -L ttyS1 115200 vt100 实际配置完成后脚本如下

硬件运维:使用IPMITOOL解决服务器底层维护难题插图13

  • 修改/etc/securetty以允许root账号从串口登录,新增一行ttyS1

硬件运维:使用IPMITOOL解决服务器底层维护难题插图14

设置完毕,重启服务器生效。

8.5 测试SOL链接

  • 利用ipmitool工具 安装ipmitool工具,执行ipmitool -I lanplus -U $ILO_USER -P $ILO_PW -H $ILO_IP sol activate测试效果

    硬件运维:使用IPMITOOL解决服务器底层维护难题插图15

  • 利用ssh $ILO_IP硬件运维:使用IPMITOOL解决服务器底层维护难题插图16

8.6 测试SOL退出

  • 利用ipmitool工具 输入~.硬件运维:使用IPMITOOL解决服务器底层维护难题插图17

    利用ssh $ILO_IPConnected to Serial Device 2. To end type: ^\

9、坑—客户端无法获取dell机器的mac信息

现象无法远程获取dell机型的mac地址信息

#ipmitool -I lanplus -U $ILO_USER -P $ILO_PW -H $ILO_IP delloem mac get 1

Error in getting MAC Address : Not supported platform

经过多次测试,对比不同服务器的系统版本,ipmitool版本以及,IDRAC固件版本后发现是客户端的ipmitool的版本问题

硬件运维:使用IPMITOOL解决服务器底层维护难题插图18硬件运维:使用IPMITOOL解决服务器底层维护难题插图19

10、坑—SOL重定向出现乱码

现像 在启动的各个阶段都能够正常显示,一到登录界面,就出现乱码,如下图

硬件运维:使用IPMITOOL解决服务器底层维护难题插图20

故障原因:配置不同

/etc/inittab文件配置不同 S0:12345:respawn:/sbin/agetty -L 57600 ttyS1 vt102

/boot/grub/menu.lst文件配置不同 未注释掉splashimage图形显示

11、参考文档

  • http://www.ibm.com/developerworks/cn/linux/l-ipmi/
  • http://blog.csdn.net/zuiaituantuan/article/details/5816380
  • http://www.annhe.net/article-2987.html
  • http://tinytub.github.io/Cobbler-Dell-ipmi.html
  • http://demo.netfoucs.com/xuensong520/article/details/8915945

原文来自微信公众号:余果果园,作者:畅游福州 – 余祥军

本文链接:https://www.yunweipai.com/19236.html

网友评论comments

发表回复

您的电子邮箱地址不会被公开。

暂无评论

Copyright © 2012-2022 YUNWEIPAI.COM - 运维派 京ICP备16064699号-6
扫二维码
扫二维码
返回顶部