CN115666097A - 机房温度控制方法及装置、存储介质及电子设备 - Google Patents
机房温度控制方法及装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN115666097A CN115666097A CN202211383986.6A CN202211383986A CN115666097A CN 115666097 A CN115666097 A CN 115666097A CN 202211383986 A CN202211383986 A CN 202211383986A CN 115666097 A CN115666097 A CN 115666097A
- Authority
- CN
- China
- Prior art keywords
- cabinet
- equipment
- temperature
- hot spot
- hotspot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 158
- 238000005057 refrigeration Methods 0.000 claims abstract description 34
- 230000008569 process Effects 0.000 claims description 35
- 238000001816 cooling Methods 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 22
- 238000001514 detection method Methods 0.000 claims description 21
- 230000002159 abnormal effect Effects 0.000 claims description 18
- 238000007689 inspection Methods 0.000 abstract description 24
- 230000000694 effects Effects 0.000 abstract description 12
- 230000005856 abnormality Effects 0.000 description 29
- 238000013515 script Methods 0.000 description 26
- 238000007726 management method Methods 0.000 description 12
- 238000012423 maintenance Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000004378 air conditioning Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 4
- 230000003862 health status Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000013021 overheating Methods 0.000 description 2
- 238000007789 sealing Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Air Conditioning Control Device (AREA)
Abstract
本发明提供了一种机房温度控制方法及装置、存储介质及电子设备,该方法包括:确定多个机房模块,每个机房模块包括多个机柜,每个机柜中部署有多个设备;确定每个设备对应的设备进风温度和部件温度集合,并据此判断每个设备是否符合设备局部热点条件,判断每个机柜是否符合机柜局部热点条件,将符合条件的设备作为热点设备,将符合条件的机柜作为热点机柜;对热点设备进行设备异常检查,获得异常检查结果;依据热点设备的异常检查结果对其进行异常处理,以降低设备运行温度;通过预设的制冷系统,对每个热点机柜进行降温处理,实现温度控制。应用本发明的方法,当设备存在高温趋势时,可及时识别出局部热点并进行处理,可改善温度控制效果。
Description
技术领域
本发明涉及设备运维技术领域,特别是涉及一种机房温度控制方法及装置、存储介质及电子设备。
背景技术
数据中心的机房是企业数据处理设备和电子通讯设备的工作场所,其热负荷较大,故需要常年对机房进行温度调节,使其处于适宜的温度。机房中通常部署有空调系统,普遍的温度控制方法即为通过空调系统检测机房环境温度,基于环境温度调节制冷效果,以实现温度控制。
而机房内部的温度分布实际上是不均匀的,温度过高的局部区域称为局部热点,局部热点容易给数据中心的运行带来不良影响,故处理局部热点亦成为了机房温度控制的关键之一。在考虑局部热点的场景下,现有的机房温度控制方式,通常是通过机柜的进风温度识别是否存在局部热点,以此调节空调系统的制冷效果,以消除局部热点,实现机房温度控制。
经发明人研究发现,局部热点的热量根源常常是IT设备,在现有的机房温度控制方式中,基于机柜的进风温度进行局部热点处理,而机柜的进风温度往往低于IT设备的温度,当IT设备存在高温或高温趋势时,难以及时识别出局部热点,温度控制效果较差。
发明内容
有鉴于此,本发明实施例提供了一种机房温度控制方法,以解决现有机房温度控制的方式,以机柜进风温度为依据,难以及时识别IT设备为热源的局部热点,温度控制效果较差的问题。
本发明实施例还提供了一种机房温度控制装置,用以保证上述方法实际中的实现及应用。
为实现上述目的,本发明实施例提供如下技术方案:
一种机房温度控制方法,包括:
在需要对机房进行温度控制的情况下,确定所述机房对应的多个机房模块,每个所述机房模块包括多个机柜,每个所述机柜中部署有多个设备;
对于每个所述机柜中部署的每个设备,确定当前该设备对应的设备进风温度以及该设备对应的部件温度集合,该部件温度集合包括该设备对应的多个设备部件温度;
对于每个所述机柜中部署的每个设备,依据该设备对应的部件温度集合,判断该设备是否符合预设的设备局部热点条件,若该设备符合所述预设的设备局部热点条件,则将该设备确定为热点设备;
对于每个所述机柜,依据该机柜中部署的每个设备所对应的设备进风温度,判断该机柜是否符合预设的机柜局部热点条件,若该机柜符合所述预设的机柜局部热点条件,则将该机柜确定为热点机柜;
依据预设的设备检测策略,对每个所述热点设备进行设备异常检查,获得每个所述热点设备对应的异常检查结果;
对于每个所述热点设备,依据该热点设备对应的异常检查结果,对该热点设备进行异常处理,使该热点设备处于正常运行状态,以降低该热点设备的运行温度;
通过预设的制冷系统,对每个所述热点机柜进行降温处理,以降低每个所述热点机柜的环境温度,完成本次温度控制过程。
上述的方法,可选的,所述确定当前该设备对应的设备进风温度以及该设备对应的部件温度集合,包括:
确定该设备对应的设备型号;
在预设的多个设备温度采集指令中,确定所述设备型号对应的目标设备温度采集指令;每个所述设备温度采集指令为基于智能平台管理接口设置的硬件管理接口操作指令;
依据所述目标设备温度采集指令,创建该设备对应的设备温度采集任务;
执行所述设备温度采集任务,获得该设备对应的设备温度采集结果;
在所述设备温度采集结果中,获取该设备对应的设备进风温度;
在所述设备温度采集结果中,获取该设备对应的多个设备部件温度,将该设备对应的多个设备部件温度组成该设备对应的部件温度集合。
上述的方法,可选的,所述依据该设备对应的部件温度集合,判断该设备是否符合预设的设备局部热点条件,包括:
对于该设备对应的部件温度集合中的每个设备部件温度,确定该设备部件温度对应的部件温度阈值,并判断该设备部件温度是否大于其对应的部件温度阈值,若该设备部件温度大于其对应的部件温度阈值,则将该设备部件温度确定为目标设备部件温度;
判断该设备对应的部件温度集合中是否存在所述目标设备部件温度,若该设备对应的部件温度集合中存在所述目标设备部件温度,则确定该设备符合所述预设的设备局部热点条件。
上述的方法,可选的,所述依据该机柜中部署的每个设备所对应的设备进风温度,判断该机柜是否符合预设的机柜局部热点条件,包括:
对于该机柜中部署的每个设备,确定该设备对应的设备进风温度阈值,并判断该设备对应的设备进风温度是否大于所述设备进风温度阈值,若该设备对应的设备进风温度大于所述设备进风温度阈值,则将该设备确定为该机柜对应的局部热点设备;
判断该机柜中是否存在所述局部热点设备,若该机柜中存在所述局部热点设备,则确定该机柜符合所述预设的机柜局部热点条件。
上述的方法,可选的,所述通过预设的制冷系统,对每个所述热点机柜进行降温处理,包括:
在所述预设的制冷系统包含的多个地板风口中,确定每个所述热点机柜对应的地板风口;
对于每个所述热点机柜,确定该热点机柜对应的局部热点设备所对应的设备位置,并依据该局部热点设备对应的设备位置和设备进风温度,确定该热点机柜对应的地板风口所对应的出风信息,该出风信息包括出风方向和出风量;
依据每个所述热点机柜对应的地板风口所对应的出风信息,生成制冷调节指令;
将所述制冷调节指令发送给所述预设的制冷系统,使所述预设的制冷系统对每个所述热点机柜对应的地板风口进行出风控制,以对每个所述热点机柜进行降温处理。
上述的方法,可选的,还包括:
确定每个所述机柜对应的机柜进风温度;
对于每个所述机房模块,依据该机房模块包括的每个机柜所对应的机柜进风温度,判断该机房模块是否符合预设的模块局部热点条件,若该机房模块符合所述预设的模块局部热点条件,则将该机房模块确定为热点模块;
通过所述预设的制冷系统,对每个所述热点模块进行降温处理,以降低每个所述热点模块的环境温度。
上述的方法,可选的,所述依据该机房模块包括的每个机柜所对应的机柜进风温度,判断该机房模块是否符合预设的模块局部热点条件,包括:
对于该机房模块包括的每个机柜,判断该机柜对应的机柜进风温度是否大于预设的模块温度阈值,若该机柜对应的机柜进风温度大于所述预设的模块温度阈值,则将该机柜确定为局部热点机柜;
判断该机房模块包括的各个机柜中是否存在所述局部热点机柜,若该机房模块包括的各个机柜中存在所述局部热点机柜,则确定该机房模块符合所述预设的模块局部热点条件。
一种机房温度控制装置,包括:
第一确定单元,用于在需要对机房进行温度控制的情况下,确定所述机房对应的多个机房模块,每个所述机房模块包括多个机柜,每个所述机柜中部署有多个设备;
第二确定单元,用于对于每个所述机柜中部署的每个设备,确定当前该设备对应的设备进风温度以及该设备对应的部件温度集合,该部件温度集合包括该设备对应的多个设备部件温度;
第一判断单元,用于对于每个所述机柜中部署的每个设备,依据该设备对应的部件温度集合,判断该设备是否符合预设的设备局部热点条件,若该设备符合所述预设的设备局部热点条件,则将该设备确定为热点设备;
第二判断单元,用于对于每个所述机柜,依据该机柜中部署的每个设备所对应的设备进风温度,判断该机柜是否符合预设的机柜局部热点条件,若该机柜符合所述预设的机柜局部热点条件,则将该机柜确定为热点机柜;
异常检查单元,用于依据预设的设备检测策略,对每个所述热点设备进行设备异常检查,获得每个所述热点设备对应的异常检查结果;
异常处理单元,用于对于每个所述热点设备,依据该热点设备对应的异常检查结果,对该热点设备进行异常处理,使该热点设备处于正常运行状态,以降低该热点设备的运行温度;
降温处理单元,用于通过预设的制冷系统,对每个所述热点机柜进行降温处理,以降低每个所述热点机柜的环境温度,完成本次温度控制过程。
一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如上述的机房温度控制方法。
一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如上述的机房温度控制方法。
基于上述本发明实施例提供的一种机房温度控制方法,包括:确定机房对应的多个机房模块,每个机房模块包括多个机柜,每个机柜中部署有多个设备;确定每个设备对应的设备进风温度以及部件温度集合,每个设备对应的部件温度集合包括该设备对应的多个设备部件温度;依据每个设备对应的部件温度集合,判断每个设备是否符合预设的设备局部热点条件,并将符合设备局部热点条件的设备确定为热点设备;依据每个机柜中部署的各个设备所对应的设备进风温度,判断每个机柜是否符合预设的机柜局部热点条件,并将符合机柜局部热点条件的机柜确定为热点机柜;依据预设的设备检测策略,对每个热点设备进行设备异常检查,获得每个热点设备对应的异常检查结果;对于每个热点设备,依据其对应的异常检查结果进行异常处理,使该热点设备处于正常运行状态,以降低设备运行温度;通过预设的制冷系统,对每个热点机柜进行降温处理,以降低每个热点机柜的环境温度。应用本发明实施例提供的方法,可基于机柜中设备的进风温度和部件温度识别是否存在局部热点,对于设备进风温度关联的局部热点和部件温度关联的局部热点,可分别进行针对性的处理。局部热点的识别基于设备的相关温度,当设备存在高温或高温趋势时,可以及时识别出局部热点,及时进行温度控制,消除或减少局部热点,将机房温度控制在适宜范围内,温度控制效果较好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种机房温度控制方法的方法流程图;
图2为本发明实施例提供的一种IT设备局部热点的示意图;
图3为本发明实施例提供的一种机柜局部热点的示意图;
图4为本发明实施例提供的一种模块局部热点的示意图;
图5为本发明实施例提供的一种机房温度控制过程的示例图;
图6为本发明实施例提供的一种机房温度控制过程的又一示例图;
图7为本发明实施例提供的一种机房温度控制装置的结构示意图;
图8为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,消除局部热点是机房温度控制的目标之一。在实际场景中,通常是由于不同设备的加热功率、业务负载不同,功率大、负载高的设备通常会处于较高的运行温度,若将这些设备放置在局部区域,则容易造成机房局部区域过热,导致一些设备因过热出现硬件损坏或停机等严重问题。在传统的数据中心运维过程中,判断是否存在机房局部热点时,一般只考虑机房环境温度,关注机柜进风温度,但机柜进风温度往往要低于设备的相关温度,因此难以及时识别出局部热点。其次,目前通常是以降低空调温度、优化气流组织等方式处理局部热点。而若由于设备自身部件故障或所部署业务负载较高等原因,使得设备本身或其周围发热量高,传统的处理局部热点的方式对此往往治标不治本,难以取得良好的温度控制效果。
因此,本发明实施例提供了一种机房温度控制方法,通过采集设备的相关温度,识别是否存在局部热点,进行针对性处理,可及时识别出局部热点,改善温度控制效果。
本发明实施例提供了一种机房温度控制方法,所述方法可应用于机房温度控制系统,其执行主体可以为系统的服务器,所述方法的方法流程图如图1所示,包括:
S101:在需要对机房进行温度控制的情况下,确定所述机房对应的多个机房模块,每个所述机房模块包括多个机柜,每个所述机柜中部署有多个设备;
本发明实施例提供的方法中,将数据中心的机房划分为多个机房模块,机房模块指的是存放具体一组机柜的机房物理空间,每个机房模块中包括多个机柜,而每个机柜中部署有多个设备,所述设备为IT设备,例如服务器、交换机、路由器等等。
S102:对于每个所述机柜中部署的每个设备,确定当前该设备对应的设备进风温度以及该设备对应的部件温度集合,该部件温度集合包括该设备对应的多个设备部件温度;
本发明实施例提供的方法中,针对机房中的每个设备(即每个机房模块中每个机柜上的每个设备)进行温度采集,获得当前每个设备对应的设备进风温度和部件温度集合。设备上部署有进风口和出风口,设备对应的设备进风温度为该设备的进风口的空气温度。设备对应的部件温度集合中包括该设备的各个设备零部件的温度,即设备部件温度指的是设备零部件的温度,设备零部件包括CPU、硬盘、内存等等。
S103:对于每个所述机柜中部署的每个设备,依据该设备对应的部件温度集合,判断该设备是否符合预设的设备局部热点条件,若该设备符合所述预设的设备局部热点条件,则将该设备确定为热点设备;
本发明实施例提供的方法中,根据实际需求预先设置了设备局部热点条件,设备局部热点条件中定义了当设备对应的部件温度集合满足怎样的条件时,视为存在设备维度的局部热点。例如,设定部件均值阈值,当部件温度集合中的各个设备部件温度的均值超过部件均值阈值时,视为满足条件。又如设定温度最大值,当部件温度集合中温度值最高的设备部件温度超过预设的温度最大值时,视为满足条件。需要说明的是,在具体的实现过程中,可以根据实际需求设置设备局部热点条件,不影响本发明实施例提供的方法实现功能。
本发明实施例提供的方法中,针对机房中每个设备对应的部件温度集合,判断其是否与设备局部热点条件的条件内容相匹配,若匹配,则判定相应的设备符合设备局部热点条件。当设备符合设备局部热点条件时,将该设备视为热点设备,也就是认为该设备存在局部热点。
S104:对于每个所述机柜,依据该机柜中部署的每个设备所对应的设备进风温度,判断该机柜是否符合预设的机柜局部热点条件,若该机柜符合所述预设的机柜局部热点条件,则将该机柜确定为热点机柜;
本发明实施例提供的方法中,根据实际需求预先设置了机柜局部热点条件,机柜局部热点条件中定义了当机柜中设备的设备进风温度满足怎样的条件时,视为存在机柜维度的局部热点。例如,设定设备均值阈值,当机柜中各个设备的设备进风温度的均值超过设备均值阈值时,视为满足条件等等。需要说明的是,在具体的实现过程中,可以根据实际需求设置机柜局部热点条件,不影响本发明实施例提供的方法实现功能。
本发明实施例提供的方法中,针对机房中的每个机柜(即每个机房模块中的每个机柜),判断机柜中各个设备的设备进风温度是否与机柜局部热点条件的条件内容相匹配,若匹配,则判定该机柜符合机柜局部热点条件。当机柜符合机柜局部热点条件时,将该机柜视为热点机柜,也就是认为该机柜存在局部热点。
S105:依据预设的设备检测策略,对每个所述热点设备进行设备异常检查,获得每个所述热点设备对应的异常检查结果;
本发明实施例提供的方法中,根据实际需求预先设置有设备检测策略,包括针对设备的多项检测的脚本,设备检测策略中的检测项可以包括硬件健康状态检查、功耗查询、CPU负载检查、内存负载检查、硬盘带宽检查、网卡流量检查等。对于每个热点设备,可依据预设的设备检测策略,对其进行异常检查,得到其对应的异常检查结果,异常检查结果中可以包括各项检测内容的检查结果。
S106:对于每个所述热点设备,依据该热点设备对应的异常检查结果,对该热点设备进行异常处理,使该热点设备处于正常运行状态,以降低该热点设备的运行温度;
本发明实施例提供的方法中,预先设置有各类检查项的异常处理脚本。根据每个热点设备的异常检查结果,确定每个热点设备对应的异常检查项,异常检查项指的是检查结果为异常的检查项。对于每个热点设备,调用其对应的异常检查项所对应的异常处理脚本,对该热点设备进行异常处理。异常处理脚本可以是直接进行处理操作的脚本,可直接消除异常状态,使热点设备恢复正常运行。针对无法自动处置的检查项,其对应的异常处理脚本可以是对异常结果进一步进行核查,并根据核查结果向运维人员发送处置提示,以使运维人员进行处理异常,使设备恢复正常状态。当热点设备处于正常的运行状态后,其各设备部件的发热量应处于正常范围,故可降低热点设备的运行温度。
本发明实施例提供的方法中,异常处理的内容具体可以包括:
检查发现硬件故障,调用脚本生成维修建议(根据硬件冗余情况,确定是否停机维修、停机多久、如何维修等);
检查发现设备功耗过高,调用脚本查询设备过去一月的功耗数据,并检测是否存在异常值,发出提示;
检查发现CPU负载较高,调用脚本检查并关闭异常进程、调用脚本开启超频提高性能;
检查发现内存负载较高,调用脚本查找占用内存较大的程序进程,根据查找结果,脚本自动设置回收时间、内存最大使用值和共用进程池,以此减少内存的占用;
检查发现硬盘带宽过高,调用脚本获取硬盘SMART日志,检查是否为隐性坏盘,并发出是否为隐性坏盘结果;
检查发现网卡流量过高,调用脚本检查是否存在异常流量,并发出是否有异常流量的结果;
调取过去一段时间的记录,确定该设备是否一直存在局部热点,若是,则发出处置建议,包括:优化应用部署方式、加装散热单元等。
需要说明的是,本发明实施例中提及的具体检查项和异常处理内容,仅为更好地说明本发明实施例提供的方法所提供的具体实施例,在具体的实现过程中,具体的检查项和异常处理的方式可以根据实际的需求设置,不影响本发明实施例提供的方法实现功能。
S107:通过预设的制冷系统,对每个所述热点机柜进行降温处理,以降低每个所述热点机柜的环境温度,完成本次温度控制过程。
本发明实施例提供的方法中,机房中预先部署有制冷系统,也就是空调系统,机房温度控制系统可与制冷系统进行通信,机房温度控制系统可基于每个热点机柜的相关信息(如位置),触发制冷系统调节相应的制冷设备(如风机、风口等)的运行状态,改变制冷效果,针对每个热点机柜所处环境进行降温处理,由此降低每个热点机柜的环境温度。
基于本发明实施例提供的方法,确定机房对应的多个机房模块,每个机房模块包括多个机柜;确定每个机柜中部署的每个设备对应的设备进风温度和部件温度集合;依据每个设备对应的部件温度集合判断其是否符合预设的设备局部热点条件,将符合条件的设备视为热点设备;依据每个机柜中各个设备的设备进风温度,判断每个机柜是否符合预设的机柜局部热点条件,将符合条件的机柜视为热点机柜;依据预设的设备检测策略,对每个热点设备进行设备异常检查,获得异常检查结果;依据热点设备的异常检查结果对其进行异常处理,使其处于正常运行状态,以降低设备运行温度;通过预设的制冷系统,对热点机柜进行降温处理,以降低机柜环境温度。应用本发明实施例提供的方法,可基于机柜中设备的进风温度和部件温度识别是否存在局部热点,对于设备进风温度关联的局部热点和部件温度关联的局部热点,可分别进行针对性的处理。局部热点的识别基于设备的相关温度,当设备存在高温或高温趋势时,可以及时识别出局部热点,及时进行温度控制,消除或减少局部热点,将机房温度控制在适宜范围内,温度控制效果较好。
在图1所示方法的基础上,本发明实施例提供的方法中,步骤S102中提及的确定当前该设备对应的设备进风温度以及该设备对应的部件温度集合的过程,包括:
确定该设备对应的设备型号;
本发明实施例提供的方法中,预先将机房中所有设备的设备特征信息配置在数据库中,设备特征信息可以包括设备类型、设备型号、设备物理位置、设备所在机柜、设备所在模块等等。可从数据库中获取当前处理的设备所对应的设备特征信息,从中读取设备型号,以获取设备对应的设备型号。
在预设的多个设备温度采集指令中,确定所述设备型号对应的目标设备温度采集指令;每个所述设备温度采集指令为基于智能平台管理接口设置的硬件管理接口操作指令;
本发明实施例提供的方法中,基于智能平台管理接口(IntelligentPlatformManagement Interface,IPMI)预先设置有多个设备温度采集指令,设备温度采集指令用于查询设备的进风温度、各部件温度等。IPMI是管理基于Intel结构的企业系统中所使用的外围设备采用的一种工业标准,用户可以利用IPMI监视服务器等IT设备的物理健康特征,如温度、电压、风扇工作状态、电源状态等。故通过IPMI可执行各类硬件管理接口操作指令,设备温度采集指令亦为其中的一类指令。设备温度采集指令是根据设备型号配置的,即预设的各个设备温度采集指令与各类设备型号一一对应。
本发明实施例提供的方法中,将各个设备温度采集指令所对应的设备型号与当前设备的设备型号分别进行匹配,以在各个设备温度采集指令中找到与当前设备的设备型号相匹配的设备温度采集指令,将其作为目标设备温度采集指令。
依据所述目标设备温度采集指令,创建该设备对应的设备温度采集任务;
本发明实施例提供的方法中,基于目标设备温度采集指令发起设备温度采集任务。
执行所述设备温度采集任务,获得该设备对应的设备温度采集结果;
本发明实施例提供的方法中,可调用线程模块,建立多线程队列,通过队列执行设备温度采集任务,得到设备的设备温度采集结果,设备温度采集结果中包括设备的进风温度、出风温度、各设备部件的温度等。
在所述设备温度采集结果中,获取该设备对应的设备进风温度;
本发明实施例提供的方法中,可从采集得到的设备温度采集结果中,读取设备的进风温度,作为该设备对应的设备进风温度。
在所述设备温度采集结果中,获取该设备对应的多个设备部件温度,将该设备对应的多个设备部件温度组成该设备对应的部件温度集合。
本发明实施例提供的方法中,可从采集得到的设备温度采集结果中,读取各设备部件的温度,作为该设备对应的各个设备部件温度,由此得到部件温度集合。
在图1所示方法的基础上,本发明实施例提供的方法中,步骤S103中提及的依据该设备对应的部件温度集合,判断该设备是否符合预设的设备局部热点条件的过程,包括:
对于该设备对应的部件温度集合中的每个设备部件温度,确定该设备部件温度对应的部件温度阈值,并判断该设备部件温度是否大于其对应的部件温度阈值,若该设备部件温度大于其对应的部件温度阈值,则将该设备部件温度确定为目标设备部件温度;
本发明实施例提供的方法中,根据实际的控温需求,预先配置有各类设备部件的部件温度阈值,当某一类型设备部件的温度超过其对应的部件温度阈值时,认为该类型设备部件存在高温或高温趋势。
本发明实施例提供的方法中,对于每个设备部件温度,可根据该设备部件温度所对应的设备部件类型,在预先配置的部件温度阈值信息中,找到该类设备部件的部件温度阈值,将该部件温度阈值作为该设备部件温度所对应的部件温度阈值。将每个设备部件温度与其对应的部件温度阈值进行大小比较,若当前进行比较的设备部件温度大于其对应的部件温度阈值,则对当前的设备部件温度进行标记,将当前的设备部件温度作为目标设备部件温度。可以认为目标设备部件温度对应的设备部件存在高温或高温趋势。若当前进行比较的设备部件温度不大于其对应的部件温度阈值,则不对该设备部件温度进行标记处理。
判断该设备对应的部件温度集合中是否存在所述目标设备部件温度,若该设备对应的部件温度集合中存在所述目标设备部件温度,则确定该设备符合所述预设的设备局部热点条件。
本发明实施例提供的方法中,对部件温度集合中的所有设备部件温度进行标记识别,识别设备部件温度是否被标记为目标设备部件温度。若部件温度集合中存在至少一个设备部件温度被标记为了目标设备部件温度,则认为相应的设备符合预设的设备局部热点条件,若部件温度集合中没有任何一个设备部件温度被标记为目标设备部件温度,则认为相应的设备不符合预设的设备局部热点条件。
在图1所示方法的基础上,本发明实施例提供的方法中,步骤S104中提及的依据该机柜中部署的每个设备所对应的设备进风温度,判断该机柜是否符合预设的机柜局部热点条件的过程,包括:
对于该机柜中部署的每个设备,确定该设备对应的设备进风温度阈值,并判断该设备对应的设备进风温度是否大于所述设备进风温度阈值,若该设备对应的设备进风温度大于所述设备进风温度阈值,则将该设备确定为该机柜对应的局部热点设备;
本发明实施例提供的方法中,根据实际的控温需求,预先设置有各类设备的设备进风温度阈值。对于当前机柜中的每个设备,可根据该设备的设备类型,在预先配置的设备进风温度阈值信息中,找到与其匹配的设备进风温度阈值,将其作为该设备对应的设备进风温度阈值。将每个设备对应的设备进风温度与其对应的设备进风温度阈值进行大小比较,若设备进风温度大于其对应的设备进风温度阈值,则将该设备标记为局部热点设备。若设备进风温度不大于其对应的设备进风温度阈值,则不对该设备进行标记处理。
判断该机柜中是否存在所述局部热点设备,若该机柜中存在所述局部热点设备,则确定该机柜符合所述预设的机柜局部热点条件。
本发明实施例提供的方法中,对当前机柜中部署的各个设备进行标记识别,识别设备是否被标记为局部热点设备。若当前机柜中部署的各个设备中,存在至少一个设备被标记为局部热点设备,则认为当前机柜符合预设的机柜局部热点条件,若当前机柜中部署的每个设备均未被标记为局部热点设备,则认为当前机柜不符合预设的机柜局部热点条件。
在上述实施例提供的方法的基础上,本发明实施例提供的方法中,步骤S107中提及的通过预设的制冷系统,对每个所述热点机柜进行降温处理的过程,包括:
在所述预设的制冷系统包含的多个地板风口中,确定每个所述热点机柜对应的地板风口;
本发明实施例提供的方法中,机房的制冷系统中采用地板式送风设计,机房中安装有风口地板。制冷系统中包含多个地板风口,通过风口地板实现地板风口送风。每个地板风口具有调节能力,可改变出风方向和出风量等。
本发明实施例提供的方法中,预先配置有各个机柜的机柜位置以及每个地板风口的位置。对于每个热点机柜,可以根据该热点机柜的位置,找到与其位置相匹配的地板风口,将匹配的地板风口作为该热点机柜对应的地板风口。
对于每个所述热点机柜,确定该热点机柜对应的局部热点设备所对应的设备位置,并依据该局部热点设备对应的设备位置和设备进风温度,确定该热点机柜对应的地板风口所对应的出风信息,该出风信息包括出风方向和出风量;
本发明实施例提供的方法中,热点机柜中部署有被标记为局部热点设备的设备,在预先存储的设备特征信息,获取局部热点设备对应的设备位置,按照预设的控制策略,基于局部热点设备对应的设备位置及其对应的设备进风温度,可确定相应的出风方向和出风量,出风方向与局部热点设备的设备位置相对应,出风量由设备进风温度决定,如设备进风温度越高,出风量则越大。由此得到每个热点机柜对应的地板风口所对应的出风信息。
需要说明的是,在具体的实现过程中,热点机柜中可以仅存在一个局部热点设备,也可能存在多个局部热点设备,在存在多个局部热点设备的情况下,对于每个局部热点设备可分别基于上述过程进行处理,得到多组出风信息,将各组出风信息整合得到相应地板风口对应的出风信息,在后续控制时,可以控制地板风口按照其中的各组出风信息交替进行出风控制。
依据每个所述热点机柜对应的地板风口所对应的出风信息,生成制冷调节指令;
将所述制冷调节指令发送给所述预设的制冷系统,使所述预设的制冷系统对每个所述热点机柜对应的地板风口进行出风控制,以对每个所述热点机柜进行降温处理。
本发明实施例提供的方法中,制冷系统可接收机房温度控制系统发送的制冷调节指令,并根据该制冷调节指令对相应的地板风口进行出风控制,即控制相应的地板风口按照其对应的出风量和出风方向送风。
在图1所示方法的基础上,本发明实施例提供的方法中,还包括:
确定每个所述机柜对应的机柜进风温度;
本发明实施例提供的方法中,可以通过预设的机房微环境监控系统,采集机房中每个机柜的进风温度,将采集到的进风温度作为相应机柜的机柜进风温度。机房微环境监控系统指的是对IT设备运行所依赖的环境,包括电流、电压、功率、温度、湿度等指标进行监控的系统。
对于每个所述机房模块,依据该机房模块包括的每个机柜所对应的机柜进风温度,判断该机房模块是否符合预设的模块局部热点条件,若该机房模块符合所述预设的模块局部热点条件,则将该机房模块确定为热点模块;
本发明实施例提供的方法中,根据实际需求预先设置了模块局部热点条件,模块局部热点条件中定义了当机房模块中的机柜的进风温度满足怎样的条件时,视为存在模块维度的局部热点。例如,设定机柜均值阈值,当机房模块中所有机柜的进风温度的均值超过该机柜均值阈值时,视为满足条件。需要说明的是,在具体的实现过程中,可以根据实际需求设置模块局部热点条件,不影响本发明实施例提供的方法实现功能。
本发明实施例提供的方法中,针对每个机房模块,判断该机房模块中各个机柜对应的机柜进风温度是否与模块局部热点条件的条件内容相匹配,若匹配,则判定该机房模块符合模块局部热点条件。当机房模块符合模块局部热点条件时,将该机房模块标记为热点模块,即认为该机房模块存在局部热点。
通过所述预设的制冷系统,对每个所述热点模块进行降温处理,以降低每个所述热点模块的环境温度。
本发明实施例提供的方法中,可基于每个热点模块的相关信息,如模块位置等,触发制冷系统调节相应的制冷设备的运行状态,针对每个热点模块所处环境进行降温处理。
在上述实施例提供的方法的基础上,本发明实施例提供的方法中,所述依据该机房模块包括的每个机柜所对应的机柜进风温度,判断该机房模块是否符合预设的模块局部热点条件的过程,包括:
对于该机房模块包括的每个机柜,判断该机柜对应的机柜进风温度是否大于预设的模块温度阈值,若该机柜对应的机柜进风温度大于所述预设的模块温度阈值,则将该机柜确定为局部热点机柜;
本发明实施例提供的方法中,根据实际的控温需求,预先设置有模块温度阈值,也就是机柜进风温度的阈值。将当前机房模块中的每个机柜的机柜进风温度与模块温度阈值进行大小比较,若当前进行比较的机柜所对应的机柜进风温度大于模块温度阈值,则将该机柜标记为局部热点机柜。若机柜进风温度不大于模块温度阈值,则不对机柜进行标记处理。
判断该机房模块包括的各个机柜中是否存在所述局部热点机柜,若该机房模块包括的各个机柜中存在所述局部热点机柜,则确定该机房模块符合所述预设的模块局部热点条件。
本发明实施例提供的方法中,对当前机房模块中的所有机柜进行标记识别,识别机柜是否被标记为局部热点机柜,若当前机房模块中存在至少一个机柜被标记为了局部热点机柜,则认为当前机房模块符合模块局部热点条件,若当前机房模块中的每个机柜均未被标记为局部热点机柜,则认为当前机房模块不符合预设的模块局部热点条件。
为了更好地说明本发明实施例提供的方法,结合实际的应用场景,本发明实施例提供了又一种机房温度控制方法。本发明实施例中的机房同样基于以上述实施例中提及的机房模块、机柜、机柜中的设备等结构进行部署。
首先,结合图2~图4,对本发明实施例中的局部热点进行说明,本发明实施例提供的方法中,将机房的局部热点划分为IT设备局部热点、机柜局部热点以及模块局部热点等类型。在图2、图3和图4中,斜杠标记表示温度较高的区域。
IT设备局部热点指的是IT设备中处于较高温度的设备部件所导致的局部热点。如图2所示示意图,其中示出了一种IT设备的简要结构,其中包含部件1~部件5等五个部件,部件3为处于较高温度的一个设备部件,部件3则为一个IT设备局部热点。
机柜局部热点指的是机柜中处于较高温度的IT设备所导致的局部热点。如图3所示示意图,其中示出了一种机柜的简要结构,该机柜中部署有IT设备1、IT设备2、IT设备3、……、IT设备m等多个IT设备,IT设备2为处于较高温度的设备,即IT设备2为一个机柜局部热点。
模块局部热点指的是机房模块中处于较高温度的机柜所导致的局部热点。如图4所示示意图,其中示出了一种机房模块的简要结构,该机房模块中部署有机柜1、机柜2、机柜3和机柜4等多个机柜。机柜4为处于较高温度的机柜,故机柜4为一个模块局部热点。
参考图5所示流程图,本发明实施例提供的机房温度控制过程,包括:
S201:采集IT设备温度;
本发明实施例提供的方法中,通过脚本采集各IT设备温度,IT设备温度包含两类温度:IT设备进出风温度、IT设备部件温度。
如图6所示,本发明实施例提供的方法中,步骤S201中提及的采集IT设备温度的过程,具体包括:
S301:配置采集任务,输入待采集TI设备特征,并保存至数据库的后端任务配置表中;
本发明实施例提供的方法中,IT设备特征可如下所示:
表1
IT设备特征 | 含义 |
Room | 所在模块 |
cabinet | 所在机柜 |
location | 物理位置 |
Class | IT设备类型 |
type | IT设备型号 |
SN | 序列号 |
ILO | 管理口IP |
User | 用户名 |
Password | 密码 |
S302:获取IT设备硬件管理接口IPMI工具各类脚本,形成待分配脚本工具信息;
本发明实施例提供的方法中,从脚本库中获取IT设备硬件管理接口IPMI工具的各类脚本信息,形成待分配脚本工具信息。以华为型号为RH5288H的服务器为例,在Linux环境下使用IPMI接口查询各个部件温度的操作方法为:GET_TEMP_CMD='ipmitool-I lanplus-H{}-U{}-P{}sdrtype Temperature'。
S303:执行脚本自动匹配IT设备型号与硬件管理接口操作指令,执行IT设备温度采集任务。
本发明实施例提供的方法中,使用脚本自动匹配IT设备型号与硬件管理接口操作指令,执行IT设备温度采集任务。异步发起IT设备温度采集任务,将任务ID传递至后端进程中,并根据任务ID从后端任务配置表中获取待采集IT设备信息和采集脚本类型,在待采集IT设备上通过线程模块建立多线程队列,以不间断的方式执行采集任务,采集得到如下所示类别的IT设备温度:
表2
S202:采集机柜进风温度;
本发明实施例提供的方法中,从机房微环境监控系统,采集模块内各机柜进风温度。
S203:温度数据处理,与预设温度阈值进行比较,判断是否存在局部热点;
本发明实施例提供的方法中,对采集到的温度进行处理,将每类温度与其对应的预设温度阈值进行比较,判断是否存在局部热点。各类温度的阈值范围可如下所示:
表3
需要说明的是,表1、表2和表3中所示的具体指标和数据内容,仅为更好地说明本发明实施例提供的方法所提供的具体实施例,其中仅示出了实际应用过程中的部分指标和数据,同时,在实际应用过程中,还可以采用其他的指标和数据,不限于本发明实施例中提及的内容。
S204:分析局部热点类型;
本发明实施例提供的方法中,若IT设备部件温度超过该部件温度阈值,判断存在IT设备局部热点;若同一机柜内单台IT设备进风温度超过预设IT设备进风温度阈值,判断存在机柜局部热点;若机柜进风温度超过模块温度阈值,判断存在模块局部热点。
S205:根据局部热点类型,给出不同预警并进行处理。
本发明实施例提供的方法中,当存在IT设备局部热点时,发起IT设备检查,并针对检查结果进行处理。
可选的,IT设备检查有硬件健康状态检查、功耗查询、CPU负载检查、内存负载检查、硬盘带宽检查、网卡流量检查等。针对检查结果进行处理,可以通过调用异常检查项的处理脚本进行处理,具体处理过程可参见上述实施例中,对于图1所示方法的步骤S106的说明,在此不再赘述。
本发明实施例提供的方法中,当存在机柜局部热点时,优化IT设备进风温度。
可选的,优化IT设备进风温度包括提示运维人员优化IT设备部署位置、封堵IT设备所在机柜空隙等。还可以通过本系统进行控制,根据机柜局部热点位置,自动控制风口地板,调节其出风量、出风方向,以对机柜内热点精准降温。
本发明实施例提供的方法中,当存在模块局部热点时,对该模块进行制冷调节。
可选的,对模块进行制冷调节包括调整模块局部热点处风口地板出风量、封堵相邻机柜间隙、调整模块局部热点位置对应的风机风速等。具体的,可以通过机柜编号解析出机柜所在位置(即模块局部热点位置),控制该模块局部热点所在位置距离最近的空调风机风速,使模块内所有机柜进风温度保持在阈值以下。
本发明实施例提供的方法,能够采集数据中心机房的IT设备部件温度、IT设备进风温度、机柜进风温度,根据预设温度阈值,分析是否存在局部热点及局部热点类型,并对不同类型的局部热点进行针对性处置。具体包括:配置采集任务并执行脚本,采集IT设备温度从机房微环境监控系统中采集模块内各机柜进风温度;对采集结果进行处理,与预设阈值进行比对;判断是否存在局部热点;根据局部热点类型,给出预警并进行处理。
本发明实施例提供的方法,采用基于IT设备硬件管理接口协议的IT设备温度采集方法,可以通过自动化的脚本高效地实时收集IT设备各个部件的温度值;建立机房局部热点分析方法,结合机房环境内各温度阈值,对不同局部热点进行分类;建立不同类型局部热点处理方法,从而针对不同局部热点及时处理。
本发明实施例提供的方法,将IT设备部件温度作为IT设备健康状态的参考指标,建立机房制冷领域与IT设备硬件运维领域之间的联系,对IT设备的故障发现、负载分析提供帮助,整个过程无需人工介入,节省了大量人力、时间资源,极大提高了运维效率。在大型数据中心复杂制冷体系下,将IT设备部件温度、IT设备进风温度、机柜温度等多层级温度相结合,多角度分析机房局部热点类型,帮助运维人员多维度判断机房制冷情况,从多个出发点优化机房制冷,提高了机房运维精细化程度。
与图1所示的一种机房温度控制方法相对应的,本发明实施例还提供了一种机房温度控制装置,用于对图1中所示方法的具体实现,其结构示意图如图7所示,包括:
第一确定单元401,用于在需要对机房进行温度控制的情况下,确定所述机房对应的多个机房模块,每个所述机房模块包括多个机柜,每个所述机柜中部署有多个设备;
第二确定单元402,用于对于每个所述机柜中部署的每个设备,确定当前该设备对应的设备进风温度以及该设备对应的部件温度集合,该部件温度集合包括该设备对应的多个设备部件温度;
第一判断单元403,用于对于每个所述机柜中部署的每个设备,依据该设备对应的部件温度集合,判断该设备是否符合预设的设备局部热点条件,若该设备符合所述预设的设备局部热点条件,则将该设备确定为热点设备;
第二判断单元404,用于对于每个所述机柜,依据该机柜中部署的每个设备所对应的设备进风温度,判断该机柜是否符合预设的机柜局部热点条件,若该机柜符合所述预设的机柜局部热点条件,则将该机柜确定为热点机柜;
异常检查单元405,用于依据预设的设备检测策略,对每个所述热点设备进行设备异常检查,获得每个所述热点设备对应的异常检查结果;
异常处理单元406,用于对于每个所述热点设备,依据该热点设备对应的异常检查结果,对该热点设备进行异常处理,使该热点设备处于正常运行状态,以降低该热点设备的运行温度;
降温处理单元407,用于通过预设的制冷系统,对每个所述热点机柜进行降温处理,以降低每个所述热点机柜的环境温度,完成本次温度控制过程。
基于本发明实施例提供的装置,确定机房对应的多个机房模块,每个机房模块包括多个机柜;确定每个机柜中部署的每个设备对应的设备进风温度和部件温度集合;依据每个设备对应的部件温度集合判断其是否符合预设的设备局部热点条件,将符合条件的设备视为热点设备;依据每个机柜中各个设备的设备进风温度,判断每个机柜是否符合预设的机柜局部热点条件,将符合条件的机柜视为热点机柜;依据预设的设备检测策略,对每个热点设备进行设备异常检查,获得异常检查结果;依据热点设备的异常检查结果对其进行异常处理,使其处于正常运行状态,以降低设备运行温度;通过预设的制冷系统,对热点机柜进行降温处理,以降低机柜环境温度。应用本发明实施例提供的装置,可基于机柜中设备的进风温度和部件温度识别是否存在局部热点,对于设备进风温度关联的局部热点和部件温度关联的局部热点,可分别进行针对性的处理。局部热点的识别基于设备的相关温度,当设备存在高温或高温趋势时,可以及时识别出局部热点,及时进行温度控制,消除或减少局部热点,将机房温度控制在适宜范围内,温度控制效果较好。
在图7所示装置的基础上,本发明实施例提供的装置还可以进一步扩展出多个单元,各个单元的功能可参见前文对于机房温度控制方法所提供的各个实施例中的说明,在此不再进一步举例说明。
本发明实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如上述的机房温度控制方法。
本发明实施例还提供了一种电子设备,其结构示意图如图8所示,具体包括存储器501,以及一个或者一个以上的指令502,其中一个或者一个以上指令502存储于存储器501中,且经配置以由一个或者一个以上处理器503执行所述一个或者一个以上指令502进行以下操作:
在需要对机房进行温度控制的情况下,确定所述机房对应的多个机房模块,每个所述机房模块包括多个机柜,每个所述机柜中部署有多个设备;
对于每个所述机柜中部署的每个设备,确定当前该设备对应的设备进风温度以及该设备对应的部件温度集合,该部件温度集合包括该设备对应的多个设备部件温度;
对于每个所述机柜中部署的每个设备,依据该设备对应的部件温度集合,判断该设备是否符合预设的设备局部热点条件,若该设备符合所述预设的设备局部热点条件,则将该设备确定为热点设备;
对于每个所述机柜,依据该机柜中部署的每个设备所对应的设备进风温度,判断该机柜是否符合预设的机柜局部热点条件,若该机柜符合所述预设的机柜局部热点条件,则将该机柜确定为热点机柜;
依据预设的设备检测策略,对每个所述热点设备进行设备异常检查,获得每个所述热点设备对应的异常检查结果;
对于每个所述热点设备,依据该热点设备对应的异常检查结果,对该热点设备进行异常处理,使该热点设备处于正常运行状态,以降低该热点设备的运行温度;
通过预设的制冷系统,对每个所述热点机柜进行降温处理,以降低每个所述热点机柜的环境温度,完成本次温度控制过程。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种机房温度控制方法,其特征在于,包括:
在需要对机房进行温度控制的情况下,确定所述机房对应的多个机房模块,每个所述机房模块包括多个机柜,每个所述机柜中部署有多个设备;
对于每个所述机柜中部署的每个设备,确定当前该设备对应的设备进风温度以及该设备对应的部件温度集合,该部件温度集合包括该设备对应的多个设备部件温度;
对于每个所述机柜中部署的每个设备,依据该设备对应的部件温度集合,判断该设备是否符合预设的设备局部热点条件,若该设备符合所述预设的设备局部热点条件,则将该设备确定为热点设备;
对于每个所述机柜,依据该机柜中部署的每个设备所对应的设备进风温度,判断该机柜是否符合预设的机柜局部热点条件,若该机柜符合所述预设的机柜局部热点条件,则将该机柜确定为热点机柜;
依据预设的设备检测策略,对每个所述热点设备进行设备异常检查,获得每个所述热点设备对应的异常检查结果;
对于每个所述热点设备,依据该热点设备对应的异常检查结果,对该热点设备进行异常处理,使该热点设备处于正常运行状态,以降低该热点设备的运行温度;
通过预设的制冷系统,对每个所述热点机柜进行降温处理,以降低每个所述热点机柜的环境温度,完成本次温度控制过程。
2.根据权利要求1所述的方法,其特征在于,所述确定当前该设备对应的设备进风温度以及该设备对应的部件温度集合,包括:
确定该设备对应的设备型号;
在预设的多个设备温度采集指令中,确定所述设备型号对应的目标设备温度采集指令;每个所述设备温度采集指令为基于智能平台管理接口设置的硬件管理接口操作指令;
依据所述目标设备温度采集指令,创建该设备对应的设备温度采集任务;
执行所述设备温度采集任务,获得该设备对应的设备温度采集结果;
在所述设备温度采集结果中,获取该设备对应的设备进风温度;
在所述设备温度采集结果中,获取该设备对应的多个设备部件温度,将该设备对应的多个设备部件温度组成该设备对应的部件温度集合。
3.根据权利要求1所述的方法,其特征在于,所述依据该设备对应的部件温度集合,判断该设备是否符合预设的设备局部热点条件,包括:
对于该设备对应的部件温度集合中的每个设备部件温度,确定该设备部件温度对应的部件温度阈值,并判断该设备部件温度是否大于其对应的部件温度阈值,若该设备部件温度大于其对应的部件温度阈值,则将该设备部件温度确定为目标设备部件温度;
判断该设备对应的部件温度集合中是否存在所述目标设备部件温度,若该设备对应的部件温度集合中存在所述目标设备部件温度,则确定该设备符合所述预设的设备局部热点条件。
4.根据权利要求1所述的方法,其特征在于,所述依据该机柜中部署的每个设备所对应的设备进风温度,判断该机柜是否符合预设的机柜局部热点条件,包括:
对于该机柜中部署的每个设备,确定该设备对应的设备进风温度阈值,并判断该设备对应的设备进风温度是否大于所述设备进风温度阈值,若该设备对应的设备进风温度大于所述设备进风温度阈值,则将该设备确定为该机柜对应的局部热点设备;
判断该机柜中是否存在所述局部热点设备,若该机柜中存在所述局部热点设备,则确定该机柜符合所述预设的机柜局部热点条件。
5.根据权利要求4所述的方法,其特征在于,所述通过预设的制冷系统,对每个所述热点机柜进行降温处理,包括:
在所述预设的制冷系统包含的多个地板风口中,确定每个所述热点机柜对应的地板风口;
对于每个所述热点机柜,确定该热点机柜对应的局部热点设备所对应的设备位置,并依据该局部热点设备对应的设备位置和设备进风温度,确定该热点机柜对应的地板风口所对应的出风信息,该出风信息包括出风方向和出风量;
依据每个所述热点机柜对应的地板风口所对应的出风信息,生成制冷调节指令;
将所述制冷调节指令发送给所述预设的制冷系统,使所述预设的制冷系统对每个所述热点机柜对应的地板风口进行出风控制,以对每个所述热点机柜进行降温处理。
6.根据权利要求1所述的方法,其特征在于,还包括:
确定每个所述机柜对应的机柜进风温度;
对于每个所述机房模块,依据该机房模块包括的每个机柜所对应的机柜进风温度,判断该机房模块是否符合预设的模块局部热点条件,若该机房模块符合所述预设的模块局部热点条件,则将该机房模块确定为热点模块;
通过所述预设的制冷系统,对每个所述热点模块进行降温处理,以降低每个所述热点模块的环境温度。
7.根据权利要求6所述的方法,其特征在于,所述依据该机房模块包括的每个机柜所对应的机柜进风温度,判断该机房模块是否符合预设的模块局部热点条件,包括:
对于该机房模块包括的每个机柜,判断该机柜对应的机柜进风温度是否大于预设的模块温度阈值,若该机柜对应的机柜进风温度大于所述预设的模块温度阈值,则将该机柜确定为局部热点机柜;
判断该机房模块包括的各个机柜中是否存在所述局部热点机柜,若该机房模块包括的各个机柜中存在所述局部热点机柜,则确定该机房模块符合所述预设的模块局部热点条件。
8.一种机房温度控制装置,其特征在于,包括:
第一确定单元,用于在需要对机房进行温度控制的情况下,确定所述机房对应的多个机房模块,每个所述机房模块包括多个机柜,每个所述机柜中部署有多个设备;
第二确定单元,用于对于每个所述机柜中部署的每个设备,确定当前该设备对应的设备进风温度以及该设备对应的部件温度集合,该部件温度集合包括该设备对应的多个设备部件温度;
第一判断单元,用于对于每个所述机柜中部署的每个设备,依据该设备对应的部件温度集合,判断该设备是否符合预设的设备局部热点条件,若该设备符合所述预设的设备局部热点条件,则将该设备确定为热点设备;
第二判断单元,用于对于每个所述机柜,依据该机柜中部署的每个设备所对应的设备进风温度,判断该机柜是否符合预设的机柜局部热点条件,若该机柜符合所述预设的机柜局部热点条件,则将该机柜确定为热点机柜;
异常检查单元,用于依据预设的设备检测策略,对每个所述热点设备进行设备异常检查,获得每个所述热点设备对应的异常检查结果;
异常处理单元,用于对于每个所述热点设备,依据该热点设备对应的异常检查结果,对该热点设备进行异常处理,使该热点设备处于正常运行状态,以降低该热点设备的运行温度;
降温处理单元,用于通过预设的制冷系统,对每个所述热点机柜进行降温处理,以降低每个所述热点机柜的环境温度,完成本次温度控制过程。
9.一种存储介质,其特征在于,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如权利要求1~7任意一项所述的机房温度控制方法。
10.一种电子设备,其特征在于,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如权利要求1~7任意一项所述的机房温度控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211383986.6A CN115666097A (zh) | 2022-11-07 | 2022-11-07 | 机房温度控制方法及装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211383986.6A CN115666097A (zh) | 2022-11-07 | 2022-11-07 | 机房温度控制方法及装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115666097A true CN115666097A (zh) | 2023-01-31 |
Family
ID=85016780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211383986.6A Pending CN115666097A (zh) | 2022-11-07 | 2022-11-07 | 机房温度控制方法及装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115666097A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116066970A (zh) * | 2023-04-04 | 2023-05-05 | 重庆跃达新能源有限公司 | 一种中央空调节能控制方法及系统 |
CN116437649A (zh) * | 2023-06-13 | 2023-07-14 | 浙江德塔森特数据技术有限公司 | 基于区块链的机房安全运维方法、装置和可读存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN205536382U (zh) * | 2016-01-27 | 2016-08-31 | 中国移动通信集团设计院有限公司 | 一种机房设备 |
WO2016169401A1 (zh) * | 2015-04-21 | 2016-10-27 | 广州汇安科技有限公司 | 数据中心的二维动态送风节能系统及其控制方法 |
CN110851322A (zh) * | 2019-10-11 | 2020-02-28 | 平安科技(深圳)有限公司 | 硬件设备异常监控方法、服务器及计算机可读存储介质 |
CN110925982A (zh) * | 2019-11-19 | 2020-03-27 | 漳州科华技术有限责任公司 | 机房空调的风阀控制的方法及终端设备 |
CN111935952A (zh) * | 2020-08-10 | 2020-11-13 | 中国工商银行股份有限公司 | 大型机房能耗调控方法及装置 |
CN114485993A (zh) * | 2022-01-18 | 2022-05-13 | 云新易联(北京)科技有限公司 | 机柜温度的获取方法、系统、装置及存储介质 |
CN114513926A (zh) * | 2020-11-16 | 2022-05-17 | 华为技术有限公司 | 机柜内多个设备的散热联调方法及系统、装置、存储介质 |
WO2022166452A1 (zh) * | 2021-02-08 | 2022-08-11 | 追觅科技(上海)有限公司 | 供风设备及其风温控制方法、电子设备和计算机可读介质 |
CN115119478A (zh) * | 2022-06-24 | 2022-09-27 | 中国农业银行股份有限公司 | 一种空调的控制方法、系统及设备 |
-
2022
- 2022-11-07 CN CN202211383986.6A patent/CN115666097A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016169401A1 (zh) * | 2015-04-21 | 2016-10-27 | 广州汇安科技有限公司 | 数据中心的二维动态送风节能系统及其控制方法 |
CN205536382U (zh) * | 2016-01-27 | 2016-08-31 | 中国移动通信集团设计院有限公司 | 一种机房设备 |
CN110851322A (zh) * | 2019-10-11 | 2020-02-28 | 平安科技(深圳)有限公司 | 硬件设备异常监控方法、服务器及计算机可读存储介质 |
CN110925982A (zh) * | 2019-11-19 | 2020-03-27 | 漳州科华技术有限责任公司 | 机房空调的风阀控制的方法及终端设备 |
CN111935952A (zh) * | 2020-08-10 | 2020-11-13 | 中国工商银行股份有限公司 | 大型机房能耗调控方法及装置 |
CN114513926A (zh) * | 2020-11-16 | 2022-05-17 | 华为技术有限公司 | 机柜内多个设备的散热联调方法及系统、装置、存储介质 |
WO2022166452A1 (zh) * | 2021-02-08 | 2022-08-11 | 追觅科技(上海)有限公司 | 供风设备及其风温控制方法、电子设备和计算机可读介质 |
CN114485993A (zh) * | 2022-01-18 | 2022-05-13 | 云新易联(北京)科技有限公司 | 机柜温度的获取方法、系统、装置及存储介质 |
CN115119478A (zh) * | 2022-06-24 | 2022-09-27 | 中国农业银行股份有限公司 | 一种空调的控制方法、系统及设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116066970A (zh) * | 2023-04-04 | 2023-05-05 | 重庆跃达新能源有限公司 | 一种中央空调节能控制方法及系统 |
CN116066970B (zh) * | 2023-04-04 | 2023-07-28 | 重庆跃达新能源有限公司 | 一种中央空调节能控制方法及系统 |
CN116437649A (zh) * | 2023-06-13 | 2023-07-14 | 浙江德塔森特数据技术有限公司 | 基于区块链的机房安全运维方法、装置和可读存储介质 |
CN116437649B (zh) * | 2023-06-13 | 2023-09-22 | 浙江德塔森特数据技术有限公司 | 基于区块链的机房安全运维方法、装置和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109800066B (zh) | 一种数据中心节能调度方法及系统 | |
US10342162B2 (en) | Data center pressure anomaly detection and remediation | |
CN111818132B (zh) | 物联网设备的控制方法、装置、计算机设备和存储介质 | |
CN115666097A (zh) | 机房温度控制方法及装置、存储介质及电子设备 | |
WO2010050080A1 (ja) | 物理計算機及び冷却装置の制御方法及びサーバシステム | |
JP5509765B2 (ja) | 空調制御装置、空調制御方法および空調制御プログラム | |
US11953894B2 (en) | Building management system with machine learning for detecting anomalies in vibration data sets | |
US8224488B2 (en) | System and method for temperature management of a data center | |
JP6675608B2 (ja) | 異常検出装置、異常検出方法及び異常検出プログラム | |
US12050442B2 (en) | Edge devices and gateways with machine learning for detecting anomalies in building equipment vibration data | |
CN109460132A (zh) | 服务器散热的方法、装置及计算机可读存储介质 | |
CN106339013A (zh) | 一种数据中心机房的温度调控方法及系统 | |
CN105260286A (zh) | 一种实时监控cpu工作状态的方法 | |
CN115933593A (zh) | 设备故障修复方法、装置、计算机设备和存储介质 | |
CN104633846A (zh) | 空调系统的控制方法及装置 | |
CN118606134A (zh) | 一种基于机器学习的数据中心基础设施自动监控方法及系统 | |
CN118740680A (zh) | 基于物联网平台的配电物联智能网关异常识别方法及系统 | |
WO2024001208A1 (zh) | 空调故障检测方法、装置、空调及电子设备 | |
CN109489190B (zh) | 一种机房冷量的调控方法及系统 | |
CN114510134A (zh) | 一种调节单板风扇方法、装置及存储介质 | |
CN118819729A (zh) | 一种应用程序的管理方法和系统 | |
CN114201021B (zh) | 一种存储系统温度管理方法及系统 | |
CN115755734A (zh) | 体检车车内环境监控方法、系统、终端设备及存储介质 | |
CN103869911B (zh) | 挡板控制装置及具有该挡板控制装置的服务器机架 | |
CN114828579B (zh) | 集装箱数据中心的节能控制方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |