[go: up one dir, main page]

CN103942119A - 一种存储器错误的处理方法和装置 - Google Patents

一种存储器错误的处理方法和装置 Download PDF

Info

Publication number
CN103942119A
CN103942119A CN201310736746.4A CN201310736746A CN103942119A CN 103942119 A CN103942119 A CN 103942119A CN 201310736746 A CN201310736746 A CN 201310736746A CN 103942119 A CN103942119 A CN 103942119A
Authority
CN
China
Prior art keywords
memory
data
object element
error
backup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310736746.4A
Other languages
English (en)
Inventor
李涛
常胜
王工艺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Huawei Digital Technologies Co Ltd
Original Assignee
Hangzhou Huawei Digital Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Huawei Digital Technologies Co Ltd filed Critical Hangzhou Huawei Digital Technologies Co Ltd
Priority to CN201310736746.4A priority Critical patent/CN103942119A/zh
Publication of CN103942119A publication Critical patent/CN103942119A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明公开了一种存储器错误的处理方法,包括:检测主存储器中目标单元的错误类型是否为硬错误;若为是,采用冗余纠正算法将所述目标单元中的数据纠正为正确数据;将所述正确数据存储至预置的备份存储器中。本发明还公开了一种存储器错误的处理装置。采用本发明,可消除存储器中的硬错误。

Description

一种存储器错误的处理方法和装置
技术领域
本发明涉及计算机领域,尤其涉及一种存储器错误的处理方法和装置。 
背景技术
当今世界计算机技术飞速发展,为追求高性能,超级计算机规模越来越庞大,对系统可靠性要求也越来越高,而存储器可靠性在超级计算机系统可靠性中占有举足轻重的份额。 
存储器的错误从产生错误的机理来分,可以将存储器错误分为为软错误(Soft Error)和硬错误(Hard Error)两类。存储器软错误主要是在存储芯片受alpha粒子或者宇宙射线干扰时发生的,目前受益于存储器芯片封装材料质量得到很大提高,受alpha粒子影响而导致软错误的情况得以明显减少,但软错误仍是存储器错误中发生概率最大的一类。由于alpha离子或者宇宙射线的干扰通常只会造成瞬间的电位变化,所以软错误是“临时性”的。硬错误(Hard Error)是由存储单元的硅片和金属化物理失效引起的,一旦发生或存在,则是“永久性的”。 
针对软错误,通常使用的技术有ECC纠错码、存储器清洗算法以及存储器冗余等操作,但是如果存储器存储单元一旦发生硬错误,通过存储器清洗是无法消除的。 
发明内容
本发明实施例所要解决的技术问题在于,提供一种存储器错误的处理方法和装置。可解决现有技术中存储器硬错误无法消除的不足。 
为了解决上述技术问题,本发明第一方面提供了一种存储器错误的处理方法,包括: 
检测主存储器中目标单元的错误类型是否为硬错误; 
若为是,采用冗余纠正算法将所述目标单元中的数据纠正为正确数据; 
将所述正确数据存储至预置的备份存储器中。 
在第一种可能的实现方式中, 
所述检测主存储器中目标单元的错误类型是否为硬错误的步骤包括: 
若检测到所述目标单元中的数据发生至少两次错误,确定所述目标单元的错误类型为硬错误。 
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述将所述正确数据存储至预置的备份存储器的空闲区域中的步骤包括: 
获取所述目标单元对应的地址; 
在所述备份存储器中查询与所述地址对应的存储单元; 
将所述正确数据存储至所述存储单元中。 
结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述在预置的备份存储器中查询空闲区域,并将所述正确数据存储至所述空闲区域的步骤之后,还包括: 
接收到对所述目标单元的操作请求,所述操作请求中包括所述目标单元的地址; 
根据所述地址将所述操作请求重定向到所述备份存储器。 
结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,还包括: 
若所述备份存储器的未占用空间的容量小于预置值,向CPU上报中断指令,以使所述CPU根据所述中断指令停止执行所述检测主存储器中目标单元的错误类型是否为硬错误的步骤。 
结合第一方面的第四种可能的实现方式,在第五种可能的实现方式中,还包括: 
记录所述目标单元的数据的错误次数、错误位数及地址。 
结合第一方面至第五种中任意一种可能的实现方式,在第六种可能的实现方式中,还包括: 
若首次检测到所述目标单元的数据发生错误,采用冗余纠正算法将所述目标单元的数据进行纠正,并将纠正后的数据存储至所述备份存储器的空闲区域中; 
若第二次检测到所述目标单元的数据为正确,清除所述空闲区域内的数据。 
结合第一方面的第六种可能的实现方式,在第七种可能的实现方式中,还 包括: 
采用预置的冗余算法为所述备份存储器中的数据增加纠错码。 
相应地,本发明第二方面还提供了一种存储器错误的处理装置,包括: 
检测模块,用于检测主存储器中目标单元的错误类型是否为硬错误; 
纠正模块,用于若所述检测模块的检测结果为是,采用冗余纠正算法将所述目标单元中的数据纠正为正确数据; 
备份模块,用于将所述正确数据存储至预置的备份存储器中。 
在第一种可能的实现方式中,所述检测模块用于若检测到所述目标单元中的数据发生至少两次错误,确定所述目标单元的错误类型为硬错误。 
结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述备份模块包括: 
获取单元,用于获取所述目标单元对应的地址; 
查询单元,用于在所述备份存储器中查询与所述地址对应的存储单元; 
存储单元,用于将所述正确数据存储至所述存储单元中。 
结合第二方面的第二种可能的实现方式,在第三种可能的实现方式中,还包括: 
接收模块,用于接收到对所述目标单元的操作请求,所述操作请求中包括所述目标单元的地址; 
重定向模块,用于根据所述地址将所述操作请求重定向到所述备份存储器。 
结合第二方面的第三种可能的实现方式,在第四种可能的实现方式中,还包括: 
上报模块,用于若所述备份存储器的未占用空间的容量小于预置值,向CPU上报中断指令,以使所述CPU根据所述中断指令指示所述检测模块停止工作。 
结合第二方面的第四种可能的实现方式,在第五种可能的实现方式中,还包括: 
记录模块,用于记录所述目标单元的数据的错误次数、错误位数及地址。 
结合第二方面至第五种中任意一种可能的实现方式,在第六种可能的实现方式中,还包括: 
第一模块,用于若首次检测到所述目标单元的数据发生错误,采用冗余纠正算法将所述目标单元的数据进行纠正,并将纠正后的数据存储至所述备份存 储器的空闲区域中; 
第二模块,用于若第二次检测到所述目标单元的数据为正确,清除所述空闲区域内的数据。 
结合第二方面的第六种可能的实现方式,在第七种可能的实现方式中,还包括: 
冗余模块,用于采用预置的冗余算法为所述备份存储器中的数据增加纠错码。 
实施本发明实施例,具有如下有益效果: 
通过对主存储器中发生失效的目标单元的错误类型进行识别,若错误类型为硬错误,将该目标单元中的数据进行纠正后存储至备份存储器中,可以避免现有技术中存储器的硬错误无法消除的不足,提高了存储器的可靠性。 
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。 
图1是本发明第一实施例的一种存储器错误的处理方法的流程示意图; 
图2是本发明第二实施例的一种存储器错误的处理方法的流程示意图; 
图3是本发明实施例的一种存储器错误的处理方法的操作示意图; 
图4是本发明实施例的一种存储器错误的处理方法的另一操作示意图; 
图5是本发明实施例的一种存储器错误的处理方法的又一操作示意图; 
图6是本发明实施例中备份存储器的结构示意图; 
图7是本发明第一实施例的一种存储器错误的处理装置的结构示意图; 
图8是本发明第二实施例的一种存储器错误的处理装置的结构示意图; 
图9是图8中备份模块的结构示意图; 
图10是本发明第三实施例的一种存储器错误的处理装置的结构示意图。 
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。 
参见图1,为本发明第一实施例的一种存储器错误的处理方法的流程示意图,在本实施例中,所述方法包括: 
S101、检测主存储器中目标单元的错误类型是否为硬错误。 
具体的,存储器的错误分为软错误(Soft Error)和硬错误(Hard Error)两类,软错误是可恢复的,硬错误不可恢复。主存储器中划分为若干个相同大小的存储单元,存储单元的大小为系统设置或用户预先设置的,例如,存储单元的大小为32Bit、64Bit或128Bit,处理装置在对主存储器进行错误检测时,以遍历整个主存储器的存储单元,假设,主存储器中的包括16个存储单元,编号分别为A00-A15,编号A02目标单元发生失效,处理装置检测目标单元的错误类型是否为硬错误,检测的方法可以采用存储器清洗法(Memory Scrub),若检测出目标单元的错误类型为硬错误,执行步骤102,否则结束流程。 
S102、采用冗余纠正算法将所述目标单元中的数据纠正为正确数据。 
具体的,根据目标单元中的数据采用的差错控制编码方法,选择对应的冗余纠正算法纠正目标单元中的数据,例如,目标单元中的数据采用ECC编码方法,处理装置选择ECC算法将目标单元中的数据纠正为正确数据。 
S103、将所述正确数据存储至预置的备份存储器中。 
具体的,获取目标单元的地址,在备份存储器中查询是否存在该地址对应的存储单元,若存在,将纠正后的正确数据存储至查询到的存储单元,若不存在,在备份存储器的空闲区域开辟一个存储单元用于存储该正确数据。 
实施本发明的实施例,通过对主存储器中发生失效的目标单元的错误类型进行识别,若错误类型为硬错误,将该目标单元中的数据进行纠正后存储至备份存储器中,可以避免现有技术中存储器的硬错误无法消除的不足,提高了存储器的可靠性。 
参见图2,为本发明第二实施例的一种存储器错误的处理方法的流程示意图,在本实施例中,所述方法包括: 
S201、检测主存储器中的目标单元的数据是否发生至少两次错误。 
具体的,存储器中的软错误是随机发生的,由于存储器中存储单元的数量 非常大,通常只会在一个存储单元发生一次,若检测到目标单元发生至少两次错误,则处理装置确认目标单元的错误类型为硬错误。 
S202、采用冗余纠正算法将所述目标单元中的数据纠正为正确数据。 
具体的,根据目标单元中的数据采用的差错控制编码方法,选择对应的冗余纠正算法纠正目标单元中的数据,例如,目标单元中的数据采用ECC编码方法,处理装置选择ECC算法将目标单元中的数据纠正为正确数据。 
S203、获取所述目标单元对应的地址。 
具体的,目标单元的地址为逻辑地址或物理地址,主存储器中每个存储单元唯一对应一个地址,处理装置获取目的单元的地址。 
S204、在所述备份存储器中查询与所述地址对应的存储单元。 
具体的,在备份存储器中查询是否存在该地址对应的存储单元,若存在,将纠正后的正确数据存储至查询到的存储单元,如果该存储单元中存在数据,用正确数据覆盖该原有的数据;若不存在,在备份存储器的空闲区域开辟一个存储单元用于存储该正确数据。 
S205、接收到对所述目标单元的操作请求,所述操作请求中包括所述目标单元的地址。 
具体的,操作请求包括读操作请求和写操作请求,操作请求中携带操作对象(即目标单元)的地址。 
S206、根据所述地址将所述操作请求重定向到所述备份存储器。 
具体的,发生失效的目标单元在备份存储器中对应一个存储单元,该存储单元与目标单元的地址进行关联。例如,目标单元的地址为0x89FF,备份存储器中存储一个与地址0x89FF关联的存储单元A05,当接收到对主存储器中目标单元A05的操作请求时,将该操作请求重定向到存储单元A05,对存储单元A05进行相应的读写操作。 
在本发明的实施例中,为了不影响正常业务的工作,操作请求对应的操作为原子操作模式,即若正在目标单元进行读写操作时,该读写操作如果未完成,存储控制器不会发起新的操作请求,保证主存储器中数据的一致性。当检测到冲突时,向处理器发送一个消息告知当前发起的操作失败。 
优选的,在本发明的一些实施例中,若所述备份存储器的未占用空间的容量小于预置值,向CPU上报中断指令,以使所述CPU根据所述中断指令停止执 行所述检测主存储器中目标单元的错误类型是否为硬错误的步骤。 
具体的,备份存储器的未占用空间的容量小于目标单元的大小时,向CPU上报中断指令,CPU接收到中断指令停止检测硬错误的过程。 
优选的,在本发明的一些实施例中,若首次检测到所述目标单元的数据发生错误,采用冗余纠正算法将所述目标单元的数据进行纠正,并将纠正后的数据存储至所述备份存储器的空闲区域中;若第二次检测到所述目标单元的数据为正确,清除所述空闲区域内的数据。 
优选的,采用预置的冗余算法为备份存储器中的数据增加纠错码,例如二维校验码算法,以降低备份存储器中的数据出现错误的概率,进一步提高备份存储器的可靠性,同时可以硬件的方式提供备份存储器的可靠性,例如采用可靠性更高的随机访问存储器(RAM)作为备份存储器。 
参见图3,为本发明实施例的一种存储器错误的处理方法的操作示意图,其中EDE为错误检测引擎,错误检测单元EDE首次检测到主存储器中地址a对应的目标单元中的数据A发生错误,错误检测引擎将地址a对应的目标单元的错误类型标记为软错误(用字母s表示),同时,错误检测引擎将数据A纠正为正确数据A’,并将正确数据A’分别写入主存储器和备份存储器,在主存储器中写入地址a,备份存储器中写入空闲的存储单元,用地址a进行关联。当Core发起对地址a的读请求时,将该读请求重定向到备份存储器中地址a对应的存储单元,当Core发起对地址a的写请求时,同时对备份存储器和主存储器进行写操作,以保持主存储器和备份存储器中数据的一致性。 
参见图4,为本发明实施例的一种存储器错误的处理方法的操作示意图,其中EDE为错误检测引擎,错误检测单元EDE第二检测到主存储器中地址a对应的目标单元中的数据A发生错误,错误检测引擎将地址a对应的目标单元的错误类型标记为硬错误(用字母h表示),同时,错误检测引擎将数据A纠正为正确数据A’,并将正确数据A’分别写入主存储器和备份存储器,在主存储器中写入地址a,备份存储器中写入空闲的存储单元,用地址a进行关联。当Core发起对地址a的读请求时,将该读请求重定向到备份存储器中地址a对应的存储单元,当Core发起对地址a的写请求时,同时对备份存储器和主存储器进行写操作,以保持主存储器和备份存储器中数据的一致性。 
参见图5,为本发明实施例的一种存储器错误的处理方法的操作示意图,其 中EDE为错误检测引擎,错误检测单元EDE第二次检测到主存储器中地址a对应的目标单元中的数据A为正确时,错误检测引擎EDE向备份存储器发送清除指令,以清除被测存储器中地址a关联的存储单元中的数据A。当Core发起对地址a的读/写请求时,直接访问主存储器。 
参见图6,为备份存储器的结构示意图,备份存储器采用寄存器或RAM搭建,其条目少且容量小,因此备份存储器出现软错误和硬错误的概率远低于主存储器。 
备份存储器过滤来自内存控制器的访问请求,其中包含CAM单元和ITEM单元,CAM单元中记录TAG地址和有效位,ITEM单元中记录备份的数据;假设CPU每次访问的存储单元的容量为512bit,针对备份存储器中备份的数据,可采用复杂的算法(例如二维校验),进一步保证备份存储器中数据的正确性和可靠性。例如,如图6所示,CAM单元中包含TAG地址,用于存放操作请求中包括的地址,同时包含有效位,用于表示对应的ITEM单元中的项目是否有效,则每个单元的大小为512Bit(DATA0~7)+64Bit(ECC)+72Bit(PARITY)。 
错误检测引擎EDE,用于实现软/硬错误的检测及错误信息的维护,主要记录发生错误的存储单元的地址和错误次数,错误检测引起EDE也包括一个CAM单元,此CAM单元中包含地址和标志位,标志位可由1bit软/错硬错标志或者多bit的错误计数器构成。 
参见图7,为本发明第一实施例的一种存储器错误的处理装置的结构示意图,在本实施例中,所述处理装置包括检测模块10、纠正模块20和备份模块30,其中, 
检测模块10,用于检测主存储器中目标单元的错误类型是否为硬错误; 
纠正模块20,用于若所述检测模块的检测结果为是,采用冗余纠正算法将所述目标单元中的数据纠正为正确数据; 
备份模块30,用于将所述正确数据存储至预置的备份存储器中。 
进一步的,参见图8,为本发明第二实施例的一种存储器错误的处理装置的结构示意图,在本发明实施例中,所述处理装置除包括检测模块10、纠正模块20和备份模块30之外,还包括接收模块40、重定向模块50、上报模块60、记录模块70、第一模块80、第二模块90和冗余模块11,其中, 
接收模块40,用于接收到对所述目标单元的操作请求,所述操作请求中包 括所述目标单元的地址; 
重定向模块50,用于根据所述地址将所述操作请求重定向到所述备份存储器。 
上报模块60,用于若所述备份存储器的未占用空间的容量小于预置值,向CPU上报中断指令,以使所述CPU根据所述中断指令指示所述检测模块停止工作。 
记录模块70,用于记录所述目标单元的数据的错误次数、错误位数及地址。 
第一模块80,用于若首次检测到所述目标单元的数据发生错误,采用冗余纠正算法将所述目标单元的数据进行纠正,并将纠正后的数据存储至所述备份存储器的空闲区域中; 
第二模块90,用于若第二次检测到所述目标单元的数据为正确,清除所述空闲区域内的数据。 
冗余模块11,用于采用预置的冗余算法为所述备份存储器中的数据增加纠错码。 
可选的,备份模块30包括: 
获取单元301,用于获取所述目标单元对应的地址; 
查询单元302,用于在所述备份存储器中查询与所述地址对应的存储单元; 
存储单元303,用于将所述正确数据存储至所述存储单元中。 
参见图10,为本发明第三实施例的一种存储器错误的处理装置的结构示意图,以下简称处理装置1,处理装置1包括处理器61、存储器62、输入装置63和输出装置64,处理装置1中的处理器61的数量可以是一个或多个,图10以一个处理器为例。本发明的一些实施例中,处理器61、存储器62、输入装置63和输出装置64可通过总线或其他方式连接,图10中以总线连接为例。 
其中,存储器62中存储一组程序代码,且处理器61用于调用存储器62中存储的程序代码,用于执行以下操作: 
检测主存储器中目标单元的错误类型是否为硬错误; 
若为是,采用冗余纠正算法将所述目标单元中的数据纠正为正确数据; 
将所述正确数据存储至预置的备份存储器中。 
在本发明的一些实施例中,处理器61执行所述检测主存储器中目标单元的错误类型是否为硬错误的步骤包括: 
若检测到所述目标单元中的数据发生至少两次错误,确定所述目标单元的错误类型为硬错误。 
在本发明的一些实施例中,处理器61执行所述将所述正确数据存储至预置的备份存储器的空闲区域中的步骤包括: 
获取所述目标单元对应的地址; 
在所述备份存储器中查询与所述地址对应的存储单元; 
将所述正确数据存储至所述存储单元中。 
在本发明的一些实施例中,处理器61还用于执行: 
接收到对所述目标单元的操作请求,所述操作请求中包括所述目标单元的地址; 
根据所述地址将所述操作请求重定向到所述备份存储器。 
在本发明的一些实施例中,处理器61还用于执行: 
若所述备份存储器的未占用空间的容量小于预置值,向CPU上报中断指令,以使所述CPU根据所述中断指令停止执行所述检测主存储器中目标单元的错误类型是否为硬错误的步骤。 
在本发明的一些实施例中,处理器61还用于执行: 
记录所述目标单元的数据的错误次数、错误位数及地址。 
在本发明的一些实施例中,处理器61还用于执行: 
若首次检测到所述目标单元的数据发生错误,采用冗余纠正算法将所述目标单元的数据进行纠正,并将纠正后的数据存储至所述备份存储器的空闲区域中; 
若第二次检测到所述目标单元的数据为正确,清除所述空闲区域内的数据。 
在本发明的实施例中,处理器61还用于执行: 
采用预置的冗余算法为所述备份存储器中的数据增加纠错码。 
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。 
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发 明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。 

Claims (16)

1.一种存储器错误的处理方法,其特征在于,包括:
检测主存储器中目标单元的错误类型是否为硬错误;
若为是,采用冗余纠正算法将所述目标单元中的数据纠正为正确数据;
将所述正确数据存储至预置的备份存储器中。
2.如权利要求1所述的方法,其特征在于,所述检测主存储器中目标单元的错误类型是否为硬错误的步骤包括:
若检测到所述目标单元中的数据发生至少两次错误,确定所述目标单元的错误类型为硬错误。
3.如权利要求2所述的方法,其特征在于,所述将所述正确数据存储至预置的备份存储器的空闲区域中的步骤包括:
获取所述目标单元对应的地址;
在所述备份存储器中查询与所述地址对应的存储单元;
将所述正确数据存储至所述存储单元中。
4.如权利要求3所述的方法,其特征在于,所述在预置的备份存储器中查询空闲区域,并将所述正确数据存储至所述空闲区域的步骤之后,还包括:
接收到对所述目标单元的操作请求,所述操作请求中包括所述目标单元的地址;
根据所述地址将所述操作请求重定向到所述备份存储器。
5.如权利要求4所述的方法,其特征在于,还包括:
若所述备份存储器的未占用空间的容量小于预置值,向CPU上报中断指令,以使所述CPU根据所述中断指令停止执行所述检测主存储器中目标单元的错误类型是否为硬错误的步骤。
6.如权利要求5所述的方法,其特征在于,还包括:
记录所述目标单元的数据的错误次数、错误位数及地址。
7.如权利要求1-6任意一项所述的方法,其特征在于,还包括:
若首次检测到所述目标单元的数据发生错误,采用冗余纠正算法将所述目标单元的数据进行纠正,并将纠正后的数据存储至所述备份存储器的空闲区域中;
若第二次检测到所述目标单元的数据为正确,清除所述空闲区域内的数据。
8.如权利要求7所述的方法,其特征在于,还包括:
采用预置的冗余算法为所述备份存储器中的数据增加纠错码。
9.一种存储器错误的处理装置,其特征在于,包括:
检测模块,用于检测主存储器中目标单元的错误类型是否为硬错误;
纠正模块,用于若所述检测模块的检测结果为是,采用冗余纠正算法将所述目标单元中的数据纠正为正确数据;
备份模块,用于将所述正确数据存储至预置的备份存储器中。
10.如权利要求9所述的装置,其特征在于,所述检测模块用于若检测到所述目标单元中的数据发生至少两次错误,确定所述目标单元的错误类型为硬错误。
11.如权利要求10所述的装置,其特征在于,所述备份模块包括:
获取单元,用于获取所述目标单元对应的地址;
查询单元,用于在所述备份存储器中查询与所述地址对应的存储单元;
存储单元,用于将所述正确数据存储至所述存储单元中。
12.如权利要求11所述的装置,其特征在于,还包括:
接收模块,用于接收到对所述目标单元的操作请求,所述操作请求中包括所述目标单元的地址;
重定向模块,用于根据所述地址将所述操作请求重定向到所述备份存储器。
13.如权利要求12所述的装置,其特征在于,还包括:
上报模块,用于若所述备份存储器的未占用空间的容量小于预置值,向CPU上报中断指令,以使所述CPU根据所述中断指令指示所述检测模块停止工作。
14.如权利要求13所述的装置,其特征在于,还包括:
记录模块,用于记录所述目标单元的数据的错误次数、错误位数及地址。
15.如权利要求8-14任意一项所述的装置,其特征在于,还包括:
第一模块,用于若首次检测到所述目标单元的数据发生错误,采用冗余纠正算法将所述目标单元的数据进行纠正,并将纠正后的数据存储至所述备份存储器的空闲区域中;
第二模块,用于若第二次检测到所述目标单元的数据为正确,清除所述空闲区域内的数据。
16.如权利要求15所述的装置,其特征在于,还包括:
冗余模块,用于采用预置的冗余算法为所述备份存储器中的数据增加纠错码。
CN201310736746.4A 2013-12-26 2013-12-26 一种存储器错误的处理方法和装置 Pending CN103942119A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310736746.4A CN103942119A (zh) 2013-12-26 2013-12-26 一种存储器错误的处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310736746.4A CN103942119A (zh) 2013-12-26 2013-12-26 一种存储器错误的处理方法和装置

Publications (1)

Publication Number Publication Date
CN103942119A true CN103942119A (zh) 2014-07-23

Family

ID=51189792

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310736746.4A Pending CN103942119A (zh) 2013-12-26 2013-12-26 一种存储器错误的处理方法和装置

Country Status (1)

Country Link
CN (1) CN103942119A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105259150A (zh) * 2015-11-02 2016-01-20 深圳市锦瑞电子有限公司 一种荧光分析仪定标系统
WO2017215377A1 (zh) * 2016-06-16 2017-12-21 中兴通讯股份有限公司 内存硬错误的处理方法及装置
CN107633865A (zh) * 2016-07-19 2018-01-26 北京兆易创新科技股份有限公司 一种非易失性存储器的数据读取装置及方法
CN109388511A (zh) * 2018-09-14 2019-02-26 联想(北京)有限公司 一种信息处理方法、电子设备及计算机存储介质
CN112540723A (zh) * 2020-11-06 2021-03-23 深圳市民德电子科技股份有限公司 一种NOR Flash坏点补偿的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5694599A (en) * 1979-12-27 1981-07-31 Fujitsu Ltd Hard error detection system for memory element
EP0034188A1 (en) * 1979-08-31 1981-08-26 Fujitsu Limited Error correction system
US4617660A (en) * 1983-03-10 1986-10-14 Fujitsu Limited Faulty-memory processing method and apparatus
JPS6448153A (en) * 1987-08-19 1989-02-22 Yokogawa Electric Corp Memory controller
CN101996689A (zh) * 2009-08-12 2011-03-30 台湾积体电路制造股份有限公司 存储器错误处理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0034188A1 (en) * 1979-08-31 1981-08-26 Fujitsu Limited Error correction system
JPS5694599A (en) * 1979-12-27 1981-07-31 Fujitsu Ltd Hard error detection system for memory element
US4617660A (en) * 1983-03-10 1986-10-14 Fujitsu Limited Faulty-memory processing method and apparatus
JPS6448153A (en) * 1987-08-19 1989-02-22 Yokogawa Electric Corp Memory controller
CN101996689A (zh) * 2009-08-12 2011-03-30 台湾积体电路制造股份有限公司 存储器错误处理方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105259150A (zh) * 2015-11-02 2016-01-20 深圳市锦瑞电子有限公司 一种荧光分析仪定标系统
CN105259150B (zh) * 2015-11-02 2019-01-18 深圳市锦瑞生物科技有限公司 一种荧光分析仪定标系统
WO2017215377A1 (zh) * 2016-06-16 2017-12-21 中兴通讯股份有限公司 内存硬错误的处理方法及装置
CN107516547A (zh) * 2016-06-16 2017-12-26 中兴通讯股份有限公司 内存硬错误的处理方法及装置
CN107633865A (zh) * 2016-07-19 2018-01-26 北京兆易创新科技股份有限公司 一种非易失性存储器的数据读取装置及方法
CN107633865B (zh) * 2016-07-19 2024-02-20 兆易创新科技集团股份有限公司 一种非易失性存储器的数据读取装置及方法
CN109388511A (zh) * 2018-09-14 2019-02-26 联想(北京)有限公司 一种信息处理方法、电子设备及计算机存储介质
CN112540723A (zh) * 2020-11-06 2021-03-23 深圳市民德电子科技股份有限公司 一种NOR Flash坏点补偿的方法

Similar Documents

Publication Publication Date Title
US9952795B2 (en) Page retirement in a NAND flash memory system
US8255742B2 (en) Dynamically replicated memory
US8543863B2 (en) Efficiency of hardware memory access using dynamically replicated memory
CN102929750B (zh) 非易失性介质肮脏区段跟踪
US20110191649A1 (en) Solid state drive and method of controlling an error thereof
US10203883B2 (en) Performance optimization of read functions in a memory system
US20140281280A1 (en) Selecting between non-volatile memory units having different minimum addressable data unit sizes
US9830218B2 (en) Cache memory with fault tolerance
US9600189B2 (en) Bank-level fault management in a memory system
US9063869B2 (en) Method and system for storing and rebuilding data
US11030040B2 (en) Memory device detecting an error in write data during a write operation, memory system including the same, and operating method of memory system
US11355213B2 (en) Apparatus and method for verifying reliability of data read from memory device through clock modulation, and memory system including the same
CN103942119A (zh) 一种存储器错误的处理方法和装置
US20120246507A1 (en) Parallel memory error detection and correction
US20220091936A1 (en) Systems and methods for encoding metadata
CN104813409A (zh) 在存储器错误检测和存储器错误校正之间动态选择
WO2013080299A1 (ja) データ管理装置、データコピー方法、およびプログラム
US20140195852A1 (en) Memory testing of three dimensional (3d) stacked memory
CN105408869B (zh) 调用错误处理程序来处理无法纠正的错误
CN101901169A (zh) 扫描装置及方法
US10733069B2 (en) Page retirement in a NAND flash memory system
US9037948B2 (en) Error correction for memory systems
JP2021520555A (ja) 階層デコーダを使用したエラー訂正
US9304854B2 (en) Semiconductor device and operating method thereof
CN105027084B (zh) 在移动通信系统中控制存储器的装置和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140723

RJ01 Rejection of invention patent application after publication