우리 중 많은 사람들이 하드 디스크 또는 SSD 오류를 경험했습니다. 우리 중 일부는 하드 드라이브의 신뢰성과 SMART(SMART) 라는 기술의 일부인 숨겨진 예측 기능(hidden prediction function) 에 대해 더 많이 찾으려고 노력했습니다 . SMART 는 모든 경우에 실패를 예측하지 못하기 때문에 신뢰할 수 없다고 주장할 수도 있습니다 . 이 사실은 부분적으로 사실이지만 이 자체 모니터링 시스템의 실제 내부 작동은 그렇게 간단하지 않으므로 SMART 가 어떻게 작동하는지 살펴보겠습니다. 또한 HDD SMART 상태(HDD SMART status) 및 솔리드 스테이트 드라이브 SMART 상태(SMART status) 를 확인하는 방법을 보여줍니다 .
SMART(HDD 및 SSD)란 무엇입니까?
SMART는 드라이브의 내부 정보를 모니터링하는 시스템입니다. (SMART is a system that monitors the internal information of your drive.)영리한 이름(clever name) 은 실제로 자체 모니터링, 분석 및 보고 기술(Self-Monitoring, Analysis, and Reporting Technology) 의 약어입니다 . SMART 라고도 하는 SMART 는 (S.M.A.R.T.)HDD 및 SSD(HDDs and SSDs) 내부에 있는 기술 입니다. 운영 체제(operating system) , BIOS 또는 기타 소프트웨어와 무관 합니다.
SMART 는 HDD 및 SSD(HDDs and SSDs) 에 대해 무엇 을 합니까?
SMART 는 컴퓨터 에 하드 드라이브의 상태(health state) 를 모니터링할 수 있는 무언가가 필요했기 때문에 발명되었습니다 . 즉, SMART는 하드 드라이브 또는 솔리드 스테이트 드라이브가 작동을 멈추려고 하는지 알려줄 수 있어야 합니다(SMART should supposedly be able to tell you if your hard drive or solid-state drive is about to stop working) .
SMART 는 어떻게 합니까? 당신은 당신의 드라이브가 건강한지 SMART 가 마술처럼 추측할 수 있다고 생각하고 싶을 수도 있습니다. 🙂 하지만 그것이 하는 일은 완전히 다른 이야기입니다. SMART 는 드라이브마다 숫자와 유형이 다른 일련의 변수를 추적하며 , 이는 (SMART keeps track of a series of variables)신뢰성의 지표입니다(indicators of its reliability) . 약 50개의 SMART 속성(원시 읽기 오류율(error rate) , 스핀업 시간, 보고된 수정 불가능한 오류, 전원 켜기 시간, 로드 주기 수(cycle count) 등) 이 있으므로 모든 SMART 속성에 대한 심층적인 아이디어를 얻으려면 , 이 웹페이지를 방문하십시오(visit this webpage) .
그러나 일부 단일 시도( Google , Backblaze )를 제외하고 대부분의 SMART . 데이터가 문서화되지 않았습니다. 시스템은 많은 내부 데이터를 제공합니다. 그러나 많은 하드 드라이브 제조업체가 다른 정의와 측정을 사용하기 때문에 통계에 많은 불일치가 있습니다. 예를 들어, 일부 제조업체는 전원 켜짐 시간 데이터를 시간으로 저장하고 다른 제조업체는 분 또는 초 단위로 측정합니다. 또한 다양한 속성이나 변수 중 어떤 것이 주의할 가치가 있는지 설명하지 않아 데이터에 빠져들게 만듭니다.
어떤 SMART(SMART) 속성이 관련 이 있는지 이해하기 전에 먼저 SSD 및 HDD 오류의 주요 유형인 예측 가능 및 예측 불가능(SSD and HDD failures: predictable and non-predictable) 을 구별해야 합니다 .
예측 가능한 고장(Predictable failures) 에는 시간에 나타나는 고장이 포함되며, 이는 잘못된 디스크 역학 또는 하드 디스크의 경우 디스크 표면 손상으로 인해 발생합니다. 솔리드 스테이트 드라이브의 경우 예측 가능한 오류에는 시간 경과에 따른 정상적인 마모 또는 실패한 삭제 시도 횟수가 포함될 수 있습니다. 문제(Problems) 는 시간이 지남에 따라 악화되고 결국 드라이브에 장애가 발생합니다.
예측할 수 없는 오류(Non-predictable failures) 는 갑작스러운 이벤트로 인해 발생하며, 예를 들어 갑작스러운 전력 서지 또는 하드 디스크 또는 솔리드 스테이트 드라이브 내부 회로의 예기치 않은 손상을 언급할 수 있습니다. 이해해야 할 중요한 점은 SMART는 예측 가능한 오류를 감지하는 데만 도움이 될 수(S.M.A.R.T. can only help you detect predictable failures) 있다는 것 입니다.
이제 SMART 가 무엇인지 그리고 어떤 역할을 하는지에 대한 기본적인 이해를 하였으므로 (SMART)Windows 에서 드라이브 의 SMART 상태(SMART status) 를 확인하는 방법과 SMART 세부 정보 를 읽고 해석하는 방법을 살펴보겠습니다 .
SSD 및 HDD SMART 상태(SSD and HDD SMART status) 확인 방법
Windows 컴퓨터 및 장치 에서 하드 디스크 또는 SSD 에서 (SSD)SMART 데이터 를 읽는 가장 쉬운 방법 은 특수 앱을 사용하는 것입니다. 꽤 많이 있지만 대부분은 개발이 제대로 이루어지지 않았거나 비용(cost money) 이 많이 듭니다 . SMART 데이터 를 읽을 수 있는 모든 앱 중에서 가장 우수하고 사용을 권장하는 앱은 CrystalDiskInfo 입니다. 무료이며 SMART(SMART) 속성 을 읽을 수 있으며 IDE ( PATA ), SATA 및 NVMe 모두에서 (NVMe)SMART 데이터 를 가져올 수 있는 몇 안 되는 앱 중 하나이기도 합니다.드라이브뿐만 아니라 e SATA , USB 또는 IEEE 1394 를 사용하는 휴대용 드라이브에서 .
HDD 또는 SSD(HDD or SSD) 의 SMART 상태 및 세부 정보(SMART status and details) 를 확인하는 또 다른 훌륭한 방법은 제조업체에서 제공하는 앱을 사용하는 것입니다. 예를 들어, 대부분의 솔리드 스테이트 드라이브에는 드라이브에 대한 정보를 확인하고 상태를 확인하고 진단을 실행하는 등의 작업을 수행할 수 있는 지원 앱 이 함께 제공됩니다. (support apps)이러한 앱에는 일반적으로 SMART 상태(SMART status) 를 확인하기 위한 옵션이 포함되어 있습니다 .
하드 디스크 드라이브 또는 SSD 의 (disk drive or SSD)SMART 상태(SMART status) 를 확인하는 세 번째 방법은 Windows 10 에서 제공됩니다 . 세부 정보를 표시하지 않지만 드라이브의 SMART 상태(SMART status) 가 정상인지 여부를 알려줄 수 있습니다. SMART 를 확인하려면 명령 프롬프트(Command Prompt) 를 열고 wmic diskdrive get model, status 명령을 실행 합니다 . 이 명령은 PC에 연결된 드라이브 목록을 출력하고 각각에 대한 SMART 상태(SMART status) 를 표시합니다.
SMART 상태(SMART status) 를 확인하는 이 마지막 방법 은 Windows 10 에서 드라이브에 오류가 있는지 여부를 확인 하는 가장 빠른 방법일 것입니다 .
SSD 또는 HDD SMART 테스트를 실행하는 방법
드라이브의 SMART 상태(SMART status) 를 읽는 것만으로는 만족하지 않으면 SSD 또는 HDD SMART 테스트(SSD or HDD SMART test) 를 실행할 수도 있습니다 . 이 목적을 위해 전문화된 앱이 필요하기 때문에 말처럼 쉽지 않습니다. 따라서 HDD 또는 SSD 테스트 및 (HDD or SSD)상태(health status) 확인 링크를 통해 액세스할 수 있는 별도 문서의 가치가 있는 주제라고 생각했습니다 .
SMART 값 및 속성 을 읽는 방법
여러 센서를 통해 하드 디스크 의 상태(health status) 를 지속적으로 테스트하고 모니터링합니다. 값은 일반적인 알고리즘을 사용하여 측정한 다음 결과에 따라 해당 속성을 조정합니다.
모든 SMART 모니터링 프로그램(monitoring program) 에서 다음 필드 중 적어도 일부를 포함하는 속성을 확인해야 합니다.
-
식별자:(Identifier:) 속성의 정의. 일반적으로 표준 의미를 가지며 1에서 250 사이의 숫자로 표시됩니다(예: 9는 전원 켜기 횟수(Power-on Count) ). 여전히 모든 디스크 모니터링 및 테스트 도구(disk monitoring and testing tools) 는 속성의 이름과 텍스트 설명을 제공합니다.
-
임계값:(Threshold:) 속성의 최소값입니다. 이 값에 도달하면 드라이브에 장애가 발생합니다.
-
값:(Value:) 속성의 현재 값. 알고리즘은 원시 데이터를 기반으로 이 숫자를 계산합니다. 새 하드 드라이브는 수명 기간 동안 감소하는 이론적 최대값(제조업체에 따라 100, 200 또는 253)인 높은 숫자를 가져야 합니다.
-
Worst: 기록된 속성의 가장 작은 값.
-
데이터:(Data:) 센서 또는 카운터에서 제공하는 원시 측정 값. HDD 또는 SSD(HDD or SSD) 제조사에서 설계한 알고리즘에서 사용하는 데이터입니다 . 그 내용은 드라이브의 속성과 제조업체에 따라 다릅니다. 일반 사용자는 이 항목을 건너뛰어야 합니다.
-
플래그:(Flags:) 속성의 목적. 이것은 일반적으로 제조업체에서 설정하므로(manufacturer and therefore varies) 드라이브마다 다릅니다. 각 속성은 중요하며 임박한 오류(예: ID 5 재할당된 섹터 수)를 예측하거나 상태에 직접적인 영향을 미치지 않는 통계적(예: ID 174 예기치 않은 전력 손실 수(power loss count) )을 예측할 수 있습니다.
SMART 속성의 상태를 이해 하려고 할 때 값, 임계값 및 플래그의 세 필드 값을 확인하십시오(to understand the status of any S.M.A.R.T. attribute, check the values of these three fields: value, threshold, and flags) . 또한 일반적으로 값이 작을수록 신뢰도가 감소(smaller values are an indication of a decrease in reliability) 한다는 것을 기억하십시오 .
SMART 를 사용 하여 HDD 또는 SSD(HDD or SSD) 의 장애를 예측하는 방법 (확인해야 할 필수 값)
모두가 스마트(S.M.A.R.T) 하지는 않습니다 . 속성은 실패 예측(failure prediction) 에 중요합니다 . 하드 드라이브 고장률(drive failure) 및 기타 출처 에 대한 위에서 언급한 두 연구는 고장난 드라이브를 식별하는 데 중요한 도움이 된다는 데 동의합니다.
-
재할당된 섹터 수(Reallocated sector counts) . 재할당은 드라이브의 논리가 반복적인 소프트 또는 하드 오류의 결과로 손상된 섹터를 예비 섹터에서 새로운 물리적 섹터로 다시 매핑할 때 발생합니다. 이 속성은 재매핑이 발생한 횟수를 반영합니다. 값이 증가하면 HDD 또는 SSD 마모를 나타냅니다.
-
현재 보류 중인 섹터 수(Current Pending Sector Count) . 이것은 "불안정한" 섹터를 계산하는데, 이는 일종의 "시험" 시스템인 재매핑을 기다리는 읽기 오류가 있는 손상된 섹터를 의미합니다. SMART 알고리즘은 때때로 설득력이 없기 때문에 이 특정 속성에 대해 혼합된 이해를 가지고 있습니다. 그럼에도 불구하고 가능한 문제에 대한 조기 경고를 제공할 수 있습니다.
-
수정 불가능한 오류가 보고(Reported Uncorrectable Errors) 되었습니다. 복구가 불가능한 오류의 개수이며, 모든 제조사에서 동일한 의미를 가지는 것 같아서 유용합니다.
-
실패 횟수 지우기(Erase Fail Count) . 이것은 솔리드 스테이트 드라이브의 조기 사망에 대한 훌륭한 지표입니다. 데이터 삭제 시도 실패 횟수를 계산하고 값이 증가하면 SSD 내부의 플래시 메모리 수명이 거의 다 되었음을 알려줍니다.
-
웨어 레벨링 카운트(Wear Leveling Count) . 이것은 또한 SSD에 특히 유용합니다. 제조업체는 SMART 데이터에서 SSD의 예상 수명을 설정합니다. Wear Leveling Count 는 드라이브 상태를 추정한 것입니다. 사전 정의된 예상 수명과 각 메모리 플래시 블록이 수명 종료에 도달하기 전에 수행할 수 있는 주기 수(쓰기, 지우기 등)를 고려하는 알고리즘을 사용하여 계산됩니다.
-
디스크 온도(Disk temperature) 는 논쟁의 여지가 많은 매개변수입니다. 그러나 60°C 이상의 값은 HDD 또는 SSD의 수명을 단축시키고 손상 가능성을 높일 수 있다고 생각됩니다. 드라이브의 온도를 낮추고 수명을 연장하려면 팬을 사용하는 것이 좋습니다.
위에서 언급한 SMART . 속성은 비교적 해석하기 쉽습니다. 값이 증가하면 드라이브에 장애가 발생했을 수 있으므로 백업을 시작하는 것이 좋습니다. 그러나 이것이 드라이브 신뢰성에 대한 유용한 지표이기는 하지만 완벽한 것은 아니라는 점을 잊지 마십시오.
SMART에 대한 역사적 참고 사항
SMART 는 모든 최신 솔리드 스테이트 드라이브 및 하드 디스크 드라이브에 포함되어 있음을 알고 있지만 1992년(year 1992) 부터 개발되었습니다 . 그 역사는 예측 장애 분석(Predictive Failure Analysis) 또는 IntelliSafe(Predictive Failure Analysis or IntelliSafe) 와 같은 이름 배열과 모든 주요 하드 디스크 제조업체( IBM , Seagate , Quantum , Western Digital )의 의견을 포함합니다 . 마지막으로, 해당 문서는 2004년에 Parallel ATA(Parallel ATA) 표준 내에서 처음으로 소개되었으며 이후 정기적인 수정을 받았습니다. 가장 최근의 것은 2011년에 발행된 것입니다.
SSD 및 HDD SMART(SSD and HDD SMART) 에 대해 더 알고 싶은 것이 있습니까?
이것은 SMART 의 내부 작동 과 하드 디스크 오류를 모니터링, 테스트 및 예측하는 기능에 대한 짧은 연구였습니다. 기억해야 할 주요 관점은 이 자체 모니터링 시스템이 HDD 의 (HDD)상태(health status) 를 검토하는 데 도움이 될 수 있다는 것 입니다. 이 SMART 데이터(S.M.A.R.T data) 를 사용하여 자신의 드라이브에 문제가 있는지 확인하려면 이 자습서에서 권장하는 기사를 읽으십시오. 또한 질문에 대해서는 아래의 의견 양식을 사용하고 토론합시다.
What is SMART and how to use it to predict HDD or SSD failure
A lot of us hаve еxperienced a hard dіsk or an SSD failure. Some of us have even tried to find out more about the reliability of hard drives and their hidden prediction function that's рart of a technolоgy called SMART. One might argue that SMART is not as reliаble as it does not рredict fаilure in all cases. This fact is partly true, but the actual inner workings of this self-monitoring system are not ѕo simple, so let's examine how SMART works. We're also going to show you how to check thе HDD SMART status, as well as the solid-state drive SMART status:
What is SMART (HDD & SSD)?
SMART is a system that monitors the internal information of your drive. Its clever name is actually an acronym for Self-Monitoring, Analysis, and Reporting Technology. SMART, also written as S.M.A.R.T., is a technology found inside HDDs and SSDs. It is independent of your operating system, BIOS, or other software.
What does SMART do for HDDs and SSDs?
SMART was invented because computers needed something that could monitor the health state of their hard drives. That means, plainly speaking, that SMART should supposedly be able to tell you if your hard drive or solid-state drive is about to stop working!
How does SMART do that? You might be tempted to think that SMART can magically guess if your drive is healthy. 🙂 What it does is an entirely different story, though. SMART keeps track of a series of variables whose number and type vary from drive to drive, which are indicators of its reliability. If you want to get an in-depth idea of all the SMART attributes, as there are about 50 of them (raw read error rate, spin-up time, reported uncorrectable errors, power-on time, load cycle count, etc.), visit this webpage.
However, know that, apart from some singular attempts (Google, Backblaze), most of the S.M.A.R.T. data is undocumented. The system provides a great deal of internal data. Still, there are many inconsistencies in the statistics because many of the hard drive manufacturers use different definitions and measurements. For example, some manufacturers store power on-time data as hours, while others measure it in minutes or seconds. Also, they don't explain which of the various attributes or variables are worth our attention, making us drown in data.
Before attempting to understand which SMART attributes are relevant, we first have to differentiate between the main types of SSD and HDD failures: predictable and non-predictable.
Predictable failures include the breakdowns that appear in time and are caused by faulty disk mechanics or damages of the disk's surface in the case of hard-disks. For solid-state drives, predictable failures can include normal wear over time or a high number of erasing attempts that have failed. Problems get worse over time, and the drive eventually fails.
Non-predictable failures are caused by sudden events, of which we can mention, for example, sudden power surges or unexpected damage to circuitry inside the hard disk or solid-state drive. What is important to understand is that S.M.A.R.T. can only help you detect predictable failures.
Now that you have a basic understanding of what SMART is and does, let's see how to check the SMART status of your drives from Windows and then also how to read and interpret the SMART details:
How to check SSD and HDD SMART status
On Windows computers and devices, the easiest way to read SMART data from a hard disk or from an SSD is by using specialized apps. There are quite a few out there, but many of them are either poorly developed or cost money. Out of all the apps that can read SMART data, the best and the one that we're recommending that you use is CrystalDiskInfo. It is free, able to read SMART attributes, and it's also one of the few such apps that can get SMART data both from IDE(PATA), SATA, and NVMe drives, as well as from portable drives that are using eSATA, USB, or IEEE 1394.
Another excellent method of checking the SMART status and details of an HDD or SSD is to use the apps provided by its manufacturer. For example, most solid-state drives are accompanied by support apps that let you check information about them, check their health, run diagnostics, and so on. These apps usually include options for checking SMART status.
A third way of checking the SMART status of your hard disk drive or SSD is offered by Windows 10. It doesn't show details, but can tell you whether the SMART status of your drives is OK or not. To check SMART, open Command Prompt and run this command: wmic diskdrive get model, status. The command outputs the list of drives connected to your PC and shows the SMART status for each of them.
This last method to check the SMART status is probably the quickest way in Windows 10 to check whether your drives are failing.
How to run an SSD or HDD SMART test
If you're not satisfied with just reading the SMART status of your drives, you can also run an SSD or HDD SMART test. That is easier said than done because you need a specialized app for this purpose. Accordingly, we considered that this is a subject worthy of a separate article, which you can access via this link: Test your HDD or SSD and check its health status.
How to read SMART values and attributes
The health status of the hard disk is continuously tested and monitored with multiple sensors. The values are measured by the use of typical algorithms, and then the corresponding attributes are tweaked according to the results.
In any SMART monitoring program, you should see attributes that contain at least some of these fields:
-
Identifier: the definition of the attribute. It usually has a standard meaning, and it is marked with a number between 1 and 250 (for example, 9 is Power-on Count). Still, all disk monitoring and testing tools provide the name and a textual description of the attribute.
-
Threshold: the minimum value for the attribute. If this value is reached, then your drive is about to fail.
-
Value: current value of the attribute. The algorithm calculates this number based upon the raw data. A new hard drive should have a high number, the theoretical maximum (100, 200, or 253 depending on the manufacturer), that decreases during its lifetime.
-
Worst: the smallest value of the attribute ever recorded.
-
Data: raw measured values provided by a sensor or a counter. This is the data used by the algorithm designed by the manufacturer of the HDD or SSD. Its contents depend on the attribute and the maker of the drive. Regular users should skip this one.
-
Flags: the purpose of the attribute. This is usually set by the manufacturer and therefore varies from drive to drive. Each of the attributes is either critical and can predict an imminent failure (for example, ID 5 reallocated sectors count), or statistical with no direct effect on status (for example, ID 174 unexpected power loss count).
When trying to understand the status of any S.M.A.R.T. attribute, check the values of these three fields: value, threshold, and flags. Also, remember that, usually, smaller values are an indication of a decrease in reliability.
How to use SMART to predict the failure of an HDD or SSD (essential values to check)
Not all S.M.A.R.T. attributes are critical for failure prediction. The two above mentioned studies on hard drive failure rates and other sources agree that an important help in identifying failing drives are:
-
Reallocated sector counts. Reallocation happens when the drive's logic remaps a damaged sector, as a result of recurring soft or hard errors, to a new physical sector from its spare ones. This attribute reflects the number of times a remapping has happened. If its value increases, it's an indication of HDD or SSD wear.
-
Current Pending Sector Count. This counts the "unstable" sectors, meaning the damaged ones with read errors that are waiting for a remapping, a kind of "probation" system. S.M.A.R.T. algorithms have mixed understandings about this particular attribute, as it is sometimes unconvincing. Still, it can provide an earlier warning of possible problems.
-
Reported Uncorrectable Errors. It is the count of errors that are impossible to recover, and it is useful because it seems to have the same meaning for all manufacturers.
-
Erase Fail Count. This one is an excellent indicator of the premature death of a solid-state drive. It counts the number of failed data deletion attempts, and a value that increases tells you that the flash memory inside the SSD is close to its end-of-life.
-
Wear Leveling Count. This is also especially useful for SSDs. Manufacturers set the expected lifetime of an SSD in its SMART data. The Wear Leveling Count is an estimation of the health of your drive. It is calculated using an algorithm that takes into account the predefined expected lifetime and the number of cycles (write, erase, etc.) that each memory flash block can perform before reaching its end-of-life.
-
Disk temperature is a highly debated parameter. Still, it is considered that values above 60°C can reduce the lifespan of an HDD or SSD and increase the probability of damage. We recommend using a fan to decrease the temperature of your drives and hopefully prolong their life.
The above mentioned S.M.A.R.T. attributes are relatively easy to interpret. If you notice an increase in their values, it is possible that your drive is failing, so you'd better start backing up. However, although these are useful indicators of drive reliability, do not forget that they are not foolproof.
Historical note about SMART
SMART was developed beginning with the year 1992, although you know now that it is included by all modern solid-state drives and hard disk drives. Its history covers an array of names like Predictive Failure Analysis or IntelliSafe and input from all the major hard disk manufacturers: IBM, Seagate, Quantum, Western Digital. Finally, its documentation was featured for the first time in 2004 within the Parallel ATA standard and received regular revisions afterward. The latest one was issued in 2011.
Is there anything else you would like to know about SSD and HDD SMART?
This was our short study on the inner workings of S.M.A.R.T and its abilities to monitor, test, and predict hard disk failures. The main point of view you should remember is that this self-monitoring system can help you review the health status of your HDD. If you want to use this S.M.A.R.T data to see if your own drive has problems, read the articles we recommended in this tutorial. Also, for questions, use the comments form below, and let's discuss.