Могу ли подаци на хард дисковима деградирати без упозорења о штети?
Сви се бринемо о чувању наших података и датотека сигурним и нетакнутим, али да ли је могуће да подаци буду оштећени и да им корисник може приступити без обавештења или упозорења било које врсте о проблему? Данашња постова за питања и одговоре СуперУсер имају одговор на забринуто питање читатеља.
Данашња сесија питања и одговора долази нам захваљујући СуперУсер-у - подјела Стацк Екцханге-а, груписане од стране заједнице веб-локација за питања и одговоре.
Фотографија љубазношћу усаглашавања (Флицкр).
Питање
СуперУсер читач топо морто жели да зна да ли се подаци на чврстим дисковима могу деградирати и приступити без упозорења о оштећењу:
Да ли је могуће да физичка деградација чврстог диска може да проузрокује да се битови „преокрену“ у садржају датотеке, а да оперативни систем не примети промену и обавести корисника о томе када чита фајл? На пример, може ли се „п“ (бинарно 01110000) у АСЦИИ текстуалној датотеци променити у „к“ (бинарно 01110001), онда када корисник отвори фајл, они виде „к“ без да знају да је дошло до грешке.?
Заинтересован сам за одговоре који се односе на ФАТ, НТФС или РеФС (ако то чини разлику). Желим да знам да ли оперативни системи штите кориснике од тога, или ако треба да проверавамо наше податке за варијације између копија током времена.
Могу ли се подаци на тврдим дисковима деградирати и приступити без упозорења о штети?
Одговор
Допринос СуперУсер-а Гунтрам Блохм има одговор за нас:
Да, постоји нешто што се зове ситна трулеж. Али не, то неће утицати на корисника незапажено.
Када тврди диск напише сектор на плоче, он не пише само битове на исти начин на који су похрањени у РАМ-у, он користи кодирање како би се увјерио да нема секвенци истог бита које су предуге. Он такође додаје ЕЦЦ кодове који му дозвољавају да поправи грешке које утичу на неколико битова и откривају грешке које утичу на више од неколико битова.
Када тврди диск чита сектор, он провјерава ЕЦЦ кодове и поправља податке ако је потребно (и ако је могуће). Шта се даље дешава зависи од околности и фирмвера чврстог диска, на који утиче ознака погона.
- Ако се сектор може прочитати и нема проблема са ЕЦЦ кодом, онда се он преноси на оперативни систем.
- Ако се сектор може лако поправити, поправљена верзија може бити записана на диск, прочитана назад, а затим потврђена да би се утврдило да ли је грешка случајна (тј. Космичке зраке, итд.) Или ако постоји системска грешка у медијима.
- Ако тврди диск утврди да постоји грешка у медијима, он преусмјерава сектор.
- Ако се сектор не може прочитати нити исправити након неколико покушаја читања (на чврстом диску који је означен као РАИД тврди диск), онда ће се тврди диск одустати, прераспоредити сектор и рећи контролеру да је дошло до проблема . Ослања се на РАИД контролер да реконструише сектор од осталих РАИД чланова и да га поново напише на неисправан хард диск, који га затим складишти у прераспоређеном сектору (за који се надамо да нема проблема)..
- Ако се сектор не може прочитати или исправити на хард диску на радној површини, онда ће се тврди диск укључити у више покушаја да га прочита. У зависности од квалитета чврстог диска, то може да подразумева репозиционирање главе, проверавање да ли има било каквих битова који се преклапају када се читају више пута, проверавајући који су битови најслабији, и још неколико других ствари. Ако било који од ових покушаја успије, тврди диск ће преусмјерити сектор и вратити натраг поправљене податке.
Ово је једна од главних разлика између чврстих дискова који се продају као „десктоп“, „НАС / РАИД“ или „видео надзор“ хард дискова. РАИД чврсти диск може брзо да одустане и да контролор поправи сектор да би се избегла латенција на страни корисника. Стони хард диск ће наставити да се труди изнова и изнова, јер ако корисник чека неколико секунди је вероватно боље него да им каже да су подаци изгубљени. И видео хард диск има константне брзине преноса података више него опоравак од грешке, јер оштећени оквир обично неће бити ни приметан.
У сваком случају, хард диск ће знати да ли је дошло до ротације, обично ће се опоравити од њега, а ако не може, рећи ће контролеру који ће рећи возачу који ће онда рећи оперативном систему. Затим, на оперативном систему је да прикаже грешку кориснику и да реагује на њега. Зато сајбер каже:
- Никада нисам био свједоком само једне грешке, али сам видио доста тврдих дискова гдје су цијели сектори пропали.
Тврди диск ће знати да ли нешто није у реду са сектором, али неће знати који битови нису успели. Један бит који није успио увијек ће бити ухваћен од стране ЕЦЦ-а.
Имајте на уму да цхкдск и систем датотека који се аутоматски поправљају не адресирају поправке података унутар датотека. Они су усмерени на корупцију унутар структуре самог система датотека, као што је разлика у величини датотеке између уноса у директоријуму и броја додељених блокова. Својство самоизљечења НТФС-а ће открити структурално оштећење и спријечити га да даље утиче на ваше податке, али неће поправити податке који су већ оштећени.
Наравно, постоје и други разлози због којих се подаци могу оштетити. На пример, лош РАМ на контролеру може да промени податке пре него што се пошаље чак и на чврсти диск. У том случају, ниједан механизам на чврстом диску неће открити или поправити податке, а то може бити један од разлога зашто је структура датотечног система оштећена. Други разлози укључују грешке у софтверу, губитак струје током писања на хард диск (мада се ово односи на записивање системског фајла), или лоше управљачке програме система датотека (НТФС драјвер на Линук-у је већ дуже време само за читање јер је НТФС обрнуто пројектован, нису документовани, а програмери нису веровали сопственом коду).
- Имао сам овај сценарио једном када би апликација сачувала све своје датотеке на два различита сервера у два различита дата центра, како би радна копија података била доступна под свим околностима. После неколико месеци приметили смо да се око 0,1% свих копираних датотека не подудара са МД5 контролном сумом коју је апликација складиштила у својој бази података. Показало се да је то неисправан кабл између сервера и САН-а.
Ови други разлози су зашто неки датотечни системи, попут ЗФС-а, чувају додатне информације о суми провјере како би открили грешке. Они су дизајнирани да вас штите од много више ствари које могу да крену наопако од само трулежи.
Имате ли нешто да додате објашњењу? Звучи у коментарима. Желите ли прочитати више одговора од других технолошки паметних Стацк Екцханге корисника? Погледајте цео дискусију овде.