Camisetas Guanabara.info !! Garanta já a sua!

Dicas de manutenção 1: … e o HD que veio do frio.

Categorias: MEGArtigos

23 comente

Depois de pensar e repensar (um pouco, pensar demais cansa), concluí que uma série de posts sobre dicas de montagem e manutenção de micros podem ser úteis a todos nós. Então, métodos pouco usuais serão falados por mim nessa sequência de posts. Como bom adepto do SL, creio que a informação clama por ser livre, e compartilhar conhecimento estabelece as bases para a formação de uma sociedade. A propósito, se você tiver uma dica interessante para contar, coloque nos comentários. Ah, uma última coisa: Na medida do possível vou linkar páginas para explicar o que estou falando, mas não vou explicar muito tudo, porque senão deixa de ser “dicas de manutenção” para ser “testamentos de manutenção”…

Começando esses posts, então… O que dizer de uma situação como essa abaixo?

HD no gelo

Isto é um HD congelado. E sim, ele está funcionando...

Ficou curioso? Pois continue lendo…

A motivação para começar essa série de dicas foi quando um HD de 500 Gb deu defeito. Se já é ruim um HD dar defeito, pior é quando ele faz parte de uma matriz RAID 0, e toda a matriz tranca pela falta dele. Explico: Eu tinha (do verbo “não tenho mais”) 3 HDs que juntos, formavam uma matriz de HDs no formato RAID 0. Os HDs eram um de 1,5 Tb, o de 500 Gb supracitado e a maior parte de um HD de 250 Gb. Todos os três são Seagate (prefiro Seagate, explico num próximo post). Logo, para o sistema (formatado em btrfs), todo o conjunto era um HD só, de 2,2 Tb. Como é RAID 0, os dados são salvos em todos os HDs, logo a menor partição logo encheu, seguida por 292 Mb consumidos no HD de 500 Gb, e mais outro tanto no HD de 1,5 Tb (o meu storage tinha 790 Gb ocupados).

Só que o problema de RAID 0 é que, quando um dos discos dá defeito, você pode ter sérios problemas para acessar o seu conteúdo. Como aconteceu comigo, todos os HDs foram “trancados”, e mesmo os HDs bons ficaram inacessíveis.

Outro close do HD no gelo

Outro close do HD no gelo

Primeira dica: Evite RAID 0. A não ser que você goste de viver perigosamente ou precise, use RAID 1 ou RAID 5. Esqueça RAID 0. Já usei RAID 0 num antigo servidor que mantive na escola onde leciono. Ele era um Pentium 166 com overclock para 200 Mhz (sim, um Pentium UM!), 48 Mb de memória RAM, 4 HDs que juntos faziam 10 Gb… E segurava um monte de coisas na minha rede. Montamos em RAID 0 para aproveitar melhor o espaço. Ah, já contei que os HDs eram presos com fio? Sim, fio grosso e encapado, 2 HDs presos, um na posição normal e outro, em cima, de cabeça para baixo. E funcionava. Mas eram HDs muito pequenos, não dava para fazer mais do que isso, e mesmo que se perdesse, tínhamos cópia em algum canto dos HDs dele, era só arrumar outras tranqueiras e recolocar por lá.

Segunda dica: Todo HD vai dar defeito. Você não sabe quando ou como irá dar defeito. Mas ele irá dar defeito. Escreva nos seus cadernos. Piche nas paredes. Passe esse conhecimento aos seus filhos e companheiros. Tatue na sua testa, se for preciso. Mas saiba que isso irá acontecer um dia.

Como formatei o sistema de arquivos usando btrfs (“Better FS”, “Butter FS” ou “B-Tree FS”), esperava não ter problemas para acessá-lo. O btrfs é um mega sistema de arquivos open-source, patrocinado pela Oracle, e cheio de recursos bacanas, como:

  • Você pode adicionar e remover volumes no seu sistema de arquivos de forma online. Ou seja, insira e remova HDs na sua base de dados sem ter que reiniciar nada.
  • Desfragmentação online. Claro que a fragmentação é muito pequena em sistemas de arquivos mais evoluídos, como ext2/3/4, HFS+, UFS, e porque não, NTFS. Mas o btrfs foi feito para ser usado em vários HDs.
  • Otimização para SSDs. Os SSDs estão chegando aos poucos. E, apesar de caríssimos (um SSD de 32 Gb está custando R$ 230, segundo o BoaDica, aqui do Rio), são muito rápidos, mas… Como qualquer mídia semelhante (isso vale para pendrives e cartões de memória), tem um número finito de acessos. Depois disso, adeus. O btrfs pode ser otimizado para usar SSDs, o que significa que realiza muito menos gravações e leituras, justamente para prolongar a vida útil do dispositivo.
  • Compressão de forma transparente, como é o caso de alguns sistemas, como o próprio NTFS tem.
  • Conversão de ext3/4 para btrfs e vice-versa.
  • Jornalização, o famoso sistema que permite que você desligue um computador à plena carga, e na reinicialização, a checagem é de apenas os possíveis arquivos corrompidos. O NTFS tem suporte, mas não sei se vem implementado como padrão.
  • Gerenciamento de matrizes RAID 0 (stripping) ou RAID 1 (mirroring) feito pelo próprio btrfs.
  • Uso de subvolumes, clonagem, copy-on-write, snapshots… Bem, explicando de uma forma mais fácil: sabe a Time Machine, da Apple? Que tal você ter isso embutido no seu sistema de arquivos, plenamente configurável por você, e funcionando melhor? Sim, a Time Machine não é um sistema de snapshots, mas somente um backup incremental num volume separado. No caso do btrfs, o sistema cuida disso tudo, no próprio volume.

Logo, com todos esses recursos (e mais alguns), o btrfs é o que há de novo em termos de sistemas de arquivos para Linux. O problema é que ele ainda está em desenvolvimento, na versão 0.19. Sistemas como o ZFS implementam soluções semelhantes, só que só podem ser usados com Linux usando soluções como o FUSE, já que há incompatibilidade de licenças (GPL e CDDL) entre o kernel Linux e o ZFS. No caso do ZFS, a fama é que você não corrompe os arquivos nem querendo. Mas mais detalhes sobre sistemas de arquivos ficam para um post sobre os filesystems, no futuro.

Voltando ao HD… Já usei ZFS, e perdi os dados por um erro meu. Usei btrfs então, pois por causa do FUSE o meu servidor “sentou no chão” com o ZFS acoplado e numa nova distribuição de Linux. Mas, inexplicavelmente, o btrfs não me deixou montar o sistema de arquivos (RAID 0) mesmo com um HD faltando (e a documentação dizia que era possível).

Terceira dica: Se você quer usar qualquer coisa experimental no computador, prepare-se para emoções fortes. Só achei que o ext4 fosse estável quando o próprio desenvolvedor (o Theodore T’so, o primeiro desenvolvedor norte-americano do kernel Linux) migrou o HD do seu desktop para o novo sistema de arquivos. Um dia irei usar btrfs novamente, mas por enquanto… Vamos no feijão-com-arroz, o ext4 mesmo.

Última investida: HD completamente congelado.

Última investida: HD completamente congelado.

Mas, como disse lá em cima, o HD morreu. Parou de funcionar, e não consegui acessar toda a base de dados, apesar do problema ser de um dos HDs apenas. Aí vem a pergunta: Como resolver? Bem… Alguns de vocês já devem ter ouvido falar sobre o “truque indígena” do resfriamento de discos rígidos para poder acessá-los quando dão defeito. A idéia é simples: Quando o disco tem algum problema na parte mecânica, abaixar a sua temperatura pode ajudar a resolver o problema temporariamente: Todos os componentes são, na sua maioria, de metal, e que contraem razoavelmente com a baixa temperatura. Logo, folgas que vierem a ocorrer serão diminuídas… Por um tempo. Quando o HD novamente se aquecer (o que não demora), o problema volta a acontecer, pois ele dilatou-se e voltou ao “normal”.

Resolvi então tentar. Comprei um novo HD de 1,5 Tb, exatamente igual ao HD anterior, e resolvi puxar todos os dados da base corrompida. O HD de 500 Gb tinha 294 Gb de dados, e tentei apenas congelá-lo na geladeira para tentar recuperar os dados. Consegui recuperar uma pequena parte (montando toda a matriz RAID), mas logo ele se aqueceu e voltou a ter problemas.

Quarta dica: Se você precisa ler o conteúdo de HDs periodicamente, uma boa compra é um adaptador IDE-USB. Esses adaptadores permitem que você espete um HD SATA, P-ATA (40/80 vias) ou um HD de notebook (44 pinos) via USB no micro, e vem com uma fonte externa para o dito. Existem docking stations, que são bases onde você espeta o HD na vertical. Funcionam muito bem, mas não são úteis em situações de… Congelamento. No meu caso, o meu adaptador quebrou uma árvore para ligar o HD. Já precisei trocar o sistema operacional dos meus netbooks (adeus “janelas”, bem-vindo Linux), e é muito mais fácil por um adaptador desses com um CD-ROM espetado do que passar o sistema para um pendrive, e fazer com que ela inicialize por lá. Fica muito mais fácil. Esses adaptadores devem custar uns R$ 40, hoje em dia, e compensa tê-los.

Quer mais? Continua no próximo post.

Related Posts with Thumbnails
  • rodrigo
    @rodrigo_lider - 27 - sao paulo

    Raid 0 realmente é uma aventura que pode ser meio desagradavel.

    Parabéns pelo post.

    [Responder]

    cmr Respondeu:

    Raid 0 não é aventura. Isso é mito. As chances de vc usar um único HD em sua máquina, como fazem a maioria das pessoas, e este queimar é exatamente a mesma chance de algum HD em Raid 0 queimar. Raid 0 serve para aumentar o desempenho, e não para fins de backup. Se você trabalha ou realiza alguma atividade que necessite de desempenho máximo, utilize Raid 0, caso fique com medo de seu HD queimar, compre um nobreak, ele vai proteger também outros componentes como placa mãe, memórias, etc. Utilizo Raid 0 a muitos anos e nunca tive problemas.

    @rodrigo,

    [Responder]

    Ricardo Pinheiro Respondeu:

    @cmr, um nobreak n impede q um HD dê defeito. E HDs dão defeito por diversos motivos, inclusive variação de tensão, q o nobreak contorna. Mas n protege. Eu usei RAID 0 em muitos lugares, mas hj em dia prefiro usar RAID 1 por uma questão de segurança. A perda q eu tenho de espaço é compensada pela maior segurança q eu tenho.

    [Responder]

    rodrigo Respondeu:

    @cmr, Cmr, digo que é uma aventura que pode ser meio desagradavel com base no meu trabalho. Em menos de um ano tivemos problemas com RAID0 em 5 workstations de grande porte o que gerou um grande transtorno e um tremendo retrabalho. Levando -se em conta a resposta do Ricardo Pinheiro o nobreak não garante que um dos Hds apresente defeito comprometendo a RAID0, pois o mesmo pode ocorrer por diversas razões. Devido a esse “triste” histórico eu não recomendo RAID0, mas por outro lado fico feliz por em muitos anos você nunca ter tido problema.

    Obrigado pela resposta.

    [Responder]

    cmr Respondeu:

    @cmr,
    Um nobreak realmente não impede que um HD dê defeito (na verdade nada impede), mas diminui bastante as chances de defeitos vindos de descargas elétricas ou piques de energia. Outros fatores como marca de qualidade e modelos/capacidade iguais em um Raid, também fazem a diferença. O que eu quiz dizer acima foi que utilizar Raid 0, não é só para “loucos”. Cada caso é um caso. Para alto desempenho, onde não se precise de backups periódicos, continuo recomendando o Raid 0. As chances de se ter perdas de dados são as mesmas que se utilizasse apenas um HD. Entretanto, em um servidor de dados por exemplo, com certeza esta não é uma boa opção. Tudo vai depender da realidade de cada um. Outra opção interessante é utilizar RAID 0+1, que é a combinação dos níveis 0 (Striping) e 1 (Mirroring).

    [Responder]

    Ricardo Pinheiro Respondeu:

    @cmr, RAID 0+1 (ou RAID 10), como queiram) será a opção q usarei em breve, qdo colocar + 2 HDs de 2 Tb cada um no meu servidor de casa. N é exagero, estou c/ 953 Gb ocupados, já.

    RAID 0 pode ter soado como coisa de maluco, mas se você precisa de segurança e/ou n pode se garantir c/ backups periódicos, é uma boa opção, pois vc ganha desempenho: Os dados são carregados simultaneamente de ambos os HDs. Eu já fiz algo parecido c/ Linux, anos atrás: Instalei o sistema, parte num HD, parte no outro. Como o sistema é multitarefa e multithread, eu tinha um ganho de desempenho qdo carregava dados e programas p/ a memória, já q ambas as controladoras IDE trabalhavam simultaneamente. Algo como um “dual channel” da IDE, como temos c/ a memória.

    Mas concordo contigo, cada caso é um caso. Eu usei RAID 0 num servidor montado c/ sucata e sobras de peças (vou ver se falo dele no futuro), e funcionou muito bem. Mas naquele caso, se ele funcionasse s/ problemas já era lucro…

    março 6, 2011 @ 9:21 am
  • Samurai
    @dankoudi - 25 - Floripa

    muito legal o post

    Eu tenho, ou melhor tinha, um hd externo da hp q usava como banco de arquivos que parou de funcionar e apesar da garantia, (eu dei entrada no pedido em outubro do ano passado e levaram até semana passada pra falar q não tem o modelo no estoque ¬¬’) eles nem sequer passaram pra pegar pra tentar recuperar os dados vou tentar isso assim que eles me retornarem a grana e puder comprar outro pra colocar os dados.

    [Responder]

    março 6, 2011 @ 10:22 am
  • 18 - Coari

    RAID0+1 e seus problemas estarão em boa parte resolvidos, o problema é a duplicação do número de HDs usando apenas RAID0.

    [Responder]

    março 6, 2011 @ 10:24 am
  • @jppcel - 15 Anos - Araguaína/TO

    mas pode usar no hd principal, pois ele tem um so nele, quero saber se dá pra fazer isso.

    [Responder]

    março 6, 2011 @ 12:37 pm
  • Fabiano

    Vc não montou os HDs em RAID 0 e sim em JOB, onde os HDs são somados e formam um só. Digo isso pois citou que seus HDs não estavam preenchidos igualitariamente e essa é uma característica do RAID 0, dividir uma informação a ser gravada por todos os HDs, igualmente. Se vc tem um arquivo de 3 MB a ser gravado, 1 MB estaria no primeiro HD, 1 MB no segundo e o ultimo 1 MB no terceiro. Essa é a definição de RAID 0, acessar todos os HDs ao mesmo tempo para diminuir os tempos de leitura e gravação e ganhar desempenho. Outra razão que posso afirmar que não usou RAID 0 e sim JOB, é pq seu RAID teria 750 GB em função do menor HD ter 250 GB e nos outros HDs o espaço ocupado seria o mesmo, totalizando 750 GB e não 2,2 TB como afirmado. E tanto RAID 0 como JOB têm a característica comum de ficarem inutilizados se um dos HDs membro falhar.

    [Responder]

    Ricardo Pinheiro Respondeu:

    @Fabiano, usei 1 HD de 1,5 Tb, 1 de 500 Gb e um pedaço de um HD de 250 Gb, totalizando 2,2 Tb. Vc deve ter citado o Just a Bunch Of Disks (JBOD), mas eu criei usando o btrfs, e na documentação (https://btrfs.wiki.kernel.org) tem uma opção de criar usando RAID 0. Agora, se é um JBOD montado no esquema de LVM, aí eu n sei. N usei as opções do Linux p/ montar um RAID via software (mdadm, etc e tal).

    [Responder]

    março 6, 2011 @ 2:39 pm
  • Leonardo Miranda
    @LeoSilvax - 14 - Juazeiro

    Boas dicas, bastantes úteis.

    [Responder]

    março 6, 2011 @ 3:30 pm
  • @JoatanGeek - 20 - Novo Hamburgo

    Poxa, estava com saudades das postagens do Ricardo Pinheiro.

    Ninugém melhor pra escrever artigos assim do que esse cara, tanto pelo fato de ter passado pelas situações descritas, assim como também, por ter uma grande bagagem de conhecimento técnico.

    Parabéns pelo texto, Ricardo!

    Abraços!

    [Responder]

    Ricardo Pinheiro Respondeu:

    @Joatan Fontoura, opa, obrigado Joatan. Esse texto (e o próximo) estavam rascunhados, finalizei e resolvi publicar logo. Quero ver se consigo reestabelecer uma constante na escrita por aqui. Vamos ver se consigo. Vai torcendo aí! =)

    [Responder]

    Gustavo Guanabara Respondeu:

    @Ricardo Pinheiro, também estou na torcida :) Seus artigos são muito bem-vindos aqui ;)

    [Responder]

    Joatan Fontoura Respondeu:

    @Gustavo Guanabara, Fala Guanabara!

    E nós bem sabemos disso!
    O Ricardo é um colunista único!

    Abraços!

    Ricardo Pinheiro Respondeu:

    @Joatan Fontoura, mesmo pq se houvessem 2 no mundo, um seria clone… :-)

    Joatan Fontoura Respondeu:

    @Ricardo Pinheiro, Beleza!

    Vamos ficar na torcida, então!

    Abraços!

    [Responder]

    março 7, 2011 @ 1:51 am
  • @jppcel - 15 Anos - Araguaína-TO

    Ajudou esse artigo, estou usando meu querido HD de 320 GB, quero ver se da pra arrumar sem necessidade de mandar pra assistencia tecnica, não mechendo no HD, pois eu não tenho uma sala Limpa aqi em casa ( Mais informações ouça os guanacasts e vai entender) e peço que me ajudem com ajuda moral, pois eu tava com saudade do “Janelas”!

    [Responder]

    Ricardo Pinheiro Respondeu:

    @João Paulo Polles, sinceramente… Copie, esvazie o seu HD, rode um teste do fabricante, e se der erro, mande p/ o fabricante solicitando a troca (caso esteja na garantia). N corra riscos. ;-)

    [Responder]

    março 7, 2011 @ 1:57 am
  • Alex Luiz
    @alexluizz - 24 - Camboriu

    Essa e uma GAMBS das boas!!

    [Responder]

    Ricardo Pinheiro Respondeu:

    @Alex Luiz, essa gambiarra foi uma das melhores q já fiz, mas ainda tem outras… ;-)

    [Responder]

    março 7, 2011 @ 9:50 am
  • @zaza_rodrigues - 16 anos - Bertioga - SP

    Ótimo post, nunca imaginei que congelar o danado poderia funcionar legal.! :) muito bom!

    [Responder]

    março 13, 2011 @ 2:24 pm

Comentar