fbpx

Tipos de discos y configuraciones RAID usadas en servidores

 

Actualmente, en Internet, y en las empresas y negocios actuales, la información es lo más importante, ya que sin información no se podría trabajar.

Teniendo en cuenta que la información es lo más importante y que debemos tener cuidado con donde la guardamos y como la guardamos, los discos duros cobran especial importancia a la hora de almacenar datos, tanto en nuestro ordenador personal o profesional, como en el caso de los servidores de Internet que guardan datos.

En los servidores se suelen usar combinaciones de discos en espejo que guardan la información en varios discos al mismo tiempo, de esta forma si uno de los discos falla, existen más discos con la misma información y por lo tanto la información puede ser recuperada fácilmente y el servidor no llega a pararse.

configuración de discos

A continuación, vamos a explicar unos cuantos conceptos básicos de almacenamiento en servidores, lo que se utiliza hoy en día y lo que es más común encontrarse en empresas de hosting como Raiola Networks.

 

Tipos de RAID usados normalmente

Los servidores actualmente suelen usar los siguientes sistemas RAID, a pesar de que existen muchos más tipos de RAID que se podrían usar:

  • RAID 1: Dos discos duros conectados, se escribe y lee de los dos al mismo tiempo, por lo que, si uno falla, la actividad no se interrumpe, e incluso en algunos casos se puede sustituir el disco dañado en caliente.
  • RAID 5: Suele ser el RAID más usado, ya que aporta la velocidad y rendimiento del RAID 0 y además la seguridad ante perdida de datos del RAID 1, con la ventaja de que además se aprovecha mejor el espacio. Se necesitan un mínimo de 3 discos para configurar RAID5.
  • RAID 10: En el RAID 10 se combinan el RAID 1 y el RAID 0, puede ser un RAID 0 + 1 o un RAID 1 + 0, según se creen dos RAID 0 de dos RAID 1 cada uno, o al revés, dos RAID 1 de dos RAID 0 cada uno.
    La principal ventaja del RAID 10 frente al RAID 5 es que se evitan los cálculos de paridad, pero el RAID 10 depende como este montado, puede ser más inseguro que el RAID 5 a pesar de ofrecer un mayor rendimiento.

Sí que es verdad que existen más tipos de RAID y que se puede usar cualquiera si llegas al mínimo de discos duros requeridos para la combinación y al mínimo de hardware necesario para controlar el RAID, pero en servidores normalmente se usan estos tres tipos de RAID.

 

RAID por software vs RAID por hardware

Un sistema RAID puede ser controlado por hardware o por software, y aquí es donde también existe diferencia tanto de funcionamiento como de rendimiento:

  • RAID por software: Los discos se conectan a la placa o a una controladora, pero es el procesador del sistema y el sistema operativo quienes hacen las operaciones necesarias para controlar el RAID y los discos. Evidentemente, el rendimiento general del sistema puede verse afectado si el sistema RAID necesita muchos recursos para funcionar.
  • RAID por hardware: Los discos se conectan a una controladora RAID que es la encargada de realizar todas las operaciones de control del RAID y los discos.

Normalmente el RAID por hardware es más fiable que el RAID por software ya que es más independiente, aun así, en RAID 1 y RAID 10 no llega a notarse tanto si se usa RAID por software o RAID por hardware, ya que no se tienen que realizar operaciones de paridad que en el RAID 5 si son necesarias y normalmente en el RAID por hardware son realizadas por la controladora de red.

 

Tipos de discos

Ahora viene la parte en la que unos pueden estar de acuerdo y otros no, depende de las experiencias personales de cada profesional, las necesidades y otros muchos factores.

configuración discos

Vamos a plantear los tres tipos de discos duros más usados en servidores, y un tipo de disco “nuevo” que se suele usar en algunas ocasiones:

  • Discos SATA: Les llamo SATA por no llamarles magnéticos, son los discos convencionales que usan los ordenadores convencionales, eso sí, siempre preferible de 3,5 y especialmente fabricados para su uso en servidores, ya que van a estar muchas horas funcionando. No son la opción más potente, pero si una de las más seguras y económicas al mismo tiempo.
  • Discos SSD HDD: Son la novedad, su conexión se realiza por SATA por lo que el verdadero cuello de botella se encuentra en la conexión, ya que su velocidad de lectura, escritura y latencias de acceso son muchísimo mejores que en el caso de los discos SATA HDD normales que hemos comentado en el punto anterior.
    Actualmente son una excelente opción, solo tienen el problema de que si hay un incidente de hardware en el disco hay más posibilidades de que se pierdan datos sin posibilidad de recuperarlos, y además, la degradación de los discos SSD es mucho mayor que la de otros discos, es decir, tienen menos tiempo de vida y si se les exige rendimiento, rompen antes.
  • Discos SAS: Son los sustitutos directos de los discos SCSI, ofrecen un rendimiento individual intermedio entre SATA y SSD, aunque esto mejora con un RAID, de hecho, el rendimiento de un RAID 5 SAS bajo estrés puede llegar al nivel de un RAID 1 SSD, ya que la velocidad de rotación de los discos SAS suele ser mayor que la de los HDD magnéticos SATA convencionales.
    Por otro lado son discos pensados para servidores, su vida útil es más larga y suelen aguantar bien en condiciones donde otros discos se degradan rápido.
  • Discos Híbridos: Son discos que combinan SSD con HDD, es decir, son discos magnéticos que llevan implementado un pequeño disco SSD que en la mayoría de los casos sirve como cache de acceso inmediato.
    Teóricamente este tipo de discos que aún se ven poco, tienen la ventaja de poder almacenar más información que los discos SSD por el mismo precio, y mejoran la velocidad de los discos HDD magnéticos SATA convencionales por medio del cache.

En mi opinión, ningún tipo de disco es mejor que el anterior, los discos SATA y SAS son similares, son discos magnéticos, pero con diferente orientación y uso.
Los discos SSD son la nueva tecnología, el rendimiento mejora bastante, pero se reduce la vida útil del dispositivo y en algunos casos se hace necesario el RAID HARDWARE para no degradar el disco tan rápido.

 

Combinaciones recomendadas

Con todo lo que hemos visto en este artículo, como ves, podemos llegar a hacer muchas configuraciones, pero algunas simplemente no son viables por diferentes motivos y deben descartarse para su uso en servidores.

configuración discos

Vamos a detallar algunas configuraciones que solemos usar en Raiola Networks para servidores de clientes, servidores de hosting compartido y nodos de VPS:

  • RAID 1 SOFTWARE SSD: Esta combinación la implementamos cuando el cliente busca una forma barata de tener un servidor con discos SSD, lo recomendable es un RAID por hardware en estos casos, aunque tampoco se nota mucho la diferencia.
  • RAID 5 HARDWARE SATA: Es la combinación que más solemos implementar en servidores dedicados de clientes que no buscan un sistema SAS (más caro) y que buscan a la vez velocidad de carga y seguridad de datos.
  • RAID 5 HARDWARE SAS: Esta es la combinación que usamos en nuestros nodos de VPS, ofrece rendimiento casi como los RAID 1 SSD y al mismo tiempo ofrece la seguridad de estar usando un sistema RAID con discos especialmente orientados a servidores con un degradado mínimo. Esta combinación es más rápida y más segura que un RAID 5 SATA, pero también bastante más cara.
  • RAID 10 HARDWARE SSD: Es la solución más bestia que podemos encontrar, con una buena controladora RAID y con 4 discos SSD podemos encontrar tasas de lectura y escritura muy altas. Lo único malo es que suele ser una combinación cara y con poca capacidad de almacenamiento al compararla con un RAID de discos SATA HDD.
  • RAID 1 SOFTWARE SATA HDD: Es la solución estándar, la más solicitada por nuestros clientes de servidores dedicados, ya que es barato.

¿Y porque no un RAID 5 SOFTWARE? Porque el RAID 5 por software suele corromperse bastante debido a los cálculos de paridad, es más, en el caso de los discos SSD, los discos suelen destrozarse en cuestión de pocos meses (en servidores).

¿Qué usamos nosotros en hosting compartido? Empezamos usando RAID 5 SAS HARDWARE, pero actualmente hemos ido haciendo pruebas y nos hemos decantado por una combinación de doble sistema, por un lado, SAS y por el otro lado SSD, con esto conseguimos velocidad de carga y al mismo tiempo conseguimos que los datos estén siempre a salvo.

Share on twitter
Compartir en Twitter
Share on facebook
Compartir en Facebook
Share on pinterest
Compartir en Pinterest

¿Te gusta el blog?

Apúntate al boletín y te enviaremos los mejores artículos una vez al mes.

¿Te ayudamos?

Escríbenos si tienes dudas o necesitas una solución específica. Nuestros expertos te ayudarán en todo lo posible.

Sé el primero en enterarte de ofertas, sorteos y novedades.

Tenemos 3 comentarios en

"Tipos de discos y configuraciones RAID usadas en servidores"

3 respuestas

  1. Hola,

    Quería hacerte alguna puntualizaciones respecto al RAID. Veo algún detalle que podrías pulir.

    Empezar con el RAID 0. Ni más ni menos que una concatenación de discos, el dispositivo RAID resultante es la suma de los tamaños de los dispositivos que se añaden, 2 o más.

    En los RAID 1 también puedes disponer de más de dos dispositivos, en este caso, por seguridad (modo paranoid-bofh) o sobretodo por mejorar rendimiento. En equipos con muchas lecturas, al leer de un RAID1, si disponemos de una buena controladora, se harán lecturas en paralelo de los diferentes sectores a leer, lo que aumenta en gran medida la velocidad de lectura. Al escribir, siempre lo hacemos a todos por igual.

    En los RAID 5 escribes stripes + crc (check de redundancia), por lo que el tamaño de disco a desperdiciar en CRC depende del número de discos del RAID 5. Lo mínimo son 3, aunque yo prefiero hacerlos con más. En un RAID 5 con 3 HDD desperdicias 1 para CRC, pero en un RAID 5 de 8 HDD, sigues desperdiciando 1 para CRC, así que tienes más espacio útil.

    No lo mencionas, pero en todos puedes configurar dispositivos Hotspare (hablo de dispositivos y no discos porque puedes mezclar tecnologías tanto hardware como dispositivos software), para que entren a sustituir a un disco dañado. Es muy interesante disponer de ellos aunque en la práctica sean discos sin uso, si disponemos de información sensible, por lo mucho que tardan en sincronizarse los RAID con discos de gran tamaño, y ante el punto crítico que se produce entre que falla un dispositivo, y se sustituye para empezar a sincronizar. En este caso, el nuevo sustituirá al hotspare.

    Para la gente normal, con estos tres niveles de RAID tiene bastante. El RAID 10 supone un gran desperdicio de dispositivos, la mitad, frente a un RAID 5, así que solo es interesante en casos muy puntuales donde se haya estudiado el rendimiento.

    Pero puedes hacer combinaciones, por ejemplo, si quieres rendimiento salvaje, y mucha seguridad, lo más rápido con lo que he trabajado es con arrays de discos Sun en modo RAID 0 con 14 discos y dos hotspare, en parejas de arrays formando dispositivos RAID 1, y unidos entre sí (6 arrays) como un dispositivo RAID 5, para motar un storage de Oracle. Es un desperdicio brutal de discos, pero da una confiabilidad muy alta cuando tienes las máquinas en un CPD remoto y no puedes estar in situ al momento por un fallo puntual, y un rendimiento de E/S brutal (todo hardware)

    Un RAID muy interesante y que no se menciona es el que usa ZFS, y que desarrolló Sun, el RAID Z, que es más rápido que el RAID 5 y mejora la gestión de los stripes. Si montas un freenas o cualquier BSD lo tienes como opción fuera del entorno Solaris/OpenSolaris. Una cosa genial es hacer más grande el RAIDZ en caliente, cambiando discos del zopo por otros más grandes.

    El RAID por hardware SIEMPRE es más fiable que el RAID software, a menos claro que hablemos de fakeRAID (implementado en algunas BIOS) y de controladores marca nisupu. El motivo principal es que todos los sistemas de ficheros trabajan con cachés de lectura y escritura, y si solo hacemos direct-write perdemos mucho rendimiento. En las controladores hardware se incorpora una batería y memoria (a más de una y de otra puede salir prohibitiva en coste) con lo que en caso de corte eléctrico, se garantiza que se escriban todos los datos y por lo tanto el sistema de ficheros no tenga problemas de coherencia. Arrancar después de un crash y tardar una brutalidad en hacer un check de consistencia de un storage de BBDD es algo evitable.

    Comentas que los cálculos de paridad los hace la “controlador de red”. Se te coló.

    Lo fascinante del RAID por software, tal como lo implementa Linux o Mac OS X es que es muy flexible en cuanto a los dispositivos, y no te has de ceñir a geometrías físicas para reemplazar dispositivos. Eso tiene un coste en rendimiento brutal, pero permite llegar a hacer cosas como un RAID entre un pendrive y un HDD, por ejemplo, para salir del paso. O a hacer RAID a través de Internet como con NBD, y montar encima un sistema de ficheros GFS para tener alta disponibilidad. Pero ya son configuraciones más delicadas.

    En cuanto a los tipos de discos, lo mejor siempre es más discos más pequeños que pocos y grandes, por el tiempo que se tarda en reconstruir un array, sobretodo si es soft, y al ser sometidos a menos stress, se tendrá mayor fiabilidad. Yo me decanto por los SAS donde se pueda, los SSD dan mucho rendimiento pero para cierto tipo de stress, van a fallar prematuramente. Son discos perfectos para scratch.

    Respecto al RAID 5 software discrepo, ya que los he montado sin problema, eso sí, con buenas controladoras SATA, sino si que existe el peligro de degradación. Y con buenos HDD. Lo que machaca a estos RAID en mi experiencia es mal hardware (placa madre), discos baratos y cables SATA de mala calidad. Montando cosas de calidad no me han surgido inconsistencias.

    Y no es RAID pero ya que hablamos de dispositivos y rendimiento… Para sistemas de ficheros que requieran una tasa de lectura brutal, como por ejemplo el storage para Apache donde tenemos los PHP, podemos montar un RAMDRIVE, sincronizar el contenido con rsync o similar con el storage físico, y hacer que nuestras APPS lean del disco RAM. El problema es la volatilidad cuando se reincida el servidor.

    Saludos,

    1. Hola Juan Carlos, se trata de un articulo SIMPLE para que departamento comercial pueda explicarle de forma FACIL y RAPIDA, para clientes que no entiendan lo que es un RAID, si les paso una explicación tan detallada como la tuya, el cliente coge la puerta y se va…

      Un saludo.

      1. Definitivo, el compartir información no debería ser tan rebuscado, mucha gente con otras profesiones no conocen términos o entienden muy bien la tecnología y a la mayoría de los ingenieros en sistemas parece no importarles, yo soy Ing en Sistemas y estoy en total desacuerdo con aplicar terminología con personas que no tienen relación en el campo. Gracias por la info Álvaro. Saludos! MP

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

¡Aprovecha los precios más bajos del año! Contrata o renueva tu hosting o VPS SSD.​