Menú
Es gratis
registro
casa  /  Firmware/ ¿Cómo elegir un sistema de almacenamiento? Sistemas de almacenamiento de datos DAS, NAS, SAN. Elección de un sistema de almacenamiento Almacenamiento unificado

¿Cómo elegir un sistema de almacenamiento? Sistemas de almacenamiento de datos DAS, NAS, SAN. Elección de un sistema de almacenamiento Almacenamiento unificado

Este artículo se centrará en los sistemas de almacenamiento de nivel de entrada y de rango medio y las tendencias que están surgiendo en la industria actual. Para mayor comodidad, llamaremos unidades de sistemas de almacenamiento de datos.

Primero, nos detendremos un poco en la terminología y los fundamentos tecnológicos del almacenamiento autónomo, y luego pasaremos a los nuevos productos y la discusión de los avances modernos en varios grupos de tecnología y marketing. También nos aseguraremos de decirle por qué necesita sistemas de un tipo u otro y qué tan efectivo es su uso en diferentes situaciones.

Subsistemas de disco independientes

Para comprender mejor las características de las unidades autónomas, analicemos un poco una de las tecnologías más simples para construir sistemas de almacenamiento de datos: la tecnología orientada a bus. Proporciona el uso de una caja de unidad de disco y un controlador PCI RAID.

Figura 1. Tecnología de almacenamiento orientada a bus

Por lo tanto, entre los discos y el bus PCI del host (del inglés. Anfitrión- en este caso, una computadora autónoma, por ejemplo, un servidor o estación de trabajo) solo hay un controlador, que determina en gran medida la velocidad del sistema. Las unidades construidas sobre este principio son las más productivas. Pero debido a las características arquitectónicas, su uso práctico, con la excepción de casos raros, se limita a configuraciones de un solo host.

Las desventajas de la arquitectura de unidad orientada al bus incluyen:

  • uso efectivo solo en configuraciones de un solo host;
  • dependencia del sistema operativo y la plataforma;
  • escalabilidad limitada;
  • oportunidades limitadas para organizar sistemas tolerantes a fallas.

Naturalmente, todo esto no importa si los datos son necesarios para un servidor o estación de trabajo. Por el contrario, en tal configuración obtendrá el máximo rendimiento por el mínimo dinero. Pero si necesita un sistema de almacenamiento para un gran centro de datos, o incluso dos servidores que necesitan los mismos datos, una arquitectura orientada al bus es completamente inadecuada. Las desventajas de esta arquitectura se evitan mediante la arquitectura de los subsistemas de disco autónomos. El principio básico de su construcción es bastante simple. El controlador que controla el sistema se mueve desde la computadora host al gabinete de la unidad, lo que proporciona una operación independiente del host. Cabe señalar que dicho sistema puede tener una gran cantidad de canales de entrada / salida externos, lo que hace posible conectar varias, o incluso muchas, computadoras al sistema.


Figura 2. Sistema de almacenamiento independiente

Cualquier sistema de almacenamiento inteligente consta de código de hardware y software. En un sistema autónomo siempre hay memoria, que almacena el programa de algoritmos para el funcionamiento del propio sistema y los elementos de procesamiento que procesan este código. Un sistema de este tipo funciona independientemente de los sistemas host con los que esté asociado. Gracias a su inteligencia, las unidades autónomas a menudo implementan de forma independiente muchas funciones para garantizar la seguridad y la gestión de los datos. Una de las funciones básicas y casi ubicuas más importantes es RAID (Redundant Array of Independent Disks). Otro, que ya pertenece a los sistemas de gama media y alta, es la virtualización. Proporciona funciones como copia instantánea o copia de seguridad remota, así como otros algoritmos bastante sofisticados.

Brevemente sobre SAS, NAS, SAN

Como parte de la consideración de los sistemas de almacenamiento de datos autónomos, es imperativo insistir en cómo los sistemas host acceden a las unidades. Esto determina en gran medida el alcance de su uso y arquitectura interna.

Hay tres opciones principales para organizar el acceso a las unidades:

  • SAS (almacenamiento adjunto al servidor): una unidad conectada al servidor [el segundo nombre es DAS (almacenamiento adjunto directo), una unidad conectada directamente];
  • NAS (almacenamiento conectado a la red): un dispositivo de almacenamiento conectado a una red;
  • SAN (Storage Area Network) es una red de área de almacenamiento.

Ya hemos escrito sobre las tecnologías SAS / DAS, NAS y SAN en el artículo dedicado a SAN, si alguien está interesado en esta información, le recomendamos que consulte las páginas de iXBT. Pero aún así, refresquemos un poco el material con énfasis en el uso práctico.

SAS / DAS- Este es un método de conexión tradicional bastante simple, que implica la conexión directa (de ahí el DAS) del sistema de almacenamiento a uno o más sistemas host a través de una interfaz de canal de alta velocidad. A menudo, en tales sistemas, se usa la misma interfaz para conectar la unidad al host que se usa para acceder a los discos internos del sistema host, que generalmente proporciona un alto rendimiento y una conexión fácil.

Se puede recomendar el uso del sistema SAS en caso de que sea necesario procesar a alta velocidad grandes cantidades de datos en uno o más sistemas host. Esto, por ejemplo, puede ser un servidor de archivos, una estación de gráficos o un sistema de clúster de conmutación por error que consta de dos nodos.



Figura 3. Sistema agrupado con almacenamiento compartido

NAS- una unidad que está conectada a la red y proporciona acceso a archivos (nota - archivo, no bloque) a los datos para los sistemas host en la LAN / WAN. Los clientes que trabajan con NAS suelen utilizar los protocolos NSF (Network File System) o CIFS (Common Internet File System) para acceder a los datos. El NAS interpreta los comandos de los protocolos de archivo y ejecuta la solicitud a las unidades de disco de acuerdo con el protocolo de canal utilizado en él. De hecho, la arquitectura NAS es la evolución de los servidores de archivos. La principal ventaja de una solución de este tipo es la velocidad de implementación y la calidad de organizar el acceso a los archivos, debido a la especialización y el enfoque limitado.

Con base en lo anterior, se puede recomendar el uso de NAS si necesita acceso a los archivos en la red y los factores suficientemente importantes son: la simplicidad de la solución (que suele ser una especie de garantía de calidad) y la facilidad de mantenimiento e instalación... Un gran ejemplo de esto es cuando se utiliza un NAS como servidor de archivos en la oficina de una pequeña empresa donde la facilidad de instalación y administración es importante. Pero al mismo tiempo, si necesita acceder a archivos de una gran cantidad de sistemas host, una potente unidad NAS, gracias a una sofisticada solución especializada, es capaz de proporcionar un intercambio de tráfico intensivo con un enorme grupo de servidores y estaciones de trabajo a un precio razonable. bajo costo de la infraestructura de comunicación utilizada (por ejemplo, Gigabit Ethernet y conmutadores de par trenzado de cobre).

SAN- red de almacenamiento de datos. Las SAN suelen utilizar el acceso a datos en bloque, aunque las redes de almacenamiento se pueden conectar a dispositivos que brindan servicios de archivos, como NAS. En las implementaciones modernas de redes de almacenamiento, el protocolo de canal de fibra se usa con mayor frecuencia, pero en general no es necesario y, por lo tanto, se acostumbra asignar una clase separada de SAN de canal de fibra (redes de área de almacenamiento basadas en canal de fibra).

La SAN se basa en una red separada de la LAN / WAN, que sirve para organizar el acceso a los datos de los servidores y estaciones de trabajo que participan directamente en el procesamiento. Esta estructura hace que sea relativamente fácil construir sistemas de alta disponibilidad y alta demanda. Si bien las SAN siguen siendo una propuesta costosa en la actualidad, el TCO (costo total de propiedad) para sistemas medianos a grandes construidos con tecnología SAN es bastante bajo. Para obtener una descripción de las formas de reducir el TCO del almacenamiento empresarial con SAN, consulte las páginas de recursos de techTarget: http://searchstorage.techtarget.com.

Hoy en día, el costo de las unidades de disco con soporte de canal de fibra, como la interfaz más común para construir SAN, está cerca del costo de los sistemas con interfaces de canal tradicionales de bajo costo (como SCSI paralelo). Los principales componentes de costo en una SAN siguen siendo la infraestructura de comunicaciones, así como el costo de su implementación y mantenimiento. En este sentido, en el marco del SNIA y de muchas organizaciones comerciales, se está trabajando activamente en tecnologías de Almacenamiento IP, lo que permite utilizar equipos e infraestructura mucho más económicos para las redes IP, así como la colosal experiencia de especialistas en esta área. .

Hay muchos ejemplos de uso eficaz de SAN. Una SAN se puede utilizar en casi cualquier lugar donde sea necesario utilizar varios servidores con un sistema de almacenamiento compartido. Por ejemplo, para organizar el trabajo en equipo sobre datos de video o preprocesar productos impresos. En una red de este tipo, cada participante en el proceso de procesamiento de contenido digital tiene la oportunidad de trabajar casi simultáneamente en Terabytes de datos. O, por ejemplo, organizar copias de seguridad de grandes cantidades de datos que utilizan muchos servidores. Cuando se crea una SAN y se utiliza un algoritmo de copia de seguridad de datos independiente de LAN / WAN y tecnologías de "instantánea", se puede realizar una copia de seguridad de casi cualquier cantidad de información sin comprometer la funcionalidad y el rendimiento de todo el complejo de información.

Canal de fibra en SAN

Es un hecho innegable que hoy es FC (Fibre Channel) el que domina las redes de almacenamiento. Y fue el desarrollo de esta interfaz lo que condujo al desarrollo del propio concepto de SAN.

En el diseño del FC participaron expertos con una experiencia significativa en el desarrollo de interfaces de red y de canal, y lograron combinar todas las características positivas importantes de ambas direcciones. Una de las ventajas más importantes del Fibre Channel, junto con los parámetros de velocidad (que, por cierto, no siempre son los principales para los usuarios de SAN y se pueden implementar con otras tecnologías) es la capacidad de trabajar en largas distancias y la flexibilidad de topología. , que llegó al nuevo estándar de las tecnologías de red ... Por lo tanto, el concepto de construcción de una topología de red de almacenamiento se basa en los mismos principios que las redes de área local tradicionales, basadas en concentradores, conmutadores y enrutadores, lo que simplifica enormemente la construcción de configuraciones de sistemas de múltiples nodos, incluso sin un solo punto de falla.

También vale la pena señalar que Fibre Channel utiliza medios de fibra y cobre para la transmisión de datos. Al organizar el acceso a sitios geográficamente remotos a una distancia de hasta 10 kilómetros, se utilizan equipos estándar y fibra monomodo para la transmisión de señales. Si los nodos están separados por 10 o incluso 100 kilómetros, se utilizan amplificadores especiales. Al construir tales SAN, se tienen en cuenta parámetros que son poco convencionales para los sistemas de almacenamiento de datos, por ejemplo, la velocidad de propagación de la señal en fibra.

Tendencias de almacenamiento

El mundo del almacenamiento es extremadamente diverso. Las capacidades de los sistemas de almacenamiento de datos y el costo de las soluciones están bastante diferenciados. Existen soluciones que combinan las capacidades de atender cientos de miles de solicitudes por segundo a decenas e incluso cientos de Terabytes de datos, así como soluciones para una computadora con discos IDE económicos.

IDE RAID

Recientemente, la capacidad máxima de las unidades con interfaz IDE ha crecido enormemente y supera a las unidades SCSI en aproximadamente dos veces, y si hablamos de la relación precio por unidad de volumen, las unidades IDE lideran en más de 6 veces. Desafortunadamente, esto no afectó positivamente la confiabilidad de los discos IDE, pero sin embargo, el alcance de su uso en sistemas de almacenamiento de datos independientes está aumentando inexorablemente. El factor principal en este proceso es que la demanda de grandes cantidades de datos crece más rápido que el volumen de discos individuales.

Hace unos años, los fabricantes poco comunes decidieron lanzar subsistemas independientes centrados en el uso de discos IDE. Hoy en día, son producidos por casi todos los fabricantes enfocados en el mercado de sistemas de nivel de entrada. El más extendido en la clase de subsistemas independientes con discos IDE se observa en los sistemas NAS de nivel de entrada. Después de todo, si usa un NAS como servidor de archivos con una interfaz Fast Ethernet o incluso Gigabit Ethernet, en la mayoría de los casos el rendimiento de dichos discos es más que suficiente y su baja confiabilidad se compensa con el uso de la tecnología RAID.

Cuando se requiere acceso en bloque a los datos al precio más bajo por unidad de información almacenada, hoy en día se utilizan activamente sistemas con discos IDE en el interior y con una interfaz SCSI externa. Por ejemplo, en el sistema JetStor IDE fabricado por la empresa estadounidense AC&NC para construir un archivo tolerante a fallas con un volumen de almacenamiento de 10 Terabytes y la posibilidad de acceso rápido en bloque a los datos, el costo de almacenar un megabyte será de menos de 0.3 centavos. .

Otra tecnología interesante y bastante original con la que tuve que familiarizarme recientemente fue el sistema Raidsonic SR-2000 con una interfaz IDE paralela externa.


Figura 4. RAID IDE autónomo de nivel de entrada

Es un sistema de disco independiente diseñado para usar dos discos IDE y está diseñado para montarse dentro de un gabinete del sistema host. Es completamente independiente del sistema operativo de la máquina host. El sistema le permite organizar RAID 1 (espejo) o simplemente copiar datos de un disco a otro con discos intercambiables en caliente, sin ningún daño o inconveniente por parte del usuario de la computadora, lo cual no se puede decir de los subsistemas orientados al bus integrados en Controladores PCI IDE RAID ...

Cabe señalar que los principales fabricantes de unidades IDE han anunciado el lanzamiento de unidades de gama media con interfaz Serial ATA, que utilizarán tecnologías de alto nivel. Esto debería afectar positivamente su confiabilidad y aumentar la participación de las soluciones ATA en los sistemas de almacenamiento de datos.

Que nos traerá Serial ATA

Lo primero y más agradable que puedes encontrar en Serial ATA es el cable. Debido al hecho de que la interfaz ATA se convirtió en serie, el cable se volvió redondo y el conector más estrecho. Si ha tenido que enrutar cables paralelos IDE a través de ocho canales IDE en su sistema, estoy seguro de que le encantará esta función. Por supuesto, los cables IDE redondos existen desde hace mucho tiempo, pero su conector sigue siendo ancho y plano, y la longitud máxima permitida de un cable ATA paralelo no es alentadora. Al construir sistemas con una gran cantidad de discos, la presencia de un cable estándar no ayuda mucho en absoluto, ya que los cables deben fabricarse de forma independiente y, al mismo tiempo, su tendido se convierte en casi la tarea principal en el tiempo durante el montaje.

Además de las peculiaridades del sistema de cable, Serial ATA tiene otras innovaciones que no se pueden implementar de forma independiente para la versión paralela de la interfaz utilizando un cuchillo de oficina u otra herramienta útil. Los discos con la nueva interfaz pronto deberían admitir el conjunto de instrucciones Native Command Queueing. Con Native Command Queueing, el controlador Serial ATA analiza las solicitudes de E / S y optimiza el orden de ejecución para minimizar el tiempo de búsqueda. La similitud de la idea de la cola de comandos nativa de Serial ATA con la organización de la cola de comandos en SCSI es bastante obvia, sin embargo, para Serial ATA se admitirá una cola de hasta 32 comandos, y no la tradicional para SCSI-256. También ha aparecido el soporte nativo para el intercambio en caliente de dispositivos. Por supuesto, tal posibilidad existía antes, pero su implementación estaba fuera del alcance de la norma y, por lo tanto, no podía ser ampliamente utilizada. Hablando de las nuevas capacidades de alta velocidad de Serial ATA, cabe destacar que ahora no están muy contentos con ellas, pero lo principal aquí es que existe una buena Hoja de Ruta para el futuro, que sería muy difícil de implementar dentro de el marco de ATA paralelo.

Teniendo en cuenta lo anterior, no hay duda de que la participación de las soluciones ATA en los sistemas de almacenamiento de nivel de entrada debería aumentar precisamente debido a las nuevas unidades y sistemas de almacenamiento Serial ATA enfocados en el uso de dichos dispositivos.

Adónde va el SCSI paralelo

Cualquiera que trabaje con sistemas de almacenamiento, incluso los de nivel de entrada, difícilmente puede decir que le gustan los sistemas con discos IDE. La principal ventaja de los discos ATA es su bajo precio en comparación con los dispositivos SCSI y, probablemente, un menor nivel de ruido. Y todo esto sucede por una sencilla razón, ya que la interfaz SCSI es más adecuada para su uso en sistemas de almacenamiento y, si bien es mucho más barata que la interfaz aún más funcional, Fibre Channel, las unidades con una interfaz SCSI se producen de mejor calidad, más confiable y más rápido que con una interfaz IDE barata.

Actualmente, muchos fabricantes utilizan Ultra 320 SCSI, la interfaz más nueva de la familia, para diseñar sistemas de almacenamiento SCSI en paralelo. Una vez en muchos Roadmaps hubo planes para lanzar dispositivos con una interfaz SCSI Ultra 640 e incluso Ultra 1280, pero todo se redujo al hecho de que había que cambiar radicalmente algo en la interfaz. Ya ahora, en la etapa de uso del Ultra 320, SCSI paralelo no se adapta a muchos, principalmente debido a la inconveniencia de usar cables clásicos.

Afortunadamente, recientemente se ha introducido una nueva interfaz Serial Attached SCSI (SAS). El nuevo estándar tendrá características interesantes. Combina algunas de las capacidades de Serial ATA y Fibre Channel. A pesar de esta rareza, debería decirse que hay algo de sentido común en este entrelazamiento. El estándar se originó a partir de las especificaciones físicas y eléctricas de la serie ATA, con mejoras como el aumento de los niveles de señal para aumentar la longitud de los cables en consecuencia y el aumento de la capacidad máxima de direccionamiento de los dispositivos. Y lo más interesante es que los tecnólogos prometen brindar compatibilidad de dispositivos Serial ATA y SAS, pero solo en las próximas versiones de los estándares.

Las características más importantes de SAS incluyen:

  • interfaz punto a punto;
  • interfaz de dos canales;
  • soporte para 4096 dispositivos en el dominio;
  • conjunto estándar de comandos SCSI;
  • cable de hasta 10 metros de largo;
  • Cable de 4 hilos;
  • duplex completo.

Debido a que la nueva interfaz ofrece el mismo conector en miniatura que Serial ATA, los desarrolladores tienen una nueva oportunidad de construir dispositivos más compactos con alto rendimiento. El estándar SAS también prevé el uso de expansores. Cada expansor admitirá el direccionamiento de 64 dispositivos con la capacidad de conectar en cascada hasta 4096 dispositivos dentro de un dominio. Ciertamente, esto es significativamente menor que las capacidades de Fibre Channel, pero para los sistemas de almacenamiento de nivel de entrada y de rango medio, con unidades conectadas directamente al servidor, esto es suficiente.

A pesar de todas sus ventajas, es poco probable que el SCSI conectado en serie reemplace rápidamente la interfaz paralela convencional. En el mundo de las soluciones empresariales, el desarrollo suele ser más riguroso y, naturalmente, lleva más tiempo que el desarrollo de escritorio. Sí, y las tecnologías antiguas no desaparecen muy rápidamente, ya que el período para el que funcionan también es bastante largo. Aún así, en el año 2004, los dispositivos con interfaz SAS deberían ingresar al mercado. Naturalmente, al principio serán principalmente discos y controladores PCI, pero en un año más o menos los sistemas de almacenamiento de datos se pondrán al día.

Para una mejor generalización de la información, le sugerimos que se familiarice con una comparación de interfaces modernas y nuevas para sistemas de almacenamiento de datos en forma de tabla.

1 - El estándar regula una distancia de hasta 10 km para fibra monomodo, existen implementaciones de dispositivos para transmitir datos a una distancia de más de 105 m.

2 - Los concentradores y algunos conmutadores FC operan dentro de la topología de anillo virtual interno, también hay muchas implementaciones de conmutadores que proporcionan conectividad punto a punto de cualquier dispositivo conectado a ellos.

3 - Existen implementaciones de dispositivos con protocolos SCSI, FICON, ESCON, TCP / I, HIPPI, VI.

4 - El caso es que los dispositivos serán compatibles entre sí (esto es lo que los fabricantes prometen hacer en un futuro próximo). Es decir, los controladores SATA admitirán unidades SAS y los controladores SAS admitirán unidades SATA.

Locura masiva de NAS

Recientemente, ha habido una fascinación masiva por las unidades NAS en el extranjero. El hecho es que con la creciente relevancia de un enfoque orientado a los datos para la construcción de sistemas de información, aumentó el atractivo de la especialización de los servidores de archivos clásicos y la formación de una nueva unidad de marketing, NAS. Al mismo tiempo, la experiencia en la construcción de tales sistemas fue suficiente para un inicio rápido de la tecnología de los dispositivos de almacenamiento conectados a la red, y el costo de su implementación de hardware fue extremadamente bajo. Hoy en día, las unidades NAS son producidas por prácticamente todos los fabricantes de sistemas de almacenamiento, incluidos los sistemas de nivel de entrada por muy poco dinero y los de tamaño mediano, e incluso los sistemas responsables de almacenar decenas de Terabytes de información, capaces de procesar una cantidad colosal de solicitudes. . Cada clase de sistemas NAS tiene sus propias e interesantes soluciones originales.

NAS basado en PC en 30 minutos

Queremos describir una pequeña solución de nivel de entrada original. Se puede discutir sobre el valor práctico de su implementación, pero no se puede negar la originalidad.

De hecho, una unidad NAS de nivel de entrada, y no solo una de nivel de entrada, es una computadora personal bastante simple con una cierta cantidad de discos y software que proporciona a otros miembros de la red acceso a datos a nivel de archivo. Por lo tanto, para construir un dispositivo NAS, es suficiente tomar estos componentes y conectarlos. El punto es qué tan bien lo hace, así como el grupo de trabajo que trabaja con los datos a los que su dispositivo proporciona acceso recibirá acceso confiable y de alta calidad a los datos. Si se tienen en cuenta estos factores, así como el tiempo de implementación de la solución, además de algunas investigaciones de diseño, se está construyendo una unidad NAS de nivel de entrada.

La diferencia entre una buena solución NAS de nivel de entrada con personal autoensamblado y personalizado dentro del sistema operativo elegido, si nuevamente omitimos el diseño, será:

  • qué tan rápido lo harás;
  • cuán fácil puede ser mantenido este sistema por personal no calificado;
  • qué tan bien funcionará y será respaldada esta solución.

En otras palabras, en el caso de una selección profesional de componentes y la existencia de un determinado conjunto de software configurado inicialmente, se puede lograr un buen resultado. La verdad parece banal, lo mismo puede decirse de cualquier tarea que se resuelva según el esquema de las soluciones de componentes prefabricadas: "hardware" más "software".

¿Qué propone hacer la empresa X? Se está formando una lista bastante limitada de componentes compatibles: placas base con todas las instalaciones integradas, necesarias para un servidor NAS de nivel de entrada de discos duros. Usted compra un disco FLASH con el software grabado instalado en el conector IDE de la placa base y obtiene una unidad NAS lista para usar. El sistema operativo y las utilidades escritas en este disco, al arrancar, configuran los módulos necesarios de forma adecuada. Como resultado, el usuario obtiene un dispositivo que se puede controlar tanto de forma local como remota a través de una interfaz HTML y proporciona acceso a las unidades de disco conectadas a él.

Protocolos de archivo en NAS moderno

CIFS (sistema común de archivos de Internet) es un protocolo estándar que proporciona acceso a archivos y servicios en equipos remotos (incluido Internet). El protocolo utiliza un modelo de interacción cliente-servidor. El cliente solicita al servidor acceder a archivos o enviar un mensaje a un programa que reside en el servidor. El servidor atiende la solicitud del cliente y devuelve el resultado de su trabajo. CIFS es un estándar abierto que surgió a partir del Server Message Block Protocol (SMB) desarrollado por Microsoft, pero, a diferencia de este último, CIFS tiene en cuenta la posibilidad de tiempos de espera prolongados, ya que está orientado al uso en redes distribuidas también. . El protocolo SMB se ha utilizado tradicionalmente en las LAN de Windows para el acceso a archivos y la impresión. CIFS utiliza el protocolo TCP / IP para transportar datos. CIFS proporciona una funcionalidad similar a FTP (Protocolo de transferencia de archivos), pero proporciona a los clientes un control mejorado (similar al directo) sobre los archivos. También le permite compartir el acceso a los archivos entre clientes, mediante el bloqueo y la restauración automática de la comunicación con el servidor en caso de una falla en la red.

NFS (sistema de archivos de red) es un estándar IETF que incluye el sistema de archivos distribuido y el protocolo de red. NFS fue desarrollado por Sun Microsystem Computer Corporation. Originalmente se usó solo en sistemas UNIX, las implementaciones posteriores de chat de cliente y servidor se hicieron comunes en otros sistemas.

NFS, como CIFS, utiliza un modelo de comunicación cliente-servidor. Proporciona acceso a archivos en una computadora remota (servidor) para escribir y leer como si estuvieran en la computadora del usuario. Las versiones anteriores de NFS usaban UDP para transportar datos, mientras que las versiones modernas usan TCP / IP. Para el funcionamiento de NFS en Internet, Sun ha desarrollado el protocolo WebNFS, que utiliza extensiones a la funcionalidad de NFS para su correcto funcionamiento en la World Wide Web.

DAFS (sistema de archivos de acceso directo) es un protocolo de acceso a archivos estándar basado en NFSv4. Permite que las aplicaciones transfieran datos sin pasar por el sistema operativo y su espacio de búfer directamente para transportar recursos, preservando la semántica inherente a los sistemas de archivos. DAFS aprovecha las últimas tecnologías de comunicación de memoria a memoria. Su uso proporciona altas velocidades de E / S de archivos, mínima carga de CPU y sistema debido a una reducción significativa en el número de operaciones e interrupciones que generalmente se requieren al procesar protocolos de red. Es especialmente efectivo utilizar soporte de hardware para VI (Interfaz virtual).

DAFS ha sido diseñado con un entorno de clúster y servidor en mente para bases de datos y una variedad de aplicaciones de Internet de extremo a extremo. Proporciona la latencia más baja para acceder a recursos compartidos de archivos y datos, y también admite sistemas inteligentes y mecanismos de recuperación de datos, lo que lo hace muy atractivo para su uso en unidades NAS de alta gama.

Todos los caminos conducen al almacenamiento de IP

Hay muchas tecnologías nuevas e interesantes que han surgido en los sistemas de almacenamiento de rango medio y alto en los últimos años.

La SAN de canal de fibra es una tecnología muy conocida y popular en la actualidad. Al mismo tiempo, su distribución masiva hoy en día es problemática debido a una serie de características. Estos incluyen el alto costo de implementación y la complejidad de construir sistemas distribuidos geográficamente. Por un lado, estas son solo las características de la tecnología a nivel empresarial, pero por otro lado, si la SAN se vuelve más barata y la construcción de sistemas distribuidos se vuelve más fácil, esto simplemente debería proporcionar un gran avance en el desarrollo de redes de almacenamiento.

Como parte del trabajo sobre tecnologías de almacenamiento en red en el Grupo de Trabajo de Ingeniería de Internet (IETF), se creó un grupo de trabajo y un foro de Almacenamiento IP (IPS) en las siguientes áreas:

FCIP: canal de fibra sobre TCP / IP, un protocolo de tunelización basado en TCP / IP, cuya función es conectar SAN FC geográficamente distantes sin ningún impacto en los protocolos FC e IP.

iFCP: Protocolo de canal de fibra de Internet, creado sobre la base del protocolo TCP / IP para conectar sistemas de almacenamiento FC o redes de almacenamiento FC, utilizando la infraestructura IP en conjunto o en lugar de elementos de enrutamiento y conmutación FC.

iSNS: servicio de nombres de almacenamiento de Internet, un protocolo para admitir los nombres de unidades en Internet.

iSCSI - Internet Small Computer Systems Interface, es un protocolo que se basa en TCP / IP y está diseñado para comunicar y administrar sistemas de almacenamiento, servidores y clientes (Definición de SNIA - IP Storage Forum :).

La que se desarrolla con mayor rapidez y la más interesante de las áreas enumeradas es iSCSI.

iSCSI es el nuevo estándar

El 11 de febrero de 2003, iSCSI se convirtió en el estándar oficial. La ratificación de iSCSI seguramente influirá en un interés más amplio en el estándar, que ya se está desarrollando de manera bastante activa. El desarrollo más rápido de iSCSI servirá como un impulso para la expansión de las SAN en las pequeñas y medianas empresas, ya que el uso de un equipo estándar y un enfoque de servicio (incluidos los comunes en el marco de las redes Ethernet estándar) hará que las SAN sean mucho más económico. En cuanto al uso de iSCSI en Internet, hoy FCIP ya ha echado raíces aquí, y la competencia con él será difícil.

Empresas de TI de renombre apoyaron voluntariamente el nuevo estándar. Por supuesto, hay oponentes, pero sin embargo, casi todas las empresas que participan activamente en el mercado de los sistemas de entrada y de nivel medio ya están trabajando en dispositivos con soporte iSCSI. En Windows y Linux, los controladores iSCSI ya están incluidos, los sistemas de almacenamiento iSCSI son producidos por IBM, adaptadores, por Intel, en un futuro cercano HP, Dell, EMC prometen unirse al proceso de dominar el nuevo estándar.

Una de las características más interesantes de iSCSI es que puede utilizar no solo operadores, conmutadores y enrutadores de redes LAN / WAN existentes para transferir datos en una unidad iSCSI, sino también adaptadores de red Fast Ethernet o Gigabit Ethernet habituales en el lado del cliente. Sin embargo, esto crea una sobrecarga significativa para la potencia de procesamiento de una PC que usa dicho adaptador. Según los desarrolladores, la implementación de software de iSCSI puede alcanzar las velocidades del medio de transmisión de datos Gigabit Ethernet con una carga significativa de hasta el 100% de las CPU modernas. En esta conexión, se recomienda utilizar tarjetas de red especiales que admitirán mecanismos para descargar la CPU del procesamiento de la pila TCP.

Virtualización SAN

Otra tecnología importante en la construcción de dispositivos y redes de almacenamiento modernos es la virtualización.

La virtualización del almacenamiento es la presentación de recursos físicos de una manera lógica y más conveniente. Esta tecnología permite una asignación flexible de recursos entre usuarios y una gestión eficiente de los mismos. En el marco de la virtualización, la copia remota, la instantánea, la distribución de solicitudes de E / S a las unidades más adecuadas para la naturaleza del servicio y muchos otros algoritmos se implementan con éxito. La implementación de algoritmos de virtualización se puede realizar tanto por medio del propio disco, como con la ayuda de dispositivos de virtualización externos, o con la ayuda de servidores de control que ejecutan software especializado bajo sistemas operativos estándar.

Esto, por supuesto, es una parte muy pequeña de lo que se puede decir sobre la virtualización. Este tema es muy interesante y extenso, por lo que decidimos dedicarle una publicación aparte.

Es una solución de hardware y software para almacenar datos de forma segura y proporcionar un acceso rápido y confiable a ellos.

Implementación de hardware en sistemas de almacenamiento(Almacenamiento) es similar a la implementación de la arquitectura de una computadora personal. Entonces, ¿por qué generalmente se utilizan sistemas de almacenamiento en la arquitectura de la red local de una organización, por qué no se puede proporcionar, para implementar sistemas de almacenamiento basados ​​en una PC normal?

Almacenamiento como un nodo adicional de una red local basada en una computadora personal o incluso un servidor poderoso han existido durante mucho tiempo.

La provisión más simple de acceso a datos a través de protocolos. FTP(protocolo de transferencia de archivos) y SMB(protocolo de acceso remoto a los recursos de la red) que son compatibles con todos los sistemas operativos modernos.

¿Por qué entonces incluso aparecieron? Almacenamiento?

Es simple, la apariencia Almacenamiento asociado con el retraso en el desarrollo y la velocidad de los dispositivos de almacenamiento permanente (discos duros magnéticos) desde el procesador central y la memoria de acceso aleatorio. El cuello de botella en la arquitectura de la PC todavía se considera que es el disco duro, incluso a pesar del poderoso desarrollo SATA(interfaz serial) hasta una tasa de cambio de 600 MB / s ( SATA3), el dispositivo físico de la unidad es una placa, a cuyos datos se debe acceder mediante cabezas lectoras, lo cual es muy lento. Los últimos inconvenientes se resuelven actualmente mediante unidades. SSD(no memoria mecánica) construida sobre la base de chips de memoria. Además del alto precio de SSD tienen, en mi opinión, en el momento actual, una falta de fiabilidad. Ingenieros Almacenamiento propuso reemplazar los dispositivos de almacenamiento en un elemento separado y utilizar la RAM de dichos dispositivos para almacenar datos que cambian con frecuencia utilizando algoritmos especiales, que requieren el componente de software del producto. Finalmente sistemas de almacenamiento se ejecuta más rápido que los discos duros en los servidores, y la eliminación del dispositivo de almacenamiento (subsistema de disco en un elemento separado) se ve afectada fiabilidad y centralización sistema en su conjunto.

Fiabilidad aseguró el hecho de la implementación en un dispositivo separado del sistema de disco, que, trabajando con el componente de software, realiza una función: estas son operaciones de entrada y salida y almacenamiento de datos.

Además del principio simple: un dispositivo, una función que garantiza la confiabilidad. Todos los nodos principales: fuentes de alimentación, controladores Los sistemas de almacenamiento de datos están duplicados, lo que, por supuesto, aumenta aún más la confiabilidad del sistema, pero afecta el precio del producto final.

Quitar el sistema de disco en una unidad separada permite centralizar dispositivos de almacenamiento... Como regla general, sin un almacenamiento de red separado, las carpetas de inicio de los usuarios, el correo y las bases de datos se almacenan en nodos separados, por regla general, en servidores de la red, lo que es muy inconveniente y no confiable. Tienes que hacer copias de seguridad, duplicar datos en un servidor de respaldo en la red, que, además del costo de soporte y hardware, software, ocupa parte del ancho de banda de la red.

Así es como se ve:

Con un sistema de almacenamiento independiente:

Según el método, la tecnología de conexión Almacenamiento a la red de información. Almacenamiento subdividido en: DAS, NAS, SAN

DAS (DirectoAdjuntoAlmacenamiento)- un método de conexión que no es diferente de la conexión estándar de un disco duro, matrices de discos (RAID) a un servidor o PC. Normalmente, la conexión es SAS.

SAS- de hecho, el protocolo diseñado para reemplazar SCSI usa una interfaz serial a diferencia de SCSI, pero los comandos son los mismos que en SCSI. SAS tiene más ancho de banda gracias a las conexiones de enlace en una sola interfaz.

NAS (RedAdjuntoAlmacenamiento)- el sistema de disco está conectado a una red LAN común, se utiliza el protocolo de transporte TCP, los protocolos funcionan sobre el modelo SMB,NFS(acceso remoto a archivos e impresoras).

SAN (AlmacenamientoÁreaRed) Es una red dedicada que conecta dispositivos de almacenamiento con servidores. Funciona usando el protocolo Canal de fibra o iSCSI.

CON FibraCanal todo está claro - óptica. Pero iSCSI- encapsulación de paquetes en protocolo IP, permite crear redes de almacenamiento basadas en infraestructura Ethernet, velocidad de transmisión 1Gb y 10GB. Según los desarrolladores, la velocidad iSCSI debería ser suficiente para casi todas las aplicaciones comerciales. Para conectar el servidor a Almacenamiento sobre iSCSI adaptadores necesarios con soporte iSCSI... Cuando se utiliza iSCSI, se establecen al menos dos rutas para cada dispositivo utilizando VLAN, cada dispositivo y LUN(define una partición virtual en una matriz, utilizada para direccionamiento) se asigna una dirección ( MundoAnchoNombre).

La diferencia NAS desde SAN en lo que hay en la red SAN Las operaciones de E / S leen y escriben datos en bloques. Almacenamiento no tiene idea de la estructura de los sistemas de archivos.

Los proveedores de mayor marca en el mercado de dispositivos de almacenamiento son: NetApp, IBM, HP, DELL, HITACHI, EMC.

Nuestro proyecto requiere un sistema de almacenamiento con las siguientes características:

  • Volumen 1TB para archivos, 1TB para sistemas operativos de servidores y bases de datos, 300 - 500 GB, para servidores de respaldo + stock. Total al menos 3 TB de espacio en disco
  • Soporte para protocolos SMB y NFS, para distribuir archivos compartidos a usuarios sin la participación de servidores.
  • Si queremos cargar el hipervisor desde Almacenamiento, necesita al menos el protocolo iSCSI
  • En teoría, aún debe tener en cuenta un parámetro tan importante como la velocidad de entrada / salida (IO) que puede proporcionar el sistema de almacenamiento. Puede estimar este parámetro midiendo IO en un hardware en funcionamiento, por ejemplo, utilizando el programa IOMeter.

Debe tenerse en cuenta que la agrupación en clústeres de Microsoft solo funciona a través de FibraCanal.

Aquí hay una lista de empresas y hardware para elegir:

Asustor

Asustor COMO 606T, COMO 608T, 609 RD(además de la capacidad de instalar hasta 8 discos de 4Tb, se declara compatibilidad con VMware, Citrix e Hyper-V.

Componente de hardware

CPU Intel Atom 2.13

RAM 1GB (3GB) DDR3

Disco duro 2.5, 3.5, SATA 3 o SSD

Lan Gigabit Ethernet - 2

Pantalla LCD, HDMI

Red

Red protocolos

Sistema de archivos

Para discos duros integrados: EXT4, para discos duros externos: FAT32, NTFS, EXT3, EXT4, HFS +

Almacenamiento

Soporte para múltiples volúmenes con discos de repuesto

Tipo de volumen: disco único, JBOD, RAID 0, RAID 1, RAID 5, RAID 6, RAID 10

Soporte para la migración en línea de niveles RAID

Número máximo de objetivos: 256

LUN máximo: 256

Enmascaramiento de objetivos

Mapeo de LUN

Montar imágenes ISO

Soporte MPIO y MCS

Redundancia persistente (SCSI-3)

Gestión de discos

Busque bloques defectuosos en un horario

Escaneo S.M.A.R.T programado

Soportado SO

Windows XP, Vista, 7, 8, Server 2003, Server 2008, Server 2012

Mac OS X 10.6 en adelante

UNIX, Linux y BSD

Respaldo

Compatibilidad con el modo Rsync (sincronización remota)

Respaldo en la nube

Copia de seguridad FTP

Copia de seguridad en medios externos

Copia de seguridad de un toque

Administracion del sistema

Tipo de registro: syslog, registro de conexión, registro de acceso a archivos

Registrador de actividad del usuario en tiempo real

Monitor del sistema en tiempo real

Canasta de red

Cuota de disco de usuarios

Disco virtual (montar imágenes ISO, máx.16)

Soporte UPS

Control de acceso

Número máximo de usuarios: 4096

Número máximo de grupos: 512

Número máximo de carpetas compartidas: 512

Número máximo de conexiones simultáneas: 512

Soporte de Windows Active Directory

Seguridad

Cortafuegos: Evite el acceso no autorizado

Protector contra sobretensiones: previene ataques a la red

Notificaciones de amenazas: correo electrónico, SMS

Conexiones seguras: HTTPS, FTP sobre SSL / TLS, SSH, SFTP, Rsync sobre SSH

Sistema operativo ADM con la capacidad de conectar módulos adicionales a través de la central de aplicaciones

Modelos COMO 604RD, COMO 609RD a diferencia de COMO 606T, COMO 608T, no incluyen una pantalla LCD, están diseñadas para instalarse en un rack y tienen una fuente de alimentación redundante, se declara soporte para plataformas de virtualización

Netgear

Listo Nas 2100, Listo Nas 3100, Listo Nas Pro 6

Componente de hardware

CPU Intel SOC 1 GHz

Disco duro 2.5, 3.5, SATA 2 o SSD

Lan Gigabit Ethernet - 2

Red

Red protocolos

CIFS / SMB, AFP, NFS, FTP, WebDAV, Rsync, SSH, SFTP, iSCSI, HTTP, HTTPS

Sistema de archivos

Para discos duros integrados: BTRFS, para discos duros externos: FAT32, NTFS, EXT3, EXT4, HFS +

Almacenamiento

Admite la expansión de la capacidad RAID en línea

Número máximo de objetivos: 256

LUN máximo: 256

Enmascaramiento de objetivos

Mapeo de LUN

Gestión de discos

Capacidad de disco, rendimiento, monitoreo de carga.

Escaneo para encontrar bloques defectuosos en discos

Soporte HDD S.M.A.R.T.

Corrección de datos en línea en discos

Soporte de limpieza de discos

Soporte de desfragmentación

Mensajes (del servicio SMTP a través de correo electrónico, SNMP, syslog, registro local)

Apagado automático (HDD, ventiladores, UPS)

Restauración del rendimiento cuando se restablece la energía

SO compatible

Microsoft Windows Vista (32/64 bits), 7 (32/64 bits), 8 (32/64 bits), Microsoft Windows Server 2008 R2 / 2012, Apple OS X, Linux / Unix, Solaris, Apple iOS, Google Android)

Respaldo

Instantáneas ilimitadas para una protección continua.

Recupere instantáneas en cualquier momento. A través de la interfaz gráfica de usuario (consola de administración), ReadyCLOUD o el Explorador de Windows

La capacidad de crear una instantánea manualmente o mediante el programador.

Sincronizar archivos a través de R-sync

Replicación remota de gestión de la nube (ReadyNAS a ReadyNAS). No requiere licencias para dispositivos que ejecutan el sistema operativo Radiator OS v6.

Redundancia caliente

Soporte ESATA

Admite copia de seguridad en unidades externas ae (USB / eSATA)

Admite copia de seguridad y restauración remota de Apple Time Machine (a través de ReadyNAS Remote)

Soporte de servicio en la nube ReadyNAS Vault (opcional)

Soporte de sincronización ReadyDROP (sincronización de archivos Mac / Windows con ReadyNAS)

Soporte para el servicio DropBox para la sincronización de archivos (requiere una cuenta en el servicio DropBox)

Administracion del sistema

ReadyCLOUD para el descubrimiento y la gestión de dispositivos

RAIDar: agente de detección de dispositivos de red (Windows / Mac)

Guardar y restaurar el archivo de configuración

El registro de eventos

Soporte de mensajería del servidor Syslog

Soporte de mensajería SMB

Interfaz gráfica de usuario en ruso e inglés.

Mercado Genie +. Tienda de aplicaciones incorporada para mejorar la funcionalidad del dispositivo

Soporte de caracteres Unicode

Administrador de discos

Compatibilidad con LUN y recursos compartidos de suministro ligero

Asignación de recursos instantánea

Control de acceso

Número máximo de usuarios: 8192

Número máximo de grupos: 8192

Número máximo de carpetas proporcionadas para el acceso a la red: 1024

Número máximo de conexiones: 1024

Acceso a carpetas y archivos basados ​​en ACL

Permisos extendidos de carpeta y subcarpeta basados ​​en ACL para CIFS / SMB, AFP, FTP, autenticación de controlador de dominio de Microsoft Active Directory (AD)

Listas de acceso propias

Listas de acceso ReadyCLOUD basadas en ACL

Sistema operativo

ReadyNAS OS 6 se basa en Linux 3.x

Listo Nas 3100 distingue Listo Nas 2100 Memoria ECC de 2GB

Listo Nas Pro 6- Almacenamiento de 6 ranuras, procesador Intel Atom D510, memoria DDR2 de 1 GB

Qnap

TS-869U-RP, TS-869 PRO

Componente de hardware

CPU Intel Atom 2,13 GHz

Disco duro 2.5, 3.5, SATA 3 o SSD

Lan Gigabit Ethernet - 2

Red

IPv4, IPv6, compatible con 802.3ad y otros seis modos para equilibrio de carga y / o conmutación por error de red, Vlan

Red protocolos

CIFS / SMB, AFP, NFS, FTP, WebDAV, Rsync, SSH, SFTP, iSCSI, HTTP, HTTPS

Sistema de archivos

Para discos duros integrados: EXT3, EXT4, para discos duros externos: FAT32, NTFS, EXT3, EXT4, HFS +

Almacenamiento

Tipo de volumen: RAID 0, RAID 1, RAID 5, RAID 6, RAID 10

Admite la expansión de la capacidad RAID en línea

Número máximo de objetivos: 256

LUN máximo: 256

Enmascaramiento de objetivos

Mapeo de LUN

Iniciador ISCSI (disco virtual)

Maestro de encadenamiento de pila

Hasta 8 discos virtuales

Gestión de discos

Aumente la capacidad de almacenamiento de una matriz RAID sin pérdida de datos

Escaneo de bloques defectuosos

Función de recuperación de RAID

Soporte de mapa de bits

Soportado SO

Respaldo

Replicación en tiempo real (RTRR)

Funciona tanto como servidor RTRR como cliente

Admite copias de seguridad programadas y en tiempo real

Posibilidad de filtrado, compresión y cifrado de archivos

Botón para copiar datos desde / hacia un dispositivo externo

Soporte de Apple Time Machine con gestión de reservas

Replicación de recursos a nivel de bloque (Rsync)

Funciona tanto como servidor como como cliente

Replicación segura entre servidores de QNAP

Copia de seguridad en medios externos

Realización de copias de seguridad en sistemas de almacenamiento en la nube

Replicador NetBak para Windows

Soporte técnico de Apple Time Machine

Administracion del sistema

Interfaz web basada en AJAX

Conexión HTTP / HTTPS

Notificaciones instantáneas por correo electrónico y SMS

Gestión del sistema de refrigeración

DynDNS y servicio dedicado MyCloudNAS

Soporta SNMP UPS (USB)

Soporte de UPS en red

Monitor de recursos

Depósito de red para CIFS / SMB y AFP

Registros detallados de eventos y conexiones

Lista de usuarios activos

Cliente de Syslog

Actualización de firmware

Guardar y restaurar la configuración del sistema

Restaurar la configuración de fábrica

Control de acceso

Hasta 4096 cuentas de usuario

Hasta 512 grupos de usuarios

Hasta 512 recursos de red

Agregar usuarios por lotes

Importación / exportación de usuarios

Establecer parámetros de cuota

Administrar los derechos de acceso a las subcarpetas

Sistema operativo

TS - 869 Pro- modelo sin fuente de alimentación de respaldo, capacidad de memoria 1GB

Synology

RS 2212, DS1813

Componente de hardware

CPU Intel Core 2,13 GHz

Disco duro 2.5, 3.5, SATA 2 o SSD

Lan Gigabit Ethernet - 2

Red

IPv4, IPv6, compatible con 802.3ad y otros seis modos para equilibrio de carga y / o conmutación por error de red

Red protocolos

CIFS / SMB, AFP, NFS, FTP, WebDAV, SSH

Sistema de archivos

Para discos duros integrados: EXT3, EXT4, Para discos duros externos: NTFS, EXT3, EXT4

Almacenamiento

Tipo de volumen: RAID 0, RAID 1, RAID 5, RAID 6, RAID 10

Número máximo de objetivos: 512

LUN máximo: 256

Gestión de discos

Cambiar el nivel de RAID sin apagar el sistema

SO compatible

Windows 2000 y posterior, Mac OS X 10.3 y posterior, Ubuntu 9.04 y posterior

Respaldo

Redundancia de red

Redundancia local

Sincronizar carpetas compartidas

Reserva de escritorio

Administracion del sistema

Notificación de eventos del sistema por SMS, correo electrónico

Cuota de usuarios

Monitoreo de recursos

Control de acceso

Hasta 2048 cuentas de usuario

Hasta 256 grupos de usuarios

Hasta 256 recursos de red

Sistema operativo

DS1813- 2 GB de RAM, 4 Gigabit, compatibilidad con HASP 1C, compatibilidad con disco de 4 TB

Thecus

N8800PRO v2, N7700PRO v2, N8900

Componente de hardware

CPU Intel Core 2 1,66 GHz

Lan Gigabit Ethernet - 2

Capacidad LAN 10GB

Red

IPv4, IPv6, compatible con 802.3ad y otros seis modos para equilibrio de carga y / o conmutación por error de red

Red protocolos

CIFS / SMB, NFS, FTP

Sistema de archivos

Para discos duros internos: EXT3, EXT4, Para discos duros externos: EXT3, EXT4, XFS

Almacenamiento

Tipo de volumen: RAID 0, RAID 1, RAID 5, RAID 6, RAID 10, RAID 50, RAID 60

Admite la expansión de la capacidad RAID en línea

Enmascaramiento de objetivos

Mapeo de LUN

Gestión de discos

Supervisión del estado del disco (S.M.A.R.T)

Escaneo de bloques defectuosos

La capacidad de montar imágenes ISO

Soportado SO

Microsoft Windows 2000, XP, Vista (32/64 bits), Windows 7 (32/64 bits), Server 2003/2008

Respaldo

Acronis True Image

Utilidad de copia de seguridad de Thecus

Lectura de un disco óptico a Nas

Administracion del sistema

Interfaz de administración basada en web del servidor

Control de acceso

Soporte ADS

Sistema operativo

N7700PRO v2- modelo sin fuente de alimentación de respaldo

N8900- nuevo modelo con soporte para SATA 3 y SAS

Según los datos anteriores, se requieren al menos 3 x Tb en este momento, y al actualizar el sistema operativo y los programas, esta cifra se puede multiplicar por dos, luego necesita almacenamiento en disco con una capacidad de al menos 6 TB, y con posibilidad de crecimiento. Por lo tanto, con un marcador para el futuro y la organización de una matriz RAID 5, la cifra final es la necesidad de 12 Tuberculosis... Cuando se admite un sistema de unidad de disco duro de 4 TB, se requiere un sistema con al menos seis bahías de unidad.

La selección se ha reducido significativamente con los siguientes modelos: COMO 609RD, Listo NAS 3200, TS-869U-RP, RS-1212RP +, N8900... Todos los modelos incluyen fuente de alimentación adicional... Y el apoyo declarado por el fabricante a reconocidos plataformas de virtualización... El más interesante fue el modelo de NetGear: Listo NAS 3200, ya que solo este modelo, además de SMART, admitía al menos algunas tecnologías adicionales para trabajar con discos excepto SMART y memoria con ECC, pero el precio voló por 100.000 rublos, además había dudas sobre la posibilidad de trabajar con discos de 4Tb y SATA3 en eso. Precio por RS-1212RP +, también voló por encima de los 100 mil. COMO 609RD- el jugador en el mercado de los sistemas de almacenamiento es muy nuevo, por lo que no se sabe cómo se comportará Almacenamiento.

De los cuales solo había dos sistemas para elegir: TS-869U-RP, N8900.

TS-869U-RP- por el momento cuesta unos 88.000 rublos.

N8900- el precio es de 95400 rublos, tiene muchas ventajas en comparación con TS-869U-RP- esto es compatible con unidades SATA y SAS, la posibilidad de instalación adicional del adaptador 10 GB, procesador de doble núcleo más potente, compatible con unidades SATA3 de 4 TB. Además, hay una copia de seguridad de firmware para un microcircuito de respaldo, lo que brinda una confiabilidad más favorable en comparación con otros sistemas.

  • atrás

Shkera

Envíe un problema para resolverlo Respondemos de lunes a viernes
En una hora

Andrey Olovyannikov,[correo electrónico protegido] sitio

Lleguemos a un acuerdo….

El propósito de este artículo no es estudiar en detalle los distintos sistemas de almacenamiento (DSS). No analizaremos todo tipo de interfaces (software y hardware) que se utilizan para crear diferentes formas de almacenar datos. No consideraremos los "cuellos de botella" de ciertos tipos de organización de almacenamiento. Aquí no verá una descripción detallada de los protocolos iSCSI y su implementación en forma de FC (Fibre Channel), SCSI, etc.

Nuestra tarea es mucho más modesta, simplemente "Acuerde la terminología" con nuestro comprador potencial. Entonces, dos físicos, antes de iniciar una discusión sobre cualquier problema, llegan a un acuerdo sobre qué proceso o fenómeno designarán de una forma u otra. Esto es necesario para ahorrar tiempo y células nerviosas entre sí, y para llevar la conversación de manera más productiva y con placer mutuo.

¿Almacenamiento o ... almacenamiento?

Empecemos, como dicen, desde el principio.

Bajo el sistema de almacenamiento, nos referimos a todos los mismos Sistemas de Almacenamiento de Datos como un conjunto de software y hardware que sirven para una forma confiable, rápida y sencilla de almacenar y acceder a datos para organizaciones de diferentes niveles, tanto financieros como estructurales. De inmediato queremos llamar su atención sobre el hecho de que diferentes empresas tienen diferentes necesidades para almacenar información de una forma u otra y diferentes capacidades financieras para su implementación. Pero en cualquier caso, queremos señalar que no importa cuánto dinero o especialistas de un nivel u otro estén a disposición del comprador, insistimos en que todas sus necesidades encajen en nuestra definición de sistemas de almacenamiento, ya sea un conjunto regular de discos grandes. , o una estructura PCS compleja de varios niveles (Parallels Cloud Storage). Esta definición, en nuestra opinión, también incluye otra abreviatura ampliamente utilizada traducida al inglés: almacenamiento como red de área de almacenamiento (SAN). Ilustraremos la SAN un poco a continuación cuando hablemos de las formas típicas de implementar sistemas de almacenamiento.

La forma más típica y comprensible de ejecutar sistemas de almacenamiento es DAS (Direct Attached Storages), unidades que se conectan directamente a una computadora que controla el funcionamiento de estas unidades.

El ejemplo más simple de un DAS es una computadora normal con un disco duro o una unidad de DVD (CD) con datos instalados. Un ejemplo es más complicado (ver Fig.): Un dispositivo de almacenamiento externo (disco duro externo, estante de disco, unidad de cinta, etc.) que se comunica con una computadora directamente a través de uno u otro protocolo e interfaz (SCSI, eSATA, FC, etc.) .). etc.). Ofrecemos estantes de discos o servidores de almacenamiento de datos (otra abreviatura de sistemas de almacenamiento) como dispositivos de almacenamiento DAS.

Un servidor de almacenamiento de datos en este caso significa una computadora con su propio procesador, sistema operativo y memoria suficiente para procesar grandes cantidades de datos almacenados en numerosos discos dentro del servidor.

Cabe señalar que con tal realización de almacenamiento, solo la computadora con DAS ve directamente los datos, todos los demás usuarios tienen acceso a los datos solo "con el permiso" de esta computadora.

Puede ver las configuraciones básicas de los sistemas de almacenamiento DAS en

Sistemas de almacenamientoNAS

Otra implementación de sistema de almacenamiento bastante simple es NAS (Network Attached Storage) - Network Data Storage (nuevamente, la misma abreviatura para sistemas de almacenamiento).

Como queda claro, el acceso a los datos se realiza a través de protocolos de red, por regla general, a través de la red local informática a la que estamos acostumbrados (aunque ahora se ha generalizado el acceso más complejo a los datos almacenados en los recursos de la red). El ejemplo más claro y simple de almacenamiento NAS es un almacenamiento de música y películas para el consumidor, al que tienen acceso varios usuarios de la red doméstica a la vez.

NAS almacena datos en forma de sistema de archivos y, en consecuencia, proporciona acceso a los recursos a través de protocolos de archivos de red (NFS, SMB, AFP ...).

Para ver un ejemplo simple de un sistema de almacenamiento NAS, consulte la Fig. 2.

Queremos señalar de inmediato que NAS, en principio, puede considerarse cualquier dispositivo inteligente que tenga su propio procesador, memoria e interfaces de red lo suficientemente rápidas para transferir datos a través de la red a diferentes usuarios. Además, se debe prestar especial atención a la velocidad del subsistema de disco. Puede ver las configuraciones más típicas de los dispositivos NAS en

La red de área de almacenamiento es una de las formas de implementar sistemas de almacenamiento como un sistema de almacenamiento de datos; consulte más arriba.

Es una solución de software, hardware y arquitectura para conectar varios dispositivos de almacenamiento de tal manera que el sistema operativo "ve" estos dispositivos como locales. Esto se logra conectando estos dispositivos a los servidores adecuados. Los dispositivos en sí pueden ser diferentes: matrices de discos, bibliotecas de cintas, matrices de almacenamiento óptico.

Con el avance de las tecnologías de almacenamiento, la distinción entre sistemas SAN y NAS se ha vuelto bastante arbitraria. Convencionalmente, se pueden distinguir por la forma en que se almacenan los datos: SAN - dispositivos de bloque, NAS - sistema de archivos de datos.

Los protocolos de implementación de sistemas SAN pueden ser diferentes: canal de fibra, iSCSI, AoE.

Una de las formas arquitectónicas de implementar una SAN se muestra en la Fig. 3.

Se pueden encontrar ejemplos típicos de sistemas de almacenamiento SAN en

En conclusión, esperamos haber logrado "acordar la terminología" con usted y todo lo que queda es discutir opciones para crear sistemas de almacenamiento para su negocio y encontrar soluciones que se adapten a usted en términos de confiabilidad, simplicidad y presupuesto.

La dependencia de los procesos comerciales de la empresa en la esfera de las tecnologías de la información crece constantemente. Hoy en día, no solo las grandes empresas, sino también los representantes de las medianas y, a menudo, las pequeñas empresas prestan atención al tema de la continuidad de los servicios de TI.

Uno de los elementos centrales para garantizar la tolerancia a fallas es un sistema de almacenamiento de datos (DSS), un dispositivo en el que toda la información se almacena de forma centralizada. El sistema de almacenamiento se caracteriza por una alta escalabilidad, tolerancia a fallas, la capacidad de realizar todas las operaciones de servicio sin interrumpir el funcionamiento del dispositivo (incluido el reemplazo de componentes). Pero el costo de incluso un modelo básico se mide en decenas de miles de dólares. Por ejemplo, Fujitsu ETERNUS DX100 con 12 discos Nearline SAS 1Tb SFF (RAID10 6TB) vale la pena el pedido USD 21.000, que resulta muy caro para una empresa pequeña.

En nuestro artículo, proponemos considerar opciones para organizar el almacenamiento presupuestario, que no pierde en rendimiento y confiabilidad frente a los sistemas clásicos. Para implementarlo, proponemos utilizar CEPH.

¿Qué es CEPH y cómo funciona?

CEPH- almacenamiento basado en software libre, es una combinación de espacios en disco de varios servidores (el número de servidores en la práctica se mide en decenas y cientos). CEPH le permite crear almacenamiento altamente escalable con alto rendimiento y redundancia de recursos. CEPH se puede utilizar como almacenamiento de objetos (para almacenar archivos) y como dispositivo de bloque (para servir discos duros virtuales).

La tolerancia a fallos de almacenamiento se garantiza replicando cada bloque de datos en varios servidores. El número de copias almacenadas simultáneamente de cada bloque se llama factor de replicación, por defecto su valor es 2. El esquema de operación de almacenamiento se muestra en la Figura 1, como vemos la información está dividida en bloques, cada uno de los cuales se distribuye en dos diferentes nodos.

Figura 1 - Distribución de bloques de datos


Si los servidores no usan matrices de discos tolerantes a fallas, recomendamos usar un factor de replicación más alto para un almacenamiento de datos confiable. En caso de falla de uno de los servidores, CEPH corrige la inaccesibilidad de los bloques de datos (Figura 2), que se ubican en él, espera un tiempo determinado (el parámetro está configurado, por defecto 300 segundos), transcurrido el cual comienza a recrear los bloques de información que faltan en otro lugar (Figura 3).

Figura 2 - Fallo de un nodo


Figura 3 - Restauración de redundancia


De manera similar, si se agrega un nuevo servidor al clúster, el almacenamiento se reequilibra para llenar uniformemente los discos en todos los nodos. El mecanismo que controla la distribución de bloques de información en el clúster CEPH se llama CRUSH.

Para obtener un alto rendimiento de espacio en disco en clústeres CEPH, se recomienda utilizar la funcionalidad de niveles de caché. Su significado es crear un grupo separado de alto rendimiento y usarlo para el almacenamiento en caché, mientras que la información principal se colocará en discos más económicos (Figura 4).

Figura 4 - Vista lógica de las agrupaciones de discos


El almacenamiento en caché por niveles funcionará de la siguiente manera: las solicitudes de escritura del cliente se escribirán en el grupo más rápido y luego se moverán al nivel de almacenamiento. Del mismo modo, para las solicitudes de lectura, la información cuando se accede a ella se elevará al nivel de almacenamiento en caché y se procesará. Los datos continúan en el nivel de caché hasta que se vuelven inactivos o hasta que se vuelven irrelevantes (Figura 5). Vale la pena señalar que el almacenamiento en caché se puede configurar para solo lectura, en cuyo caso las solicitudes de escritura se escribirán directamente en el grupo de almacenamiento.

Figura 5 - El principio de funcionamiento de la liquidación de efectivo


Consideremos escenarios de la vida real del uso de CEPH en una organización para crear un almacén de datos. Las pequeñas y medianas empresas son consideradas como un cliente potencial, donde esta tecnología será más demandada. Calculamos 3 escenarios para usar la solución descrita:

  1. Una empresa de fabricación o comercialización con un requisito de disponibilidad de un sistema ERP interno y almacenamiento de archivos del 99,98% por año, 24 horas al día, 7 días a la semana.
  2. Una organización que necesita implementar una nube privada local para sus necesidades comerciales.
  3. Una solución muy económica para la organización de almacenamiento de datos en bloque tolerante a fallas, completamente independiente del hardware con una disponibilidad del 99,98% por año y escalabilidad económica.

Caso de uso 1: almacén de datos basado en CEPH

Veamos un ejemplo del mundo real de la aplicación de CEPH en una organización. Por ejemplo, necesitamos almacenamiento de alto rendimiento tolerante a fallas de 6 TB, pero los costos incluso para un modelo de almacenamiento básico con discos son del orden de $21 000 .

Armado de un repositorio basado en CEPH. Proponemos utilizar la solución como servidores. Supermicro gemelo(Figura 6). El producto representa 4 plataformas de servidor en una sola caja de 2 unidades de altura, todos los nodos principales del dispositivo están duplicados, lo que asegura su funcionamiento continuo. Para implementar nuestra tarea, bastará con usar 3 nodos, el 4to estará en reserva para el futuro.




Figura 6 - Supermicro Twin


Completamos cada uno de los nodos de la siguiente manera: 32 GB de RAM, un procesador de 4 núcleos a 2,5 GHz, 4 discos SATA de 2 TB cada uno para el grupo de almacenamiento se combinan en 2 matrices RAID1, 2 discos SSD para el grupo de almacenamiento en caché también se combinan en RAID1. El costo de todo el proyecto se muestra en la Tabla 1.

Tabla 1. Componentes para almacenamiento basados ​​en CEPH

Componentes Precio (dólares americanos Cant. Costo, USD
4 999,28 1 4 999,28
139,28 6 835,68
Procesador Ivy Bridge-EP 4-Core 2.5GHz (LGA2011, 10MB, 80W, 22nm) Bandeja 366,00 3 1 098,00
416,00 12 4 992,00
641,00 6 3 846,00
TOTAL 15 770,96

Conclusión: Como resultado de la construcción del almacenamiento, obtenemos una matriz de discos de 6Tb con costos del orden de $16 000 , qué 25% menos que la compra de un sistema de almacenamiento mínimo, mientras que con las capacidades actuales puede ejecutar máquinas virtuales que funcionan con almacenamiento, lo que ahorra en la compra de servidores adicionales. De hecho, esta es una solución completa.

Los servidores a partir de los cuales se construye el almacenamiento pueden usarse no solo como almacenamiento para discos duros, sino también como almacenamiento para máquinas virtuales o servidores de aplicaciones.

Caso de uso 2: construir una nube privada

El desafío es implementar la infraestructura para construir una nube privada a un costo mínimo.

Construyendo incluso una pequeña nube que consta, por ejemplo, de 3 operadores en aproximadamente $36 000 : $ 21,000 - el costo de almacenamiento + $ 5,000 por cada servidor con 50% de contenido.

El uso de CEPH como almacenamiento le permite combinar recursos informáticos y de disco en el mismo hardware. Es decir, no necesita comprar sistemas de almacenamiento por separado; los discos instalados directamente en los servidores se utilizarán para alojar máquinas virtuales.

Referencia rápida:
La estructura clásica de la nube es un clúster de máquinas virtuales, cuyo funcionamiento lo proporcionan 2 componentes principales de hardware:

  1. Parte de computación (computación): servidores llenos de RAM y procesadores, cuyos recursos son utilizados por máquinas virtuales para computación
  2. Sistema de almacenamiento (almacenamiento): un dispositivo lleno de discos duros que almacena todos los datos.

Tomamos los mismos servidores Supermicro como equipo, pero instalamos procesadores más potentes: 8 núcleos con una frecuencia de 2,6 GHz, así como 96 GB de RAM en cada nodo, ya que el sistema se utilizará no solo para almacenar información, sino también para el funcionamiento de máquinas virtuales. Tomamos un conjunto de discos similar al primer escenario.

Tabla 2. Hardware de nube privada CEPH

Componentes Precio (dólares americanos Cant. Costo, USD
Supermicro Twin 2027PR-HTR: 4 sistemas (nodos) conectables en caliente en un factor de forma de 2U. Doble zócalo R (LGA 2011), hasta 512 GB ECC RDIMM, IPMI 2.0 integrado con KVM y LAN dedicada. 6 bahías de disco duro SATA intercambiables en caliente de 2,5 ". Fuentes de alimentación redundantes de 2000 W 4 999,28 1 4 999,28
Módulo de memoria Samsung DDR3 16GB registrado ECC 1866Mhz 1.5V, rango dual 139,28 18 2 507,04
Procesador Intel Xeon E5-2650V2 Ivy Bridge-EP 8-Core 2.6GHz (LGA2011, 20MB, 95W, 32nm) Bandeja 1 416,18 3 4 248,54
Disco duro SATA 2TB 2.5 "Capacidad empresarial SATA 6Gb / s 7200rpm 128Mb 512E 416 12 4 992,00
Unidad de estado sólido SSD 2.5 "" 400GB DC Serie S3710. 641 6 3 846,00
TOTAL 20 592,86

La nube recolectada tendrá los siguientes recursos, teniendo en cuenta la preservación de la estabilidad cuando falla el 1er nodo:

  • RAM: 120 GB
  • Espacio en disco 6000 GB
  • Núcleos de procesador físico: 16 uds.

El clúster ensamblado podrá admitir alrededor de 10 máquinas virtuales medianas con las siguientes características: 12 GB de RAM / 4 núcleos de procesador / 400 GB de espacio en disco.

También vale la pena considerar que los 3 servidores solo están llenos al 50% y, si es necesario, se pueden reponer, duplicando así el grupo de recursos para la nube.

Conclusión: Como puede ver, obtuvimos un clúster de conmutación por error completo de máquinas virtuales y almacenamiento de datos redundante; la falla de cualquiera de los servidores no es crítica; el sistema continuará funcionando sin detenerse, mientras el costo de la solución es aproximadamente 1,5 veces menor que comprar sistemas de almacenamiento y servidores separados.

Caso de uso 3: Creación de un almacén de datos súper barato

Si el presupuesto es completamente limitado y no hay dinero para la compra del equipo descrito anteriormente, puede comprar servidores usados, pero no debe ahorrar en discos; se recomienda encarecidamente comprar nuevos.

Proponemos considerar la siguiente estructura: comprado 4 nodos de servidor, cada servidor tiene 1 unidad SSD para almacenamiento en caché y 3 unidades SATA... Los servidores Supermicro con 48 GB de RAM y procesadores de la serie 5600 ahora se pueden comprar por aproximadamente $800 .

Los discos no se ensamblarán en matrices tolerantes a fallas en cada servidor, sino que se presentarán como un dispositivo separado. En este sentido, para mejorar la confiabilidad del almacenamiento, usaremos el factor de replicación 3. Es decir, cada bloque tendrá 3 copias. Con esta arquitectura, no se requiere la duplicación del disco de caché SSD, ya que la información se duplica automáticamente en otros nodos.

Tabla 3. Accesorios para almacenamiento

Conclusión: Si es necesario, esta solución puede usar discos más grandes, o reemplazarlos con SAS, si necesita obtener el máximo rendimiento para el funcionamiento del DBMS. En este ejemplo, el resultado es 8 TB de almacenamiento con muy bajo costo y muy alta disponibilidad. El precio de un terabyte resultó 3,8 veces más barato que cuando se usa almacenamiento industrial por $ 21,000.

Cuadro resumen, conclusiones

Configuración Almacenamiento Fujitsu ETERNUS DX100 + 12 Nearline SAS 1Tb SFF (RAID10) Almacenamiento Fujitsu ETERNUS DX100 + 12 Nearline SAS 1Tb SFF (RAID10) + Supermicro Twin Nuestro escenario 1: almacenamiento basado en CEPH Nuestro escenario 2: construir una nube privada Nuestro escenario 3: construcción de almacenamiento ultrabarato
Volumen útil, GB 6 000 6 000 6 000 6000 8 000
Precio (dólares americanos 21000 36000 15 770 20 592 7 324
Costo de 1 GB, USD 3,5 6 2,63 3,43 0,92
Número de IOP * (lectura 70% / escritura 30%, tamaño de bloque 4K) 760 760 700 700 675
Cita Almacenamiento Almacenamiento + Computación Almacenamiento + Computación Almacenamiento + Computación Almacenamiento + Computación

* El cálculo del número de IOP se realizó para las matrices creadas de discos SAS NL en sistemas de almacenamiento y discos SATA en almacenamiento CEPH, se deshabilitó el almacenamiento en caché por la pureza de los valores obtenidos. Con el almacenamiento en caché, los IOP serán significativamente más altos hasta que la caché esté llena.

Como resultado, podemos decir que se pueden construir almacenes de datos confiables y económicos sobre la base del clúster CEPH. Los cálculos han demostrado que usar nodos de clúster solo para almacenamiento no es muy eficiente; la solución es más barata que comprar sistemas de almacenamiento, pero no mucho; en nuestro ejemplo, el costo de almacenamiento en CEPH fue aproximadamente un 25% menor que el de Fujitsu DX100. Los ahorros reales se sienten como resultado de combinar la parte informática y el almacenamiento en el mismo hardware; en este caso, el costo de la solución será 1.8 veces menor que cuando se construye una estructura clásica utilizando almacenamiento dedicado y máquinas host separadas.

EFSOL implementa esta solución de acuerdo con los requisitos individuales. Podemos usar el equipo que tiene, lo que reducirá aún más los costos de capital de la implementación del sistema. Contáctenos y realizaremos una encuesta de su equipo para su uso en la creación de sistemas de almacenamiento.

Con la complicación diaria de los sistemas informáticos en red y las soluciones corporativas globales, el mundo comenzó a demandar tecnologías que impulsaran la reactivación de los sistemas de almacenamiento corporativos (sistemas de almacenamiento). Y así, una sola tecnología brinda un rendimiento sin precedentes, una tremenda escalabilidad y beneficios de TCO excepcionales al tesoro mundial de avances en almacenamiento. Las circunstancias que se han formado con la llegada del estándar FC-AL (Fibre Channel - Arbitrated Loop) y la SAN (Storage Area Network) que se desarrolla sobre su base prometen una revolución en las tecnologías informáticas orientadas a datos.

"El desarrollo más significativo en almacenamiento que" hemos visto en 15 años "

Data Communications International, 21 de marzo de 1998

Definición formal de SAN según la definición de Storage Network Industry Association (SNIA):

“Una red cuya tarea principal es transferir datos entre sistemas informáticos y dispositivos de almacenamiento de datos, así como entre los propios sistemas de almacenamiento. La SAN consiste en la infraestructura de comunicaciones que proporciona conectividad física y también es responsable de la capa de gestión que integra las comunicaciones, el almacenamiento y los sistemas informáticos para transferir datos de forma segura y fiable ”.

Diccionario técnico SNIA, Copyright Storage Network Industry Association, 2000

Opciones para organizar el acceso a los sistemas de almacenamiento

Hay tres opciones principales para organizar el acceso a los sistemas de almacenamiento:

  • SAS (Server Attached Storage), almacenamiento adjunto al servidor;
  • NAS (Network Attached Storage), almacenamiento conectado a la red;
  • SAN (Storage Area Network), red de área de almacenamiento.

Considere las topologías de los sistemas de almacenamiento correspondientes y sus características.

SAS

Un sistema de almacenamiento conectado a un servidor. La forma familiar y tradicional de conectar un sistema de almacenamiento a una interfaz de alta velocidad en un servidor, generalmente una interfaz SCSI paralela.

Figura 1. Almacenamiento adjunto al servidor

El uso de un alojamiento de almacenamiento independiente para la topología SAS es opcional.

La principal ventaja de un almacenamiento conectado a un servidor en comparación con otras opciones es un precio bajo y un alto rendimiento a razón de un almacenamiento por servidor. Esta topología es la más óptima en el caso de utilizar un único servidor a través del cual se organiza el acceso a la matriz de datos. Pero todavía tiene una serie de problemas que llevaron a los diseñadores a buscar otras opciones para organizar el acceso a los sistemas de almacenamiento.

Las características de SAS incluyen:

  • El acceso a los datos depende del SO y del sistema de archivos (en general);
  • La complejidad de organizar sistemas con alta disponibilidad;
  • Bajo costo;
  • Alto rendimiento dentro de un nodo;
  • Reduciendo la velocidad de respuesta al cargar el servidor que da servicio a la tienda.

NAS

Un sistema de almacenamiento conectado a la red. Esta opción para organizar el acceso apareció hace relativamente poco tiempo. Su principal ventaja es la conveniencia de integrar almacenamiento adicional en las redes existentes, pero por sí solo no aporta mejoras radicales a la arquitectura de almacenamiento. De hecho, un NAS es un servidor de archivos puro, y hoy puede encontrar muchas implementaciones nuevas de almacenamiento como NAS basado en la tecnología Thin Server.


Figura 2. Almacenamiento conectado a la red.

Funciones NAS:

  • Servidor de archivos dedicado;
  • El acceso a los datos es independiente del sistema operativo y la plataforma;
  • Conveniencia de la administración;
  • Máxima facilidad de instalación;
  • Escalabilidad baja;
  • Conflicto con el tráfico LAN / WAN.

El almacenamiento basado en NAS es ideal para servidores de bajo costo con características mínimas.

SAN

Las redes de almacenamiento de datos comenzaron a desarrollarse de manera intensiva y no se introdujeron hasta 1999. La SAN se basa en una red separada de la LAN / WAN, que sirve para organizar el acceso a los datos de los servidores y estaciones de trabajo involucrados en su procesamiento directo. Esta red se basa en el estándar Fibre Channel, que brinda a los sistemas de almacenamiento las ventajas de las tecnologías LAN / WAN y la capacidad de organizar plataformas estándar para sistemas con alta disponibilidad y alta demanda. Casi el único inconveniente de la SAN en la actualidad es el costo relativamente alto de los componentes, pero el costo total de propiedad de los sistemas empresariales construidos con tecnología SAN es bastante bajo.


Figura 3. Red de área de almacenamiento.

Las principales ventajas de una SAN incluyen casi todas sus características:

  • Independencia de la topología SAN de los sistemas de almacenamiento y servidores;
  • Cómoda gestión centralizada;
  • Sin conflicto con el tráfico LAN / WAN;
  • Cómoda copia de seguridad de datos sin cargar la red local ni los servidores;
  • Alto rendimiento;
  • Alta escalabilidad;
  • Alta flexibilidad;
  • Alta disponibilidad y tolerancia a fallos.

También debe tenerse en cuenta que esta tecnología es todavía bastante joven y en un futuro cercano debería experimentar muchas mejoras en el campo de la estandarización de la gestión y la forma en que interactúan las subredes SAN. Pero uno puede esperar que esto solo amenace a los pioneros con perspectivas adicionales de liderazgo.

FC como base para construir una SAN

Como una LAN, una SAN se puede construir usando una variedad de topologías y medios. Al construir una SAN, se pueden utilizar tanto una interfaz SCSI paralela como Fibre Channel o, digamos, SCI (Scalable Coherent Interface), pero Fibre Channel debe su creciente popularidad a la SAN. En el diseño de esta interfaz participaron expertos con gran experiencia en el desarrollo de interfaces de canal y de red, y lograron combinar todas las características positivas importantes de ambas tecnologías para obtener algo verdaderamente revolucionario. ¿Qué exactamente?

Principales características clave del conducto:

  • Baja latencia
  • Altas velocidades
  • Alta fiabilidad
  • Topología punto a punto
  • Pequeñas distancias entre nodos
  • Dependencia de la plataforma
e interfaces de red:
  • Topologías multipunto
  • Larga distancia
  • Alta escalabilidad
  • Bajas velocidades
  • Grandes retrasos
fusionado en Fibre Channel:
  • Altas velocidades
  • Independencia del protocolo (0-3 niveles)
  • Larga distancia
  • Baja latencia
  • Alta fiabilidad
  • Alta escalabilidad
  • Topologías multipunto

Tradicionalmente, las interfaces de almacenamiento (lo que se encuentra entre el host y los dispositivos de almacenamiento) han sido una barrera para el rendimiento y el crecimiento del almacenamiento. Al mismo tiempo, las tareas aplicadas requieren un aumento significativo de la capacidad del hardware, lo que, a su vez, conlleva la necesidad de incrementar el ancho de banda de las interfaces para la comunicación con los sistemas de almacenamiento. Son los problemas de crear un acceso a datos flexible y de alta velocidad lo que Fibre Channel ayuda a resolver.

El estándar Fibre Channel se definió finalmente en los últimos años (de 1997 a 1999), durante los cuales se realizó un tremendo trabajo para armonizar la interacción de los fabricantes de varios componentes, y se hizo todo lo necesario para transformar Fibre Channel de una tecnología puramente conceptual. en real, que recibió apoyo en forma de instalaciones en laboratorios y centros de cómputo. En el año 1997, se diseñaron las primeras muestras comerciales de componentes fundamentales para la construcción de SAN basadas en FC, como adaptadores, concentradores, conmutadores y puentes. Así, desde 1998, el FC se ha utilizado comercialmente en el sector empresarial, en la producción y en proyectos a gran escala para la implementación de sistemas críticos para fallas.

Fibre Channel es un estándar industrial abierto para comunicaciones en serie de alta velocidad. Conecta servidores y sistemas de almacenamiento a una distancia de hasta 10 km (utilizando equipo estándar) a una velocidad de 100 MB / s (en Cebit 2000, se presentaron muestras de productos que utilizan el nuevo estándar Fibre Channel a velocidades de 200 MB / s por anillo, y en condiciones de laboratorio, ya se están explotando implementaciones del nuevo estándar con velocidades de 400 MB / s, que es de 800 MB / s cuando se utiliza un anillo doble.) (En el momento de la publicación del artículo, varios fabricantes ya han comenzado a enviar tarjetas de red y conmutadores basados ​​en FC 200 MB / s.) El canal de fibra admite simultáneamente una variedad de protocolos estándar (incluidos TCP / IP y SCSI-3) a través de un solo medio físico, lo que potencialmente simplifica las redes infraestructura al mismo tiempo que ofrece oportunidades para reducir los costos de instalación y mantenimiento, el uso de subredes separadas para LAN / WAN y SAN tiene varias ventajas y es el valor predeterminado recomendado.

Una de las ventajas más importantes del Fibre Channel, junto con los parámetros de velocidad (que, por cierto, no siempre son los principales para los usuarios de SAN y se pueden implementar con otras tecnologías) es la capacidad de trabajar en largas distancias y la flexibilidad de topología. que llegó al nuevo estándar de las tecnologías de red. Por lo tanto, el concepto de construir una topología SAN se basa en los mismos principios que las redes tradicionales, generalmente basadas en hubs y switches, que ayudan a prevenir caídas de velocidad con un aumento en el número de nodos y crean la posibilidad de una organización conveniente de sistemas sin un punto único de fallo.

Para comprender mejor las ventajas y características de esta interfaz, presentamos las características comparativas de FC y Parallel SCSI en forma de tabla.

Tabla 1. Comparación de tecnologías SCSI de canal de fibra y paralelo

El estándar Fibre Channel asume el uso de una variedad de topologías, como punto a punto, anillo o hub FC-AL (Loop o Hub FC-AL), conmutador de red troncal (Fabric / Switch).

Se utiliza una topología punto a punto para conectar un único sistema de almacenamiento a un servidor.

Loop o Hub FC-AL: para conectar varios dispositivos de almacenamiento a varios hosts. Al organizar un anillo doble, aumenta la velocidad y la tolerancia a fallas del sistema.

Los conmutadores se utilizan para proporcionar el máximo rendimiento y resistencia para sistemas complejos, grandes y ramificados.

Debido a la flexibilidad de la red, la SAN tiene una característica extremadamente importante: la capacidad conveniente de construir sistemas tolerantes a fallas.

Al ofrecer alternativas de almacenamiento y capacidades de agregación de múltiples tiendas para la redundancia de hardware, las SAN ayudan a proteger los sistemas de hardware y software de fallas de hardware. A modo de demostración, daremos un ejemplo de cómo crear un sistema de dos modos sin puntos de falla.


Figura 4. Ningún punto único de falla.

La construcción de tres o más sistemas de nodos se lleva a cabo simplemente agregando servidores adicionales a la red FC y conectándolos a ambos hubs / switches).

Con FC, la construcción de sistemas tolerantes a desastres se vuelve transparente. Los canales de red tanto para el almacenamiento como para las redes locales se pueden establecer sobre la base de fibra óptica (hasta 10 km o más usando amplificadores de señal) como portador físico para FC, mientras se usa equipo estándar, lo que permite reducir significativamente el costo de tales sistemas.

Con la capacidad de acceder a todos los componentes SAN desde cualquier lugar, obtenemos una red de datos extremadamente flexible. Cabe señalar que la SAN proporciona transparencia (la capacidad de ver) todos los componentes, hasta los discos en los sistemas de almacenamiento. Esta característica ha impulsado a los fabricantes de componentes a aprovechar su considerable experiencia en la creación de sistemas de gestión para LAN / WAN con el fin de incorporar amplias capacidades de supervisión y gestión en todos los componentes SAN. Estas capacidades incluyen monitorear y administrar nodos individuales, almacenamiento de componentes, gabinetes, dispositivos de red y subestructuras de red.

El sistema de supervisión y gestión SAN utiliza estándares abiertos como:

  • Conjunto de comandos SCSI
  • Servicios de caja SCSI (SES)
  • Tecnología de informes y análisis de autosupervisión SCSI (S.M.A.R.T.)
  • SAF-TE (Gabinetes tolerantes a fallas con acceso SCSI)
  • Protocolo simple de administración de redes (SNMP)
  • Gestión empresarial basada en web (WBEM)

Los sistemas construidos con tecnologías SAN no solo brindan al administrador la capacidad de monitorear el desarrollo y el estado de los recursos de almacenamiento, sino que también abren oportunidades para monitorear y controlar el tráfico. Con estos recursos, el software de administración de SAN implementa los esquemas de balanceo de carga de componentes y programación de almacenamiento más eficientes.

Las SAN se integran bien con las infraestructuras de información existentes. Su implementación no requiere ningún cambio en las redes LAN y WAN existentes, sino que solo amplía las capacidades de los sistemas existentes, liberándolos de las tareas enfocadas a transferir grandes cantidades de datos. Además, al integrar y administrar una SAN, es muy importante que los elementos clave de la red sean intercambiables en caliente e instalables, con capacidades de configuración dinámica. Entonces, el administrador puede agregar uno u otro componente o reemplazarlo sin apagar el sistema. Y todo este proceso de integración se puede mostrar visualmente en un sistema de gestión SAN gráfico.

Habiendo considerado las ventajas anteriores, podemos destacar una serie de puntos clave que afectan directamente a una de las principales ventajas de la red de área de almacenamiento: el costo total de propiedad (costo total de propiedad).

La increíble escalabilidad permite a una empresa que utiliza una SAN invertir en servidores y almacenamiento según sea necesario. Y también mantenga sus inversiones en equipos ya instalados al cambiar las generaciones tecnológicas. Cada nuevo servidor tendrá acceso de alta velocidad al almacenamiento y cada gigabyte adicional de almacenamiento estará disponible para todos los servidores de la subred cuando el administrador lo ordene.

Las excelentes capacidades para construir sistemas resilientes pueden proporcionar beneficios comerciales directos al minimizar el tiempo de inactividad y rescatar el sistema en caso de un desastre natural u otro desastre.

La controlabilidad de los componentes y la transparencia del sistema brindan la capacidad de llevar a cabo una administración centralizada de todos los recursos de almacenamiento y esto, a su vez, reduce significativamente los costos de su soporte, cuyo costo, por regla general, es más de 50% del costo del equipo.

Impacto de SAN en las aplicaciones

Para que nuestros lectores comprendan cuán útiles en la práctica son las tecnologías discutidas en este artículo, daremos varios ejemplos de problemas aplicados que se resolverían de manera ineficaz sin el uso de redes de almacenamiento, requerirían inversiones financieras colosales o no se resolverían en todo por métodos estándar.

Copia de seguridad y recuperación de datos

Al utilizar la interfaz SCSI tradicional, el usuario, al crear sistemas de copia de seguridad y recuperación de datos, se enfrenta a una serie de problemas complejos que pueden resolverse muy fácilmente con las tecnologías SAN y FC.

Así, el uso de redes de almacenamiento lleva la solución del problema de respaldo y recuperación a un nuevo nivel y brinda la oportunidad de realizar respaldos varias veces más rápido que antes, sin cargar la red local y los servidores con respaldo de datos.

Agrupación en clústeres de servidores

Una de las tareas típicas para las que se utiliza eficazmente SAN es la agrupación en clústeres de servidores. Dado que uno de los puntos clave en la organización de los sistemas de clústeres de alta velocidad que trabajan con datos es el acceso al almacenamiento, con la llegada de SAN, la construcción de clústeres de múltiples nodos a nivel de hardware se resuelve simplemente agregando un servidor conectado a la SAN (esto se puede hacer sin siquiera apagar el sistema, ya que los conmutadores FC admiten conexión en caliente). Cuando se utiliza una interfaz SCSI paralela, cuya conectividad y escalabilidad es mucho peor que la de FC, los clústeres orientados a datos serían difíciles de hacer con más de dos nodos. Los conmutadores SCSI paralelos son complejos y costosos, y son estándar para los FC. Para crear un clúster que no tenga un solo punto de falla, es suficiente integrar una SAN duplicada en el sistema (tecnología DUAL Path).

Dentro de la agrupación en clústeres, una de las tecnologías RAIS (Redundant Array of Inexpensive Servers) parece especialmente atractiva para crear potentes sistemas de comercio electrónico escalables y otros tipos de tareas con mayores requisitos de energía. Según Alistair A. Croll, cofundador de Networkshop Inc, usar RAIS es bastante efectivo: “Por ejemplo, por $ 12,000-15,000, puede comprar alrededor de seis servidores económicos de uno o dos procesadores (Pentium III) Linux / Apache . La potencia, escalabilidad y resistencia de dicho sistema será significativamente mayor que, por ejemplo, un solo servidor de cuatro vías basado en procesadores Xeon, y el costo es el mismo ".

Transmisión de video concurrente, intercambio de datos

Imagine una tarea en la que necesita editar video en varias (digamos> 5) estaciones o simplemente trabajar con datos enormes. La transferencia de un archivo de 100 GB a través de una red local le llevará unos minutos y el trabajo general será muy difícil. Con SAN, cada estación de trabajo y servidor de la red puede acceder al archivo en el equivalente a un disco local de alta velocidad. Si necesita otra estación / servidor para procesar datos, puede agregarlo a la SAN sin apagar la red simplemente conectando la estación al conmutador SAN y otorgándole acceso a la tienda. Si ya no está satisfecho con el rendimiento del subsistema de datos, simplemente puede agregar un almacenamiento más y usar la tecnología de distribución de datos (por ejemplo, RAID 0) para obtener el doble de rendimiento.

Componentes SAN principales

miércoles

Fibre Channel utiliza cobre y fibra para conectar componentes. Ambos tipos de cables se pueden usar simultáneamente al construir una SAN. La conversión de la interfaz se realiza mediante GBIC (Convertidor de interfaz Gigabit) y MIA (Adaptador de interfaz de medios). Actualmente, ambos tipos de cable ofrecen la misma velocidad de transferencia de datos. El cable de cobre se utiliza para distancias cortas (hasta 30 metros), óptico, tanto para distancias cortas como para distancias de hasta 10 km y más. Utiliza cables ópticos multimodo y monomodo. El cable multimodo se utiliza para distancias cortas (hasta 2 km). El diámetro interior de la fibra del cable multimodo es de 62,5 o 50 micrones. Para una velocidad de transferencia de 100 MB / s (200 MB / s full duplex) cuando se utiliza fibra multimodo, la longitud del cable no debe exceder los 200 metros. El cable monomodo se utiliza para largas distancias. La longitud de dicho cable está limitada por la potencia del láser utilizado en el transmisor de señales. El cable monomodo tiene un diámetro interior de 7 o 9 micrones y permite el paso de un solo haz.

Conectores, adaptadores

Para conectar cables de cobre se utilizan conectores DB-9 o HSSD. HSSD se considera más confiable, pero DB-9 se usa con la misma frecuencia porque es más simple y económico. El conector estándar (más común) para cables ópticos es el conector SC, que proporciona una conexión clara y de alta calidad. Para la conexión normal se utilizan conectores SC multimodo, y para conexiones remotas, monomodo. Los microconectores se utilizan en adaptadores multipuerto.

Los adaptadores más comunes para FC para el bus PCI de 64 bits. Además, muchos adaptadores FC se desarrollan para el bus S-BUS, los adaptadores para MCA, EISA, GIO, HIO, PMC, Compact PCI se producen para uso especializado. Los más populares son de puerto único, hay tarjetas de dos y cuatro puertos. En los adaptadores PCI, por regla general, se utilizan conectores DB-9, HSSD, SC. Además, a menudo hay adaptadores basados ​​en GBIC que vienen con o sin módulos GBIC. Los adaptadores de canal de fibra difieren en las clases que admiten y en una variedad de funciones. Para comprender las diferencias, presentamos una tabla comparativa de adaptadores fabricados por QLogic.

Cuadro de la familia de adaptadores de bus de host de canal de fibra
SANblade64 bitsFCAL Publ. Bucle PvtPuerto FLClase 3Puerto FClase 2Punto a puntoIP / SCSIDuplex completoCinta FCEspecificaciones de conexión en caliente PCI 1.0Reconfiguración dinámica de SolarisVIВ2 Gb
Serie 2100PCI de 33 y 66 MHzXXX
Serie 2200PCI de 33 y 66 MHzXXXXXXXXX
PCI de 33 MHzXXXXXXXXXX
Sbus de 25 MHZXXXXXXXXX X
Serie 2300PCI de 66 MHZ / PCI-X de 133 MHZXXXXXXXXX XX

Concentradores

Los concentradores de canal de fibra (concentradores) se utilizan para conectar nodos a un anillo FC (bucle FC) y tienen una estructura similar a los concentradores Token Ring. Dado que una rotura de anillo puede hacer que la red deje de funcionar, los concentradores FC modernos utilizan puertos de circuito de derivación de puerto PBC, que abren / cierran automáticamente el anillo (conectan / desconectan los sistemas conectados al concentrador). Normalmente, los FC HUB admiten hasta 10 conexiones y pueden apilar hasta 127 puertos por anillo. Todos los dispositivos conectados al HUB reciben un ancho de banda común que pueden compartir entre ellos.

Interruptores

Los conmutadores de canal de fibra (conmutadores) tienen las mismas funciones que los conmutadores LAN familiares para el lector. Proporcionan conectividad sin bloqueo de velocidad completa entre nodos. Cualquier nodo conectado al conmutador FC recibe ancho de banda completo (escalable). A medida que aumenta el número de puertos en una red conmutada, aumenta su ancho de banda. Los conmutadores se pueden utilizar junto con los concentradores (que se utilizan para sitios que no requieren ancho de banda dedicado para cada nodo) para lograr la mejor relación precio / rendimiento. Gracias a la conexión en cascada, los conmutadores se pueden utilizar potencialmente para crear redes FC con un número de direcciones de 2 a 24 (más de 16 millones).

Puentes

Los puentes FC (puentes o multiplexores) se utilizan para conectar dispositivos SCSI paralelos a una red basada en FC. Proporcionan traducción de paquetes SCSI entre dispositivos Fibre Channel y Parallel SCSI, ejemplos de los cuales son los discos de estado sólido (SSD) o las bibliotecas de cintas. Cabe señalar que recientemente, casi todos los dispositivos que se pueden utilizar dentro de la SAN, los fabricantes están comenzando a producir con una interfaz FC incorporada para su conexión directa a las redes de almacenamiento.

Servidores y almacenamiento

A pesar de que los servidores y el almacenamiento están lejos de ser los componentes SAN menos importantes, no nos detendremos en su descripción, ya que estamos seguros de que todos nuestros lectores los conocen.

Al final, me gustaría agregar que este artículo es solo el primer paso hacia las redes de almacenamiento. Para comprender completamente el tema, el lector debe prestar mucha atención a las características de implementación de los componentes por parte de los fabricantes de SAN y el software de administración, ya que sin ellos la Red de Área de Almacenamiento es solo un conjunto de elementos para cambiar los sistemas de almacenamiento que no le brindarán todos los beneficios de implementar una red de área de almacenamiento.

Conclusión

Hoy, Storage Area Network es una tecnología relativamente nueva que pronto podría convertirse en la corriente principal entre los clientes corporativos. En Europa y Estados Unidos, las empresas con una flota bastante grande de sistemas de almacenamiento instalados ya están comenzando a migrar a redes de área de almacenamiento con el mejor costo total de propiedad (TCO).

Los analistas predicen que en 2005 una cantidad significativa de servidores de nivel medio y alto se enviarán con Fibre Channel preinstalado (esta tendencia se puede ver hoy), y solo para las unidades de disco internas en los servidores se utilizará la interfaz SCSI paralela. Ya hoy en día, cuando se construyen sistemas de almacenamiento y se compran servidores de nivel medio y superior, se debe prestar atención a esta tecnología prometedora, especialmente porque hoy en día permite implementar una serie de tareas mucho más económicas que el uso de soluciones especializadas. Además, cuando invierte en tecnología SAN hoy, no perderá su inversión mañana, ya que las funciones de Fibre Channel crean una gran oportunidad para aprovechar su inversión en el futuro.

PD

La versión anterior de este artículo se escribió en junio de 2000, pero debido a la falta de interés popular en la tecnología de redes de área de almacenamiento, la publicación se pospuso para el futuro. Este futuro ha llegado hoy y espero que este artículo induzca al lector a darse cuenta de la necesidad de cambiar a la tecnología de red de área de almacenamiento como tecnología avanzada para construir sistemas de almacenamiento y organizar el acceso a los datos.