O que é Software Defined Storage (SDS) e Hiperconvergência?

O que é Software Defined Storage (SDS) e Hiperconvergência?

Com certeza nos últimos anos você já deve ter ouvido falar sobre estes dois termos. Mas de fato o que temos de novo com eles além do “hype”, quais são os benefícios reais, se tenho uma solução de Software Defined Storage (em português Armazenamento Definido por Software) já tenho Hyperconvergence (em português Hiperconvergência) ou Infraestrutura Hiperconvergente?

Para começar vamos entender um pouco mais sobre o modelo tradicional de Storage, um modelo maduro com mais de 20 anos de adoção nas corporações, basicamente os fabricantes chamam este modelo de 3-2-1, ou seja, 3 Servidores, 2 Switches e 1 Storage (ilustrado na figura abaixo), neste modelo temos uma solução relativamente simples de alta disponibilidade, pois temos conexões redundantes entre o Storage e os servidores, apesar de aparentemente o Storage ser o ponto único de falha, o hardware deste tipo de equipamento é altamente redundante (no mínimo duas fontes de alimentação, duas controladoras e discos usualmente configurados em arranjos com níveis de RAID adequados para suportar no mínimo a falha de um disco). Adicionalmente os servidores são configurados em cluster e são dimensionados para suportar a perda de 1 servidor e ainda assim manter o cluster funcionando.

Modelo de Infraestrutura Tradicional
Modelo de Infraestrutura Tradicional com 3 Servidores, 2 Switches e 1 Storage.

Neste modelo se precisarmos de mais poder de processamento, podemos adicionar mais servidores, se precisarmos de mais capacidade de armazenamento, basta adicionarmos mais discos no Storage diretamente ou através da adição de gavetas de expansão (conhecidas como enclosures). Muitos sistemas de Storage suportam um grande volume de discos, em alguns casos mais de 2.000 em um mesmo sistema. Este modelo de expansão do Storage é chamado de “Frame Storage”, cada adição de enclosures você aumenta a capacidade de armazenamento e dependendo da forma que os arranjos de discos estão configurados temos também um incremento de performance. Na figura abaixo, temos o nosso modelo 3-2-1 com a expansão de 1 servidor e 1 enclosure ligado ao Storage (expansão).

Modelo de Infraestrutura Tradicional
Modelo de Infraestrutura Tradicional com a adição de um quarto servidor e da expansão do Storage.

Se o número de servidores aumentar de forma significativa, será necessário aumentar o número de switches. Já na parte do Storage (Frame Storage), à medida que o número de discos cresce, o poder de processamento e conectividade começam a se tornar um problema, pois continuaremos a ter duas controladoras, a mesma quantidade de cache por controladora e conectividade com os switches limitada, logo temos uma limitação de escalabilidade vertical (você já deve ter visto o termo “Scale Up”).

Como mencionei no início, este é um modelo maduro e tem funcionado bem para os mais diversos tipos de demanda. Mas como nada no mundo é estático, as novas demandas “web scale” necessitam de um modelo que permita uma escalabilidade maior ao mesmo tempo buscando redução de custo através da adoção de hardware barato.

Assim surgiram as primeiras soluções de Software Defined Storage, utilizando hardware amplamente disponível e relativamente barato, transferindo toda a Inteligência e os mecanismos de disponibilidade para o software. Como disse Marc Andreessen o software está transformando tudo no mundo, inclusive os modelos de negócio, no épico artigo publicado em Agosto de 2011 no Wall Street Journal: Porquê o software está comendo o mundo. Todavia o termo Software Defined Storage surgiu um pouco antes entre 2008 e 2009.

Então Software Defined Storage ou simplesmente SDS significa usar servidores tradicionais com uma grande quantidade de discos locais, usualmente os discos não são configurados em arranjos RAID de Hardware, mas sim apresentados diretamente ao software que irá criar os mecanismos de proteção, geralmente criando réplicas dos dados em outros servidores e espalhando os dados em vários discos (através de Erasure Code por exemplo). Adicionalmente todos os nós (servidores físicos) enxergam toda a capacidade de armazenamento como se fosse um Storage compartilhado. É comum em soluções SDS a necessidade de um disco SSD de escrita intensa que funciona como um mecanismo de cache de leitura e buffer de escrita, adicionalmente a grande maioria das soluções disponíveis no mercado necessitam de uma rede de interconexão de alta velocidade (geralmente 10 Gbps). O fator redução de custo pode ser significativo, abaixo temos um slide de uma apresentação que assisti no Vmworld 2015 (STO5887: Building a Business Case for Virtual SAN) com a comparação entre o armazenamento no servidor e Storage tradicional:

Comparação entre valores SDS vs Storage
Comparação de valores entre Armazenamento Tradicional e baseado no Servidor.

Apesar do Hardware mais barato, parte do custo foi transferida para o licenciamento de software. Todavia existem diversas soluções no mercado, algumas inclusive Open Source como o CEPH. Comercialmente temos diversas opções como Vmware VSan, Windows Storage Spaces, Nexenta, Maxta, Datacore, etc.

Bem se chegou até aqui, deve-se estar perguntando: OK! O que a Hiperconvergência tem a ver com isso?

Quando usamos Software Defined Storage podemos ter servidores que funcionam apenas como “Storage Nodes”, ou seja, podem funcionar apenas com a função de armazenamento. Quando nos mesmos nós que temos o armazenamento também temos tarefas de computação, por exemplo, máquinas virtuais rodando e consumindo o armazenamento apresentado pela solução de Software Defined Storage, chamamos isso de Hiperconvergência. Logo ambos os termos estão relacionados de forma muito próxima e os conceitos por vezes acabam se misturando como se fossem a mesma coisa.

A grande vantagem da Hiperconvergência é que a junção das tecnologias facilita o gerenciamento da solução como um todo, geralmente através de uma console única é possível administrar o armazenamento, virtualização e o hardware. Outro ponto é que neste modelo a escalabilidade é horizontal (Scale Out), ou seja, se expandirmos o armazenamento, também se expande a conectividade e a capacidade de processamento ao mesmo tempo. Como o Software oferece grande flexibilidade, podemos ter políticas de proteção e desempenho granulares, por exemplo, cada máquina virtual pode receber níveis de proteção (contra falhas de discos ou falhas de servidores físicos) diferentes.

Finalmente, não podemos dizer que o armazenamento tradicional está morto, porém o caminho do Software Defined Storage e da Hiperconvergência é mais promissor, é possível afirmar com certa segurança que o Datacenter do futuro  será definido por software.

Consultor veterano na área de Tecnologia da Informação, com passagem em grandes empresas, graduado em Ciência da Computação com especialização em microeletrônica e gestão de projetos, detentor de diversas certificações de mercado (Microsoft, Cisco, Brocade, Vmware, etc.).

6 thoughts on “O que é Software Defined Storage (SDS) e Hiperconvergência?

  1. Arles, parabéns pelos artigos escritos. São bem caros, simples, objetivos e interessantes.
    Para backup houve alguma alteração com este conceito?

    1. Obrigado Célio!
      Vamos a sua pergunta. O velho backup continua existindo e não vejo que a adoção do Software Defined Storage irá acabar com o backup, afinal ainda precisamos de proteação contra falhas de hardware/softwares, erros humanos e catastrofes, e principalmente, essa proteção necessita ser Offsite. Mas sim existe uma transformação, o backuo hoje é em disco com deduplicação e compressão de dados e híbrido (disco e nuvem). No contexto do Software Defined Storage e Hiperconvergência, algumas soluções já trazem funcioalidades de backup embutidas com a da HPE (Simplyvity), temos também a Hiperconvergência da Huawei (FusionCube) que possui a possibilidade de integração com a nuvem (AWS) para a realização de Backup.
      Como inovação temos o “Backup Hiperconvergente” da Cohesity (https://www.cohesity.com/) que inclusive foi fundada por um Mohit Aron (https://www.linkedin.com/in/mohit-aron-a83858/) um dos fundadores da Nutanix (a líder em infraestrutura convergente segundo o Gartner).

  2. Arles,
    Muito bom esse artigo sobre SDS.
    Como profissional de infraestrutura e fã de tecnologias disruptivas, sou um entusiasta de SDDC.
    Minha visão vai ao encontro da sua, uma vez que penso que a melhor relação custo/benefício se dá através do escalocamento de recursos equilibrado.
    A hiperconvergência permite execução de aplicações que exigem alta perfomance, bem como aquelas que não exigem tanto do armazenamento, além de reduzir o TCO, e garantir um ROI no curto prazo.

    Abraço!
    Hide

    1. Hide,

      Obrigado! Inclusive para ambientes Vmware, por exemplo com a solução de SDS Vsan, a Vmware afirma que a integração do Vsan diretamente no Kernel provê uma performance muito superior se comparada com um sistema de Storage tradicional.

      Abraços!

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *