Do Node.js ao Go: supercarregando milhares de arquivos como um único Zip

Primeira página > Programação > Do Node.js ao Go: supercarregando milhares de arquivos como um único Zip

Do Node.js ao Go: supercarregando milhares de arquivos como um único Zip

Publicado em 2024-08-24

Navegar:562

From Node.js to Go: Supercharging Sownloads of Thousands of Files as a Single Zip

Como desenvolvedores, frequentemente enfrentamos desafios ao lidar com processamento e entrega de dados em grande escala. Na Kamero, recentemente resolvemos um gargalo significativo em nosso pipeline de entrega de arquivos. Nosso aplicativo permite aos usuários baixar milhares de arquivos associados a um evento específico como um único arquivo zip. Esse recurso, desenvolvido por uma função Lambda baseada em Node.js, responsável por buscar e compactar arquivos de buckets S3, enfrentava restrições de memória e longos tempos de execução à medida que nossa base de usuários crescia.

Esta postagem detalha nossa jornada de uma implementação Node.js que consome muitos recursos até uma solução Go enxuta e extremamente rápida que lida com eficiência com downloads massivos de S3. Exploraremos como otimizamos nosso sistema para fornecer aos usuários uma experiência perfeita ao solicitar um grande número de arquivos de eventos específicos, todos empacotados em um conveniente download zip único.

O desafio

Nossa função Lambda original enfrentou vários problemas críticos ao processar grandes conjuntos de arquivos baseados em eventos:

Consumo de memória: mesmo com 10 GB de memória alocada, a função falharia ao processar 20.000 arquivos para eventos maiores.
Tempo de execução: as operações zip para eventos com vários arquivos estavam demorando muito, às vezes expirando antes da conclusão.
Escalabilidade: a função não conseguiu lidar com a carga crescente de forma eficiente, limitando nossa capacidade de atender aos usuários grandes conjuntos de arquivos de eventos populares.
Experiência do usuário: os tempos lentos de preparação para download estavam afetando a satisfação do usuário, especialmente para eventos com contagens substanciais de arquivos.

A implementação do Node.js: uma visão rápida

Nossa implementação original usou a biblioteca s3-zip para criar arquivos zip a partir de objetos S3. Aqui está um trecho simplificado de como estávamos processando os arquivos:

const s3Zip = require("s3-zip");

// ... other code ...

const body = s3Zip.archive(
  { bucket: bucketName },
  eventId,
  files,
  entryData
);

await uploadZipFile(Upload_Bucket, zipfileKey, body);

Embora essa abordagem tenha funcionado, ela carregou todos os arquivos na memória antes de criar o zip, levando a um alto uso de memória e possíveis erros de falta de memória para conjuntos de arquivos grandes.

Enter Go: uma reescrita revolucionária

Decidimos reescrever nossa função Lambda em Go, aproveitando sua eficiência e recursos de simultaneidade integrados. Os resultados foram surpreendentes:

Uso de memória: caiu de 10 GB para apenas 100 MB para a mesma carga de trabalho.
Velocidade: A função ficou aproximadamente 10 vezes mais rápida.
Confiabilidade: processa com êxito 20.000 arquivos sem problemas.

Principais otimizações na implementação Go

1. Operações S3 eficientes

Usamos o AWS SDK for Go v2, que oferece melhor desempenho e menor uso de memória em comparação com v1:

cfg, err := config.LoadDefaultConfig(context.TODO())
s3Client = s3.NewFromConfig(cfg)

2. Processamento Simultâneo

As goroutines do Go nos permitiram processar vários arquivos simultaneamente:

var wg sync.WaitGroup sem := make(chan struct{}, 10) // Limit concurrent operations for _, photo := range photos { wg.Add(1) go func(photo Photo) { defer wg.Done() sem

Essa abordagem nos permite processar vários arquivos simultaneamente enquanto controlamos o nível de simultaneidade para evitar sobrecarregar o sistema.

3. Criação de Zip de streaming

Em vez de carregar todos os arquivos na memória, transmitimos o conteúdo zip diretamente para o S3:

pipeReader, pipeWriter := io.Pipe()

go func() {
    zipWriter := zip.NewWriter(pipeWriter)
    // Add files to zip
    zipWriter.Close()
    pipeWriter.Close()
}()

// Upload streaming content to S3
uploader.Upload(ctx, &s3.PutObjectInput{
    Bucket: &destBucket,
    Key:    &zipFileKey,
    Body:   pipeReader,
})

Essa abordagem de streaming reduz significativamente o uso de memória e nos permite lidar com conjuntos de arquivos muito maiores.

Os resultados

A reescrita para Go proporcionou melhorias impressionantes:

Uso de memória: reduzido em 99% (de 10 GB para 100 MB)
Velocidade de processamento: aumentada em aproximadamente 1000%
Confiabilidade: lida com sucesso com 20.000 arquivos sem problemas
Eficiência de custos: menor uso de memória e tempo de execução mais rápido resultam em custos reduzidos do AWS Lambda

Lições aprendidas

A escolha do idioma é importante: a eficiência e o modelo de simultaneidade do Go fizeram uma enorme diferença em nosso caso de uso.
Entenda seus gargalos: Criar o perfil de nossa função Node.js nos ajudou a identificar áreas-chave para melhoria.
Aproveite as soluções nativas da nuvem: usar o AWS SDK for Go v2 e compreender os recursos do S3 permitiu melhor integração e desempenho.
Pense em Streams: Processar dados como streams em vez de carregar tudo na memória é crucial para operações em grande escala.

Conclusão

Reescrever nossa função Lambda em Go não apenas resolveu nossos problemas imediatos de escalabilidade, mas também forneceu uma solução mais robusta e eficiente para nossas necessidades de processamento de arquivos. Embora o Node.js tenha nos servido bem inicialmente, essa experiência destacou a importância de escolher a ferramenta certa para o trabalho, especialmente ao lidar com tarefas que exigem muitos recursos em grande escala.

Lembre-se de que a melhor linguagem ou estrutura depende do seu caso de uso específico. Em nosso cenário, as características de desempenho do Go se alinharam perfeitamente às nossas necessidades, resultando em uma experiência de usuário significativamente melhorada e custos operacionais reduzidos.

Você enfrentou desafios semelhantes com funções sem servidor? Como você os superou? Adoraríamos ouvir sobre suas experiências nos comentários abaixo!

Declaração de lançamento Este artigo é reproduzido em: https://dev.to/hiteshsisara/from-nodejs-to-go-supercharging-s3-downloads-of-thils-of-files-as-a-single-zip-474b?1 Se houver alguma infração, entre em contato com [email protected] para Delete.

Tutorial mais recente Mais>

Por que a execução do JavaScript cessa ao usar o botão Back Firefox?
Problema do histórico de navegação: JavaScript deixa de executar após o uso do botão de volta ao Firefox usuários do Firefox podem encontrar u...

Programação Postado em 2025-07-14
Python Leia o arquivo CSV UnicodedecodeError Ultimate Solution
unicode decodificar erro no arquivo csv lendo Ao tentar ler um arquivo csodo (& sinod) usando o módulo CSV embutido, você pode encontrar um er...

Programação Postado em 2025-07-14
Por que o Microsoft Visual C ++ falha ao implementar corretamente a instanciação do modelo bifásico?
O mistério do modelo de duas fases "quebrado" bifásia instanciação no Microsoft Visual C Declaração de Problema: STRAGLES Expressa...

Programação Postado em 2025-07-14
Como remover emojis das cordas em Python: um guia para iniciantes para corrigir erros comuns?
removendo os emojis de strings em python o código Python fornecido para remover emojis falha porque contém syntaxe erros. As cadeias de unicod...

Programação Postado em 2025-07-14
Como limitar o intervalo de rolagem de um elemento dentro de um elemento pai de tamanho dinâmico?
implementando limites de altura CSS para elementos de rolagem vertical em uma interface interativa, o controle do comportamento de rolagem dos...

Programação Postado em 2025-07-14
Como detectar com eficiência matrizes vazias no PHP?
verificando o vazio da matriz em php Uma matriz vazia pode ser determinada em PHP através de várias abordagens. Se a necessidade é verificar a...

Programação Postado em 2025-07-14
Como remover os manipuladores anônimos de eventos JavaScript de maneira limpa?
removendo os ouvintes anônimos do evento adicionando ouvintes de eventos anônimos a elementos fornece flexibilidade e simplicidade, mas quando é...

Programação Postado em 2025-07-14
Quais foram as restrições ao usar o current_timestamp com colunas de registro de data e hora em MySQL antes da versão 5.6.5?
restrições em colunas de timestamp com current_timestamp no padrão ou na atualização de cláusulas nas versões MySQL antes de 5.6.5 historicament...

Programação Postado em 2025-07-14
Quando um aplicativo Go Go fecha a conexão do banco de dados?
Gerenciando conexões de banco de dados em Applications Go Web em aplicativos simples Go Web que utilizam bancos de dados como PostGresql, o mome...

Programação Postado em 2025-07-14
Como inserir ou atualizar com eficiência linhas com base em duas condições no MySQL?
inserir ou atualizar com duas condições Problema Descrição: O usuário encontra um tempo de tempo que não está sendo inserido e de uma tabe...

Programação Postado em 2025-07-14
Método para a passagem correta dos ponteiros da função do membro C ++
como passar os ponteiros da função do membro em C Ao passar uma função de membro da classe para uma função que aceita um ponteiro de membro: (...

Programação Postado em 2025-07-14
Usuário Formato de tempo local e Guia de exibição de deslocamento de fuso horário
exibindo data/hora no formato de localidade do usuário com o time offset abordagem: A abordagem recomendada é lidar com a formatação de dat...

Programação Postado em 2025-07-14
Variedade
Os métodos são FNs que podem ser chamados em objetos Matrizes são objetos, portanto, eles também têm métodos no JS. Flice (Begin): Extra...

Programação Postado em 2025-07-14
Como posso manter a renderização de células JTable personalizada após a edição de células?
MANAZENDO JTABLE CELUMENTE renderização após a célula edit em uma jtable, implementar capacidades de renderização e edição de células personal...

Programação Postado em 2025-07-14
Maneira eficiente do Python de remover tags html do texto
removendo tags html em python para uma representação textual intocada manipular respostas html geralmente envolve a extração de texto relevant...

Programação Postado em 2025-07-14

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo