Node.js から Go へ: 数千のファイルのダウンロードを 1 つの ZIP としてスーパーチャージする

表紙 > プログラミング > Node.js から Go へ: 数千のファイルのダウンロードを 1 つの ZIP としてスーパーチャージする

Node.js から Go へ: 数千のファイルのダウンロードを 1 つの ZIP としてスーパーチャージする

2024 年 8 月 24 日に公開

ブラウズ：785

From Node.js to Go: Supercharging Sownloads of Thousands of Files as a Single Zip

開発者として、私たちは大規模なデータの処理と配信を扱うときにしばしば課題に直面します。 Kamiro では最近、ファイル配信パイプラインの重大なボトルネックに取り組みました。私たちのアプリケーションを使用すると、ユーザーは特定のイベントに関連する数千のファイルを単一の zip ファイルとしてダウンロードできます。この機能は、S3 バケットからのファイルのフェッチと圧縮を担当する Node.js ベースの Lambda 関数によって強化されていますが、ユーザーベースが拡大するにつれて、メモリの制約と長い実行時間に悩まされました。

この投稿では、リソースを大量に消費する Node.js 実装から、大規模な S3 ダウンロードを効率的に処理する無駄のない超高速 Go ソリューションへの移行について詳しく説明します。特定のイベントから大量のファイルをリクエストする際に、ユーザーにシームレスなエクスペリエンスを提供するためにシステムをどのように最適化し、すべてを便利な 1 つの zip ダウンロードにパッケージ化したかを見ていきます。

挑戦

私たちの元の Lambda 関数は、大規模なイベントベースのファイルセットを処理するときにいくつかの重大な問題に直面しました:

メモリ消費量: 10 GB のメモリが割り当てられていても、より大きなイベントで 20,000 個のファイルを処理すると、関数は失敗します。
実行時間: 多数のファイルを含むイベントの zip 操作に時間がかかりすぎ、完了する前にタイムアウトになる場合がありました。
スケーラビリティ: この関数は増大する負荷を効率的に処理できず、人気のイベントからの大きなファイルセットをユーザーに提供する能力が制限されていました。
ユーザーエクスペリエンス: ダウンロードの準備に時間がかかると、特にファイル数が多いイベントの場合、ユーザーの満足度に影響を及ぼしていました。

Node.js 実装: 概要

私たちの元の実装では、s3-zip ライブラリを使用して S3 オブジェクトから zip ファイルを作成しました。ファイルの処理方法を簡略化したスニペットを次に示します:

const s3Zip = require("s3-zip");

// ... other code ...

const body = s3Zip.archive(
  { bucket: bucketName },
  eventId,
  files,
  entryData
);

await uploadZipFile(Upload_Bucket, zipfileKey, body);

このアプローチは機能しましたが、zip を作成する前にすべてのファイルがメモリに読み込まれるため、メモリ使用率が高くなり、大きなファイルセットではメモリ不足エラーが発生する可能性がありました。

Go の登場: 革新的なリライト

私たちは、効率性と組み込みの同時実行機能を活用して、Lambda 関数を Go で書き直すことにしました。結果は驚くべきものでした:

メモリ使用量: 同じワークロードで 10 GB からわずか 100 MB に減少しました。
速度: 機能が約10倍高速になりました。
信頼性: 20,000 個のファイルを問題なく正常に処理します。

Go 実装における主要な最適化

1. 効率的な S3 運用

AWS SDK for Go v2 を使用しました。これにより、v1 と比較してパフォーマンスが向上し、メモリ使用量が少なくなります:

cfg, err := config.LoadDefaultConfig(context.TODO())
s3Client = s3.NewFromConfig(cfg)

2. 同時処理

Go のゴルーチンにより、複数のファイルを同時に処理できるようになりました:

var wg sync.WaitGroup sem := make(chan struct{}, 10) // Limit concurrent operations for _, photo := range photos { wg.Add(1) go func(photo Photo) { defer wg.Done() sem

このアプローチにより、同時実行レベルを制御しながら複数のファイルを同時に処理できるようになり、システムに負荷がかかるのを防ぐことができます。

3. ストリーミング ZIP の作成

すべてのファイルをメモリにロードする代わりに、zip コンテンツを S3 に直接ストリーミングします:

pipeReader, pipeWriter := io.Pipe()

go func() {
    zipWriter := zip.NewWriter(pipeWriter)
    // Add files to zip
    zipWriter.Close()
    pipeWriter.Close()
}()

// Upload streaming content to S3
uploader.Upload(ctx, &s3.PutObjectInput{
    Bucket: &destBucket,
    Key:    &zipFileKey,
    Body:   pipeReader,
})

このストリーミングアプローチにより、メモリ使用量が大幅に削減され、より大きなファイルセットを処理できるようになります。

結果

Go への書き直しにより、目覚ましい改善がもたらされました:

メモリ使用量: 99% 削減 (10GB から 100MB に)
処理速度: 約1000%向上
信頼性: 20,000 個のファイルを問題なく処理できます
コスト効率: メモリ使用量の削減と実行時間の短縮により、AWS Lambda のコストが削減されます

学んだ教訓

言語の選択は重要です: Go の効率性と同時実行モデルは、私たちのユースケースに大きな違いをもたらしました。
ボトルネックを理解する: Node.js 関数をプロファイリングすることで、改善すべき重要な領域を特定することができました。
クラウドネイティブソリューションの活用: AWS SDK for Go v2 を使用し、S3 の機能を理解することで、統合とパフォーマンスを向上させることができました。
ストリームで考える: 大規模な操作では、データをすべてメモリにロードするのではなく、ストリームとして処理することが重要です。

結論

Go で Lambda 関数を書き直すことで、当面のスケーリングの問題が解決されただけでなく、ファイル処理のニーズに対してより堅牢で効率的なソリューションも提供されました。最初は Node.js が役に立ちましたが、この経験から、特にリソースを大量に消費するタスクを大規模に処理する場合には、ジョブに適したツールを選択することの重要性が強調されました。

最適な言語またはフレームワークは、特定の使用例によって異なることに注意してください。私たちのシナリオでは、Go のパフォーマンス特性が私たちのニーズと完全に一致し、その結果、ユーザーエクスペリエンスが大幅に向上し、運用コストが削減されました。

サーバーレス機能に関して同様の課題に直面したことがありますか?どのようにしてそれらを克服しましたか？以下のコメント欄であなたの経験についてお聞かせください!

リリースステートメントこの記事は、https：//dev.to/hiteshsisara/from-nodejs-to-go-supercharging-s3-downloads-of-of-of-of-files-as-as-as-a-single-zip-474bに再現されています。

最新のチュートリアルもっと>

PHPを使用してBlob（画像）をMySQLに適切に挿入する方法は？
php mysqlデータベースを持つmysqlデータベースにブロブを挿入すると、mysqlデータベースに画像を保存しようとすると、遭遇するかもしれません問題。このガイドは、画像データを正常に保存するためのソリューションを提供します。 ImageId、image） values（ &...

プログラミング 2025-07-16に投稿されました
AndroidはどのようにPHPサーバーに投稿データを送信しますか？
をAndroid に送信します。これは、サーバー側の通信を扱う際の一般的なシナリオです。 apache httpclient（deprecated） httpclient httpclient = new defulthttpclient（）; httppost httppost ...

プログラミング 2025-07-16に投稿されました
FASTAPIカスタム404ページ作成ガイド
custom 404 Fastapi を備えたPage not inound Page not foundページを作成するには、Fastapiがいくつかのアプローチを提供します。適切な方法は、特定の要件に依存します。 call_next（リクエスト） response.status_c...

プログラミング 2025-07-16に投稿されました
Pythonの理解を使用して辞書を効率的に作成するにはどうすればよいですか？
python辞書の理解 Pythonでは、辞書の概念は新しい辞書を生成するための簡潔な方法を提供します。それらはリストの概念に似ていますが、いくつかの顕著な違いがあります。キーと値を明示的に指定する必要があります。たとえば、 d = {n：n ** 2の範囲（5）} これは、0から4の...

プログラミング 2025-07-16に投稿されました
なぜ画像はまだChromeに境界があるのですか？ `border：none;`無効な解決策
cromeの画像境界を削除する 1つの頻繁な問題は、chromeとie9の画像を操作する際に遭遇する頻繁な問題です。と「国境：なし;」 CSSで。この問題を解決するには、次のアプローチを検討してください。スタイル。これを回避するには、次のCSS IDブロックを使用して、目的のパディング...

プログラミング 2025-07-16に投稿されました
PHPを使用してXMLファイルから属性値を効率的に取得するにはどうすればよいですか？
XMLファイルから属性値をPHP の取得します。提供されている例のような属性を含むXMLファイルを使用する場合： $xml = simplexml_load_file($file); foreach ($xml->Var[0]->attributes() as $att...

プログラミング 2025-07-16に投稿されました
PHPで空の配列を効率的に検出する方法は？
チェックアレイ空虚のphp の空の配列は、さまざまなアプローチを通じてPHPで決定できます。アレイ要素の存在を確認する必要がある場合、PHPのルーズタイピングにより、配列自体の直接評価が可能になります。 //リストは空です。 } if (!$playerlist) { ...

プログラミング 2025-07-16に投稿されました
Appengineでは、エラー「ファイルタイプを推測できない、アプリケーション/Octet-Streamを使用できません...」を解くにはどうすればよいですか？
appengine static file mime mime type override appengineでは、正しいマイムタイプを時々オーバーライドすることができます。 Application/Octet-Stream ... " 問題解決 ]を修正し、...

プログラミング 2025-07-16に投稿されました
匿名のJavaScriptイベントハンドラーをきれいに削除する方法は？
匿名イベントリスナーを削除する]イベントリスナーを追加する要素を追加すると、柔軟性とシンプルさを提供しますが、要素自体を置き換えることなく挑戦をもたらすことができます。 element？ element.addeventlistener（event、function（）{/はここで動作し...

プログラミング 2025-07-16に投稿されました
交換指令を使用して、GO modのモジュールパスの不一致を解決する方法は？
go mod のモジュールパスの不一致を克服するgo modを利用する場合、輸入パッケージと実際の輸入パスの間のパスミスマッチとのパスミスマッチで、第三者パッケージが別のパッケージをインポートする紛争に遭遇する可能性があります。エコーされたメッセージで示されているように、これはGo M...

プログラミング 2025-07-16に投稿されました
JavaScriptオブジェクトのキーをアルファベット順に並べ替える方法は？
javascriptオブジェクトをキーで並べ替える方法JavaScriptオブジェクトがある場合は、読みやすさまたは処理目的の改善のためにそのプロパティをアルファベット順に再編成することができます。これは、次の手順を利用することで実現できます。 const unordered = { ...

プログラミング 2025-07-16に投稿されました
なぜ私の線形勾配の背景にストライプがあるのか、どうすればそれらを修正できますか？
リニアグラデーションからの背景ストライプを追放する背景に線形勾配プロパティを使用する場合、方向が上または下に設定されているときに顕著なストライプに遭遇する場合があります。これらの見苦しいアーティファクトは、複雑なバックグラウンド伝播現象に起因する可能性があります。その後、線形勾配はこの高...

プログラミング 2025-07-16に投稿されました
Pythonのリクエストと偽のユーザーエージェントでWebサイトブロックをバイパスする方法は？
Pythonのリクエストと偽のユーザーエージェントでブラウザの動作をシミュレートする方法これは、Webサイトが実際のブラウザと自動化されたスクリプトを区別するアンチボット測定を実装できるためです。これらのブロックをバイパスするために、開発者はブラウザの動作を模倣してカスタムユーザーエージェ...

プログラミング 2025-07-16に投稿されました
データ挿入時の「一般エラー: 2006 MySQL サーバーが消えました」を修正するにはどうすればよいですか?
レコードの挿入中に「一般エラー: 2006 MySQL サーバーが消えました」を解決する方法はじめに:MySQL データベースにデータを挿入すると、「一般エラー: 2006 MySQL サーバーが消えました。」というエラーが発生することがあります。このエラーは、通常、MySQL 構成内の 2 つの変...

プログラミング 2025-07-16に投稿されました
なぜsqlalchemyフィルター条項で「flake8」はブールの比較にフラグを立てるのですか？
flake8 Flake8 Flake8フラグをフィルター節のブール比較 SQLのブール比較に基づいてクエリ結果をフィルタリングしようとすると、開発者は「==」の使用に関してFLAKE8から警告を発する可能性があります。一般に、「condがfalse」または「condではない場合：」を...

プログラミング 2025-07-16に投稿されました