「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > 文字列は何バイトを占めるか: Java エンコーディングとバイト使用量を調べる?

文字列は何バイトを占めるか: Java エンコーディングとバイト使用量を調べる?

2025 年 1 月 22 日に公開
ブラウズ:678

How Many Bytes Does a String Occupy: A Look at Java Encoding and Byte Usage?

文字列エンコーディングにおけるバイト使用量

Java で文字列内のバイト数を計算するには、使用されているエンコーディング方法を考慮する必要があります。文字列は文字のシーケンスであり、文字列を表すために必要なバイト数は、文字列をバイトに変換するために使用されるエンコード スキームによって異なります。

バイト数の決定

取得するには文字列のサイズをバイト単位で取得し、getBytes() メソッドを使用してバイト配列に変換し、配列を検査します。サイズ:

String string = "Hello World";
byte[] utf8Bytes = string.getBytes("UTF-8");
int byteCount = utf8Bytes.length;

エンコーディングに関する考慮事項

エンコーディング スキームはバイト数に影響します。同じ文字列に異なるエンコーディングが適用される例を次に示します。

byte[] utf8Bytes = string.getBytes("UTF-8");  // Each char as 1 byte
byte[] utf16Bytes = string.getBytes("UTF-16"); // Each char as 2 bytes
byte[] utf32Bytes = string.getBytes("UTF-32"); // Each char as 4 bytes
byte[] isoBytes = string.getBytes("ISO-8859-1");  // Each ASCII char as 1 byte
byte[] winBytes = string.getBytes("CP1252");   // Each ASCII char as 1 byte

特殊文字とマルチバイト エンコーディング

ASCII 文字列であっても、エンコーディングに応じてバイト数が異なる場合があります。たとえば、UTF-8 では、一部の文字に複数バイトが必要な場合があります。

String interesting = "\uF93D\uF936\uF949\uF942"; // Chinese ideograms
byte[] utf8Bytes = interesting.getBytes("UTF-8");  // Each char as 3 bytes

デフォルトのエンコーディングと明示的な仕様

エンコーディング引数が指定されていない場合は、プラットフォームのデフォルトの文字セットが使用されます。予期しない結果を避けるために、目的の文字セットを常に明示的に指定することをお勧めします。

最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3