「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > Spark DataFrameに一定のシーケンスを追加する方法は?

Spark DataFrameに一定のシーケンスを追加する方法は?

2025-04-17に投稿されました
ブラウズ:586

How to Add Constant Columns in Spark DataFrames?

スパークデータフレーム

に一定の列を追加するスパークに、各行の特定の値を持つ特定の値を持つ定数列をデータフレームに追加することができます。値、dataFrame.withcolumnの2番目の引数として使用できる値は、pyspark.sql.functionsのインポートlitの

から定数列を追加します df.withcolumn( 'new_column'、lit(10))

については、より複雑な列について、配列、マップ、構造体などの関数を使用して、pyspark.sql.functionsの輸入アレイ、マップ、構造の輸入アレイからの

[] [
from pyspark.sql.functions import lit

df.withColumn('new_column', lit(10))

typedlit(spark 2.2)

from pyspark.sql.functions import array, map, struct

df.withColumn("some_array", array(lit(1), lit(2), lit(3)))
df.withColumn("some_map", map(lit("key1"), lit(1), lit("key2"), lit(2)))
Import org.apache.spark.sql.functions.typedlit df.withcolumn( "some_array"、typedlit(seq(1、2、3))) df.withcolumn( "some_struct"、typedlit(( "foo"、1、0.3)))

を使用してリテラル値を使用する代わりに、ユーザー定義関数(udf)を作成するユーザー定義関数(UDF)を作成することができます。 pyspark.sql.functionsインポートudf、lit def add_ten(row): 10を返します add_ten_udf = udf(add_ten、integertype()) df.withcolumn( 'new_column'、add_ten_udf(lit(1.0))))))
最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3