「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > Pandas を使用して CSV ファイル内のカスタム日付形式を解析する方法

Pandas を使用して CSV ファイル内のカスタム日付形式を解析する方法

2024 年 11 月 3 日に公開
ブラウズ:841

How to Parse Custom Date Formats in CSV Files Using Pandas?

Pandas は CSV ファイルの日付解析を自動化します

Pandas は、日付を含むデータ型を自動的に推測する機能により、CSV ファイルからのデータ取得を簡素化します。ただし、「2013-6-4」などの特定の日付形式を認識できないことがあります。

解決策: 'parse_dates' 引数を指定します

この課題を克服するには、 「parse_dates」引数。たとえば、「YYYY-MM-DD」形式の日付を持つ列を「datetime」オブジェクトとして指定するには、次のコマンドを実行します。

df = pandas.read_csv('test.dat', parse_dates=['datetime'], delimiter=r"\s ", names=['col1','col2','col3'])

これにより、関連する列が「datetime」オブジェクトに変換されます。

高度なカスタマイズ: 日付パーサー関数

より複雑な日付形式の場合は、日付パーサー関数を使用します。これらにより、カスタム解析ロジックをより柔軟に指定できるようになります。たとえば、「YYYY-MM-DD HH:MM:SS」:

from datetime import datetime
dateparse = lambda x: datetime.strptime(x, '%Y-%m-%d %H:%M:%S')
df = pd.read_csv(infile, parse_dates=['datetime'], date_parser=dateparse)

複数の日付関連の列を 1 つの 'datetime' 列にマージすることもできます:

dateparse = lambda x: datetime.strptime(x, '%Y-%m-%d %H:%M:%S')
df = pd.read_csv(infile, parse_dates={'datetime': ['date', 'time']}, date_parser=dateparse)

さまざまな日時形式を表すディレクティブについては、「strptime」のドキュメントを参照してください。

リリースステートメント この記事は次の場所に転載されています: 1729206855 権利侵害がある場合は、[email protected] に連絡して削除してください。
最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3