Pandas は、日付を含むデータ型を自動的に推測する機能により、CSV ファイルからのデータ取得を簡素化します。ただし、「2013-6-4」などの特定の日付形式を認識できないことがあります。
この課題を克服するには、 「parse_dates」引数。たとえば、「YYYY-MM-DD」形式の日付を持つ列を「datetime」オブジェクトとして指定するには、次のコマンドを実行します。
df = pandas.read_csv('test.dat', parse_dates=['datetime'], delimiter=r"\s ", names=['col1','col2','col3'])
これにより、関連する列が「datetime」オブジェクトに変換されます。
より複雑な日付形式の場合は、日付パーサー関数を使用します。これらにより、カスタム解析ロジックをより柔軟に指定できるようになります。たとえば、「YYYY-MM-DD HH:MM:SS」:
from datetime import datetime
dateparse = lambda x: datetime.strptime(x, '%Y-%m-%d %H:%M:%S')
df = pd.read_csv(infile, parse_dates=['datetime'], date_parser=dateparse)
複数の日付関連の列を 1 つの 'datetime' 列にマージすることもできます:
dateparse = lambda x: datetime.strptime(x, '%Y-%m-%d %H:%M:%S')
df = pd.read_csv(infile, parse_dates={'datetime': ['date', 'time']}, date_parser=dateparse)
さまざまな日時形式を表すディレクティブについては、「strptime」のドキュメントを参照してください。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3