Pandas 具有自动推断数据类型(包括日期)的功能,简化了从 CSV 文件中检索数据的过程。但是,它有时无法识别特定的日期格式,例如显示为“2013-6-4”的日期格式。
要克服此挑战,请利用'parse_dates' 参数。例如,要将“YYYY-MM-DD”格式的日期指定为“datetime”对象,请执行以下命令:
df = pandas.read_csv('test.dat', parse_dates=['datetime'], delimiter=r"\s ", names=['col1','col2','col3'])
这会将相关列转换为 'datetime' 对象。
对于更复杂的日期格式,请使用日期解析器函数。这些在指定自定义解析逻辑方面提供了更大的灵活性。例如,考虑格式为“YYYY-MM-DD HH:MM:SS”的“日期时间”列:
from datetime import datetime
dateparse = lambda x: datetime.strptime(x, '%Y-%m-%d %H:%M:%S')
df = pd.read_csv(infile, parse_dates=['datetime'], date_parser=dateparse)
您甚至可以将多个与日期相关的列合并到单个“datetime”列中:
dateparse = lambda x: datetime.strptime(x, '%Y-%m-%d %H:%M:%S')
df = pd.read_csv(infile, parse_dates={'datetime': ['date', 'time']}, date_parser=dateparse)
浏览 'strptime' 文档以获取表示各种日期时间格式的指令。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3