- 生成一段时间范围:
pd.data_range(start=None, end=None,periods=None,freq=“D”)
start和end以及freq配合生成start和end范围内以freq为频率的一组时间索引;
start和periods以及freq配合能够生成从start开始的频率为freqdeperiods个时间索引;
如:
import pandas as pd t1 = pd.date_range(start="20171230",end="20180131",freq="D") print(t1) t2 = pd.date_range(start="20171230",end="20180131",freq="10D") print(t2) t3 = pd.date_range(start="20171230",periods=10,freq="D") print(t3) t4 = pd.date_range(start="20171230",end="20180131",freq="M") print(t4)
- 在Dataframe中使用时间序列
例如:
index=pd.data_range(“20170101”,periods=10)
df = pd.Dataframe(np.random.rand(10),index=index)
利用pandas提供的方法可以把时间字符串转化成时间序列:
地方[“timeStamp”] = pd.to_datatime([“timeStamp”],format="")
format参数大部分情况下可以不用写,但是对于pandas无法格式化的时间字符串,可以使用format参数
- pandas重采样:
重采样:指的是将时间序列从一个频率转化为另一个频率进行处理的过程,将高频数据转化为低频数据为降采样,低频率转化为高频率为升采样。
pandas提供resample方法来帮助实现数据频率的转化。
例如:t.resample(“M”).mean()
t.resample(“10D”).count()
4.PeriodIndex
DatetimeIndex可以理解为时间戳;
PeriodIndex可以理解为时间段;
periods = pd.PeriodIndex(year=data[“year”],month=data[“month”],day=data[“day”],hour=data[“hour”],freq=“H”)
对该时间段进行降采样:
data = df.set_index(periods).resample(“10D”).mean()



