我认为
文档中仅缺少一个(也许是因为它在某些时候被解释为转义标记?)毕竟是正则表达式:In [68]: data = read_table('sample.txt', skiprows=3, header=None, sep=r"s*")In [69]: dataOut[69]: <class 'pandas.core.frame.Dataframe'>Int64Index: 7 entries, 0 to 6Data columns:X.1 7 non-null valuesX.2 7 non-null valuesX.3 7 non-null valuesX.4 7 non-null valuesX.5 7 non-null valuesX.6 7 non-null values[...]X.23 7 non-null valuesX.24 7 non-null valuesX.25 5 non-null valuesX.26 3 non-null valuesdtypes: float64(8), int64(10), object(8)由于@MRAB指出了定界符问题,因此最后几列存在一些问题:
In [73]: data.ix[:,20:]Out[73]: X.21 X.22X.23 X.24 X.25 X.260 315 0.95 ABC transporter transmembrane region1 527 0.93 ABC transporter None None2 408 0.86 RecF/RecN/SMCN terminal domain3 575 0.85 RecF/RecN/SMCN terminal domain4 556 0.72 AAA ATPase domain None5 275 0.85 YceG-like family None None6 200 0.85 Pyridine nucleotide-disulphide oxidoreductase None
但这可以在最后修复。



