主要功能
TransBigData工具针对时空大数据处理而开发,依托于GeoPandas。TransBigData集成了交通时空大数据处理过程中常用的方法。包括栅格化、数据质量分析、数据预处理、数据集计、轨迹分析、GIS处理、地图底图加载、坐标与距离计算、数据可视化等通用方法。TransBigData也针对出租车GPS数据、共享单车数据、公交GPS数据等多种常见交通时空大数据提供了快速简洁的处理方法。
技术特点
- 面向交通时空大数据分析不同阶段的处理需求提供不同处理功能。
- 代码简洁、高效、灵活、易用,通过简短的代码即可实现复杂的数据任务。
更多细节请查看:TransBigData的说明文档
安装在安装TransBigData之前,请确保已经安装了可用的geopandas包:GeoPandas 0.10.2+0.g04d377f.dirty — GeoPandas 0.10.2+0.g04d377f.dirty documentation
如果你已经安装了geopandas,则直接在命令提示符中运行下面代码即可安装
pip install -U transbigdata使用
下面例子展示如何使用TransBigData工具快速地从出租车GPS数据中提取出行OD:
#导入TransBigData包
import transbigdata as tbd
#读取数据
import pandas as pd
data = pd.read_csv('TaxiData-Sample.csv',header = None)
data.columns = ['VehicleNum','time','slon','slat','OpenStatus','Speed']
data
使用transbigdata.taxigps_to_od方法,传入对应的列名,即可提取出行OD:
#从GPS数据提取OD oddata = tbd.taxigps_to_od(data,col = ['VehicleNum','time','slon','slat','OpenStatus']) oddata
对提取出的OD进行OD的栅格集计:
#定义研究范围 bounds = [113.6,22.4,114.8,22.9] #输入研究范围边界bounds与栅格宽度accuracy,获取栅格化参数 params = tbd.grid_params(bounds = bounds,accuracy = 1500) #栅格化OD并集计 od_gdf = tbd.odagg_grid(oddata,params) od_gdf.plot(column = 'count')相关链接
- 小旭学长的b站: 同济小旭学长的个人空间_哔哩哔哩_Bilibili
- 小旭学长的七天入门交通时空大数据分析课程(零基础免费课): 立方数据学院
- 小旭学长的交通时空大数据分析课程: 立方数据学院
- 小旭学长的数据可视化课程: 立方数据学院
- 本项目的github页面: GitHub - ni1o1/transbigdata: TransBigData工具针对Python时空大数据处理而开发,集成了交通时空大数据处理过程中常用的方法
- 有bug请在这个页面提交: Issues · ni1o1/transbigdata · GitHub
而如果你想要引用这个包,可以使用如下的 bibtex:
@misc{transbigdata,
author = {Qing Yu},
title = {TransBigData},
year = {2021},
publisher = {GitHub},
journal = {GitHub Repository},
howpublished = {url{https://github.com/ni1o1/transbigdata}},
}


