- numpy能够帮助我们处理数值,但是pandas除了处理数值之外(基于numpy),还能够帮助我们处理其他类型的数据python源码安装pandas python 在pypi 创建数组pd.Series[1,2,31,12,34]
Seires带标签的数组一维 dataframe二维series
t=pd.Series([1,23,2,2,1,]),index=list("abcde")
temp_dict={"name":"xiaohong","age",
通过一个列表,一个字典创建一个series
索引,t3=["tel"]构成series一部分是键一部分是值pandas series wherepandas读取数据,csv文件(库的学习from pymongo import MongoClientcilent=MongoClient()
collection=client
# coding=utf-8
from pymongo import MongoClient
import pandas as pd
client = MongoClient()
collection = client["douban"]["tv1"]
data = collection.find()
data_list = []
for i in data:
temp = {}
temp["info"]= i["info"]
temp["rating_count"] = i["rating"]["count"]
temp["rating_value"] = i["rating"]["value"]
temp["title"] = i["title"]
temp["country"] = i["tv_category"]
temp["directors"] = i["directors"]
temp["actors"] = i['actors']
data_list.append(temp)
# t1 = data[0]
# t1 = pd.Series(t1)
# print(t1)
df = pd.Dataframe(data_list)
# print(df)
#显示头几行
print(df.head(1))
# print("*"*100)
# print(df.tail(2))
#展示df的概览
# print(df.info())
# print(df.describe())
print(df["info"].str.split("/").tolist())
pandas之dataframe
创建Dataframe
pd.Dataframe(np,arange(12),reshape(3,4))
竖着为coloms行为Index:一轴和零轴
添加行列索引
pd.Dataframe(np,arange(12),reshape(3,4),index=list("abc"),columns=list("WXYZ")
Dataframe(和Series)区别
取有用信息,显示前几行df.head() 后几行 df.tail() 展示dataframe概览 df.info() int类型和float类型 df.desicribe()
遍历collection.find() #取自己想要数据
dataframe索引内容
df.sorted_values(,ascending=False)
#方括号写数字,表示去行,对行进行操作。写字符串,表示去列索引,队列操作。
例:print(df[:20])
print(df["Row_labels"])
通过标签索引行数据df.loc
通过位置获取行数据df.iloc
pandas布尔索引
df[df['Count_AnimalNam']>800] #选择具体某一列
若多个条件使用&符合



