栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python爬取体彩排列3历史数据并验证其纯随机性

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python爬取体彩排列3历史数据并验证其纯随机性

摘要:本文目的为验证体彩排列3的纯随机性。从网站上爬取一千二百多条历史开奖数据。将三个数字依次作为百位十位个位,以这些数据看作时间序列,然后利用时间序列分析白噪声检验其纯随机性,结果从大方向看体彩排列3开奖号确实是纯随机的。
主要步骤:
一、编写爬虫爬取数据并处理储存。
二、绘制时序图、自相关图等。
三、进行白噪声检验。

第一步:爬取数据
代码如下:

import requests
import bs4
import pandas as pd
import matplotlib.pyplot as plt
from pandas.plotting import autocorrelation_plot
from statsmodels.sandbox.stats.diagnostic import acorr_ljungbox
url='http://datachart.500.com/pls/history/inc/history.php?limit=1284&start=20000&end=21284'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.81 Safari/537.36'}
r=requests.get(url=url,headers=headers)
# 改变格式,把文本版的数据赋值给另一个变量
r.encoding='gbk'
T_W=r.text
# 创建bs4对象
bs1=bs4.BeautifulSoup(T_W,'html.parser')
k=0
Z=[]
for j in bs1.find_all('td',class_='cfont2'):
    txt=j.text
    txt=txt.replace(" ","")
    k=k+1
    Z.append(int(txt))
Z=Z[::-1]
K=range(k)
PD_S=pd.Dataframe(Z,columns=['开奖'])
PD_S1=pd.Dataframe(K,columns=['序号'])
PD_S=PD_S1.join(PD_S)

第二步:绘制时序图、自相关图等。

# 绘制时序图
fig1= plt.figure(1)
plt.plot(range(len(Z)),Z, color='blue', linewidth=2)
plt.grid()
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.title('开奖号')
plt.xlabel("时间")
plt.ylabel("号码")
ax4= plt.gca()
plt.show()

# 绘制自相关图
fig2= plt.figure(2)
autocorrelation_plot(Z)
plt.title('开奖号码自相关图')
plt.show()
qljungbox, pval=acorr_ljungbox(Z,boxpierce=False)

第三步:进行白噪声检验

fig3= plt.figure(3)
plt.plot(range(len(qljungbox)),qljungbox, color='blue', linewidth=2)
plt.title('LB值')
plt.show()

fig4= plt.figure(4)
plt.plot(range(len(pval)),pval, color='blue', linewidth=2)
plt.title('P值')
plt.show()

qljungbox6, pval6=acorr_ljungbox(Z,lags=6,boxpierce=False)
print('延期为6时P值')
print(pval6[5])

qljungbox12, pval12=acorr_ljungbox(Z,lags=12,boxpierce=False)
print('延期为12时P值')
print(pval12[11])

qljungbox18, pval18=acorr_ljungbox(Z,lags=18,boxpierce=False)
print('延期为18时P值')
print(pval18[17])

qljungbox24, pval24=acorr_ljungbox(Z,lags=24,boxpierce=False)
print('延期为24时P值')
print(pval24[23])


从P值图上可以看出,P值显然大于0.05,故接受原假设(序列非纯随机)。
当然这只是很片面的得出的结论,也是从大方向看的结果,那么如果就短时间来说,彩票有无规律可循呢?

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/349823.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号