栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python爬取FLASH播放器中的资料

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python爬取FLASH播放器中的资料

Python爬取FLASH播放器中的资料。一、首先了解一下AMF协议:

AMF(Action Message Format)是Flash与服务端通信的一种常见的二进制编码模式,其传输效率高,可以在HTTP层面上传输。现在很多Flash WebGame都采用这样的消息格式。
AMF协议是基于Http协议的.
它的内容处理过程大致是这样:
1.从客户端获取Http请求(Request)流.
2.对流进行解串行化(Deserialize),得到服务器端程序能够识别的数据,并建立一个响应(Response)消息
3.Debug开始
4.对流进行各种处理(记录、许可、服务)得到返回值
5.对响应流进行串行化
6.发送Http响应给客户端

二、Python与amf进行互通需要用到PyAMF

1、下载pyamf
https://pypi.python.org/pypi/PyAMF
2、安装pyamf
下载完成之后解压出来,打开DOS命令进入pyamf目录,
执行下列命令,安装pyamf框架
python setup.py install --disable-ext

三、获取关键字节伪造访问

首先使用charles抓包工具,抓取AMF包,得到请求/应答的AMF数据,对AMF格式的请求和响应的数据进行分析。
解密的POST DATA如下图所示:



构建flex.messaging.messages.RemotingMessage信息

msg= messaging.RemotiongMessage(messageId=str(uuid.uuid1()).upper(),
    clometOd=None,
    operation='playeSource',
    destination='metaDataService',
    timeTolive=0,
    timestamp=0
    )
msg.body=['xxx', 'aaaaa', 'ccccc','ddddd', '', 'eeeee', '']
msg.headers['DSEndpoint']='my-amf'msg.headers['DSId']=str(uuid.uuid1()).upper()
......

得到的Response如下图:


四、具体实现代码如下:
import urllib2import uuidimport pyamffrom pyamf import remotingfrom pyamf.flex import messaging# 构造flex.messaging.messages.RemotingMessage消息msg= messaging.RemotiongMessage(messageId=str(uuid.uuid1()).upper(),
    clometOd=None,
    operation='playeSource',
    destination='metaDataService',
    timeTolive=0,
    timestamp=0
    )
msg.body = ['xxx', 'aaaaa', 'ccccc','ddddd', '', 'eeeee', '']
msg.headers['DSEndpoint'] = 'my-amf'msg.headers['DSId'] = str(uuid.uuid1()).upper()# 按AMF协议编码req = remoting.Request('null', body=(msg,))
env = remoting.Envelope(amfVersion=pyamf.AMF3)
env.bodies = [('/1',req)]
data = bytes(remoting.encode(env).read())# 提交请求url = 'http://xxxx.xx.xx/amf'req = urllib2.Request(url,data,headers={'Content-Type':'application/x-amf'})# 解析返回数据oepner = urllib2.build_opener()# 解码AMF协议返回的数据resp = remoting.decode(opener.open(req).read())print resp.bodies[0][1].body.body['xxxx']
......

                      

作者:迷途老鹰
链接:https://www.jianshu.com/p/0f3009021fd9


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/221702.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号