女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何利用Python抓取用戶發的話題

馬哥Linux運維 ? 來源:腳本之家 ? 作者:j_hao104 ? 2021-09-05 09:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大多數APP里面返回的是json格式數據,或者一堆加密過的數據 。這里以超級課程表APP為例,抓取超級課程表里用戶發的話題。

1、抓取APP數據包

表單:

表單中包括了用戶名和密碼,當然都是加密過了的,還有一個設備信息,直接post過去就是。

另外必須加header,一開始我沒有加header得到的是登錄錯誤,所以要帶上header信息。

2、登錄

登錄代碼:

import urllib2from cookielib import CookieJarloginUrl = ‘http://120.55.151.61/V2/StudentSkip/loginCheckV4.action’headers = {‘Content-Type’: ‘application/x-www-form-urlencoded; charset=UTF-8’,

‘User-Agent’: ‘Dalvik/1.6.0 (Linux; U; Android 4.1.1; M040 Build/JRO03H)’,‘Host’: ‘120.55.151.61’,‘Connection’: ‘Keep-Alive’,‘Accept-Encoding’: ‘gzip’,‘Content-Length’: ‘207’,}loginData =

‘phoneBrand=Meizu&platform=1&deviceCode=868033014919494&account=FCF030E1F2F6341C1C93BE5BBC422A3D&phoneVersion=16&password=A55B48BB75C79200379D82A18C5F47D6&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&’cookieJar = CookieJar()opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieJar))req = urllib2.Request(loginUrl, loginData, headers)loginResult = opener.open(req).read()print loginResult

登錄成功 會返回一串賬號信息的json數據

和抓包時返回數據一樣,證明登錄成功

3、抓取數據

用同樣方法得到話題的url和post參數

下見最終代碼,有主頁獲取和下拉加載更新。可以無限加載話題內容。

#!/usr/local/bin/python2.7# -*- coding: utf8 -*-“”“超級課程表話題抓取”“”import urllib2from cookielib import CookieJarimport json‘’‘ 讀Json數據 ’‘’def fetch_data(json_data):

data = json_data[‘data’]timestampLong = data[‘timestampLong’]messageBO = data[‘messageBOs’]topicList = []for each in messageBO:topicDict = {}if each.get(‘content’, False):

topicDict[‘content’] = each[‘content’]topicDict[‘schoolName’] = each[‘schoolName’]topicDict[‘messageId’] = each[‘messageId’]topicDict[‘gender’] = each[‘studentBO’][‘gender’]topicDict[‘time’] = each[‘issueTime’]print each[‘schoolName’],

each[‘content’]topicList.append(topicDict)return timestampLong, topicList‘’‘ 加載更多 ’‘’

def load(timestamp, headers, url):headers[‘Content-Length’] = ‘159’loadData = ‘timestamp=%s&phoneBrand=Meizu&platform=1&genderType=-1&topicId=19&phoneVersion=16&selectType=3&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&’ % timestampreq = urllib2.Request(url, loadData, headers)loadResult = opener.open(req)

.read()loginStatus = json.loads(loadResult).get(‘status’, False)if loginStatus == 1:print ‘load successful!’timestamp, topicList = fetch_data(json.loads(loadResult))load(timestamp, headers, url)else:print ‘load fail’print loadResultreturn FalseloginUrl =

‘http://120.55.151.61/V2/StudentSkip/loginCheckV4.action’topicUrl =

‘http://120.55.151.61/V2/Treehole/Message/getMessageByTopicIdV3.action’headers = {‘Content-Type’: ‘application/x-www-form-urlencoded; charset=UTF-8’,‘User-Agent’: ‘Dalvik/1.6.0 (Linux; U; Android 4.1.1; M040 Build/JRO03H)’,‘Host’: ‘120.55.151.61’,‘Connection’: ‘Keep-Alive’,‘Accept-Encoding’: ‘gzip’,‘Content-Length’: ‘207’,}

‘’‘ ---登錄部分--- ’‘’loginData = ‘phoneBrand=Meizu&platform=1&deviceCode=868033014919494&account=FCF030E1F2F6341C1C93BE5BBC422A3D&phoneVersion=16&password=A55B48BB75C79200379D82A18C5F47D6&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&’cookieJar = CookieJar()opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieJar))req = urllib2.Request(loginUrl, loginData, headers)loginResult = opener.open(req).read()loginStatus = json.loads(loginResult).get(‘data’, False)if loginResult:print ‘login successful!’else:print ‘login fail’print loginResult‘’‘ ---獲取話題--- ’‘’topicData =

‘timestamp=0&phoneBrand=Meizu&platform=1&genderType=-1&topicId=19&phoneVersion=16&selectType=3&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&’headers[‘Content-Length’] = ‘147’topicRequest = urllib2.Request(topicUrl, topicData, headers)topicHtml = opener.open(topicRequest).read()topicJson = json.loads(topicHtml)topicStatus = topicJson.get(‘status’, False)print topicJsonif topicStatus == 1:print ‘fetch topic success!’timestamp, topicList = fetch_data(topicJson)load(timestamp, headers, topicUrl)

結果:

562957e4-0dd5-11ec-8fb8-12bb97331649.jpg

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7257

    瀏覽量

    91941
  • APP
    APP
    +關注

    關注

    33

    文章

    1587

    瀏覽量

    74310
  • python
    +關注

    關注

    56

    文章

    4827

    瀏覽量

    86830

原文標題:利用Python爬蟲抓取手機APP的傳輸數據

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    拼多多電商 API 接口與競品,數據抓取速度大較量

    在當今電商行業,數據抓取速度是衡量平臺競爭力的核心指標之一。高效的 API(應用程序接口)能顯著提升數據分析、庫存管理和用戶個性化推薦的效率。本文將深入比較拼多多電商 API 接口與主要競品(如淘寶
    的頭像 發表于 07-09 15:29 ?177次閱讀

    Allegro Skill布局功能之遠程抓取器件介紹

    過使用“遠程抓取器件”功能,用戶可以批量選取多個器件,隨后通過鼠標左鍵逐個點擊放置,實現高效精準的器件布局。該功能特別適用于在大規模芯片周邊配置去耦電容、電阻等元件,能夠快速將元件定位到目標焊盤附近或芯片背面。
    的頭像 發表于 05-08 10:34 ?548次閱讀
    Allegro Skill布局功能之遠程<b class='flag-5'>抓取</b>器件介紹

    如何獲取用于開發fx2的sdk和示例源代碼?

    大家好 我正在使用 FX2 設備,以前也使用過 FX3 設備。 使用 FX3 設備 SDK,當我下載它時,我在安裝文件夾中獲得了許多示例源代碼,但是它沒有 FX2 的示例源代碼,我如何獲取用于開發 fx2 的 sdk 和示例源代碼?
    發表于 05-07 07:25

    復合機器人抓取精度的影響因素及提升策略

    復合機器人結合了移動機器人(如AGV)和機械臂的功能,廣泛應用于物流、制造等領域。抓取精度是其核心性能指標之一,直接影響作業效率和產品質量。本文將探討復合機器人抓取精度的影響因素及提升策略。
    的頭像 發表于 04-12 11:15 ?346次閱讀

    python入門圣經-高清電子書(建議下載)

    和Pygal 等強大的Python 庫和工具介紹,以及列表、字典、if 語句、類、文件與異常、代碼測試等內容; 第二部分將理論付諸實踐,講解如何開發三個項目,包括簡單的Python 2D 游戲開發如何利用數據
    發表于 04-10 16:53

    鴻蒙應用元服務開發-Account Kit獲取華為賬號用戶信息概述

    詳細接入體驗可參考Account Kit提供的SampleCode示例工程。 典型場景: 1、元服務需要完善用戶頭像信息,參見獲取頭像。 2、元服務提供的服務依賴用戶手機號,需要獲取用戶手機號,參見獲取
    發表于 04-02 11:10

    2025年電子行業值得關注的話題

    《What's Next》是安富利推出的全新數字讀物,面向任何想要了解電子行業未來發展趨勢的用戶,安富利憑借在全球市場的深厚積淀與廣泛影響力,為您精選最具前瞻性的議題,呈現精準的市場趨勢、深刻的技術洞察。
    的頭像 發表于 02-18 17:36 ?919次閱讀

    把YOLOv11和Python Qt做個用戶界面程序

    早些時間,小編想把PID控制器優化部分通過Py Qt來實現用戶界面化,不過看著窗口一堆參數,有點發怵:這玩意誰用啊? 參考《PID控制器參數自動優化示例和比較》 后來就擱置了。 在通過Python
    的頭像 發表于 11-28 10:18 ?1619次閱讀
    把YOLOv11和<b class='flag-5'>Python</b> Qt做個<b class='flag-5'>用戶</b>界面程序

    Python庫解析:通過庫實現代理請求與數據抓取

    Python中,有多個庫可以幫助你實現代理請求和數據抓取。這些庫提供了豐富的功能和靈活的API,使得你可以輕松地發送HTTP請求、處理響應、解析HTML/XML/JSON數據,以及進行復雜的網絡操作。
    的頭像 發表于 10-24 07:54 ?491次閱讀

    如何利用海外爬蟲IP進行數據抓取

    利用海外爬蟲IP進行數據抓取需要綜合考慮多個方面。
    的頭像 發表于 10-12 07:54 ?607次閱讀

    如何利用python和API查詢IP地址?

    Python中,直接查詢IP地址的地理位置或詳細信息(如所屬國家、城市等)通常需要依賴外部API服務,因為Python標準庫本身不提供直接查詢IP地址地理位置的功能。以下是一個使用requests
    發表于 08-28 11:55

    第二屆大會回顧第25期 | OpenHarmony上的Python設備應用開發

    Python以其簡單、易學和功能強大而聞名,有著廣泛的用戶群體。采用Python開發有助于降低OpenHarmony的學習門檻。如何在OpenHarmony上用Python開發設備應用
    的頭像 發表于 08-27 11:53 ?1232次閱讀
    第二屆大會回顧第25期 | OpenHarmony上的<b class='flag-5'>Python</b>設備應用開發

    利用Python腳本登錄到交換機并創建VLAN

    本文將詳細介紹如何利用Python腳本登錄到交換機并創建VLAN。
    的頭像 發表于 08-12 17:59 ?980次閱讀

    pytorch和python的關系是什么

    在當今的人工智能領域,Python已經成為了最受歡迎的編程語言之一。Python的易學易用、豐富的庫和框架以及強大的社區支持,使其成為了數據科學、機器學習和深度學習等領域的首選語言。而在深度學習領域
    的頭像 發表于 08-01 15:27 ?3293次閱讀

    如何長時間抓取DTU設備實時日志?

    如何長時間抓取DTU設備實時日志?
    發表于 07-26 06:31