python爬蟲之騰訊視頻vip下載！還沒充過VIP！

編程語言 Python HTML 網絡爬蟲騰訊菜鳥帶你學編程 2018-12-06

運行環境

IDE：pycharm

python：3.6.5

實現目的

實現對騰訊視頻目標url的解析與下載，由於第三方vip解析，只提供在線觀看，隱藏想實現對目標視頻的下載

實現思路

首先拿到想要看的騰訊電影url,通過第三方vip視頻解析網站進行解析，通過抓包，模擬瀏覽器發送正常請求，通過拿到緩存ts文件，下載視頻ts文件，最後通過轉換為mp4文件，即可實現正常播放

源碼

import re
import os,shutil
import requests,threading
from urllib.request import urlretrieve
from pyquery import PyQuery as pq
from multiprocessing import Pool
class video_down():
 def __init__(self,url):
 # 拼接全民解析url
 self.api='https://jx.618g.com'
 self.get_url = 'https://jx.618g.com/?url=' + url
 #設置UA模擬瀏覽器訪問
 self.head = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
 #設置多線程數量
 self.thread_num=32
 #當前已經下載的文件數目
 self.i = 0
 # 調用網頁獲取
 html = self.get_page(self.get_url)
 if html:
 # 解析網頁
 self.parse_page(html)
 def get_page(self,get_url):
 try:
 print('正在請求目標網頁....',get_url)
 response=requests.get(get_url,headers=self.head)
 if response.status_code==200:
 #print(response.text)
 print('請求目標網頁完成....\n 準備解析....')
 self.head['referer'] = get_url
 return response.text
 except Exception:
 print('請求目標網頁失敗，請檢查錯誤重試')
 return None
 def parse_page(self,html):
 print('目標信息正在解析........')
 doc=pq(html)
 self.title=doc('head title').text()
 print(self.title)
 url = doc('#player').attr('src')[14:]
 html=self.get_m3u8_1(url).strip()
 #self.url = url + '800k/hls/index.m3u8'
 self.url = url[:-10] +html
 print(self.url)
 print('解析完成，獲取緩存ts文件.........')
 self.get_m3u8_2(self.url)
 def get_m3u8_1(self,url):
 try:
 response=requests.get(url,headers=self.head)
 html=response.text
 print('獲取ts文件成功，準備提取信息')
 return html[-20:]
 except Exception:
 print('緩存文件請求錯誤1，請檢查錯誤')
 def get_m3u8_2(self,url):
 try:
 response=requests.get(url,headers=self.head)
 html=response.text
 print('獲取ts文件成功，準備提取信息')
 self.parse_ts_2(html)
 except Exception:
 print('緩存文件請求錯誤2，請檢查錯誤')
 def parse_ts_2(self,html):
 pattern=re.compile('.*?(.*?).ts')
 self.ts_lists=re.findall(pattern,html)
 print('信息提取完成......\n準備下載...')
 self.pool()
 def pool(self):
 print('經計算需要下載%d個文件' % len(self.ts_lists))
 self.ts_url = self.url[:-10]
 if self.title not in os.listdir():
 os.makedirs(self.title)
 print('正在下載...所需時間較長，請耐心等待..')
 #開啟多進程下載
 pool=Pool(16)
 pool.map(self.save_ts,[ts_list for ts_list in self.ts_lists])
 pool.close()
 pool.join()
 print('下載完成')
 self.ts_to_mp4()
 def ts_to_mp4(self):
 print('ts文件正在進行轉錄mp4......')
 str='copy /b '+self.title+'\*.ts '+self.title+'.mp4'
 os.system(str)
 filename=self.title+'.mp4'
 if os.path.isfile(filename):
 print('轉換完成，祝你觀影愉快')
 shutil.rmtree(self.title)
 def save_ts(self,ts_list):
 try:
 ts_urls = self.ts_url + '{}.ts'.format(ts_list)
 self.i += 1
 print('當前進度%d/%d'%(self.i,len(self.ts_lists)))
 urlretrieve(url=ts_urls, filename=self.title + '/{}.ts'.format(ts_list))
 except Exception:
 print('保存文件出現錯誤')
if __name__ == '__main__':
 #電影目標url：狄仁傑之四大天王
 url='https://v.qq.com/x/cover/r6ri9qkcu66dna8.html'
 #電影碟中諜5：神祕國度
 url1='https://v.qq.com/x/cover/5c58griiqftvq00.html'
 #電視劇鬥破蒼穹
 url2='https://v.qq.com/x/cover/lcpwn26degwm7t3/z0027injhcq.html'
 url3='https://v.qq.com/x/cover/33bfp8mmgakf0gi.html'
 video_down(url2)

視頻緩存ts文件

這裡都是一些緩存視頻文件，每個只有幾秒鐘播放，最後需要合併成一個mp4格式的視頻，就可以正常播放，默認高清下載

注意這裡的進度因為使用多進程下載，進度僅供參考，沒有確切顯示進度，可以進文件夾查看正常進度，可以理解為顯示一次進度，下載一個ts文件

實現效果

私信小編007即可獲取數十套PDF的獲取方式哦！

相關推薦

'華為最新：頂級旗艦沒火，良心機降價千元！系統與騰訊微信之爭？'

"華為Mate 20X：7.2英寸大屏的頂級旗艦沒火！大智能手機都在不斷的追求更高的屏佔比，於是華為推出了一款擁有7.2英寸大屏的旗艦手機Mate 20X，搭配納米工藝的麒麟980處理器，採用了5000毫安時的高密度大電池，擁有比同級別機型更長的續航能力。華為頂級旗艦這款手...

華為Mate 微信華為公司華為手機騰訊智能手機軟件騰訊遊戲騰訊視頻支付寶蘋果公司銀行技術設計騰訊QQ 硬件編譯器網易我的第一部5G手機步步高vivo 京東商城時尚新聞物聯網操作系統淘寶網完美世界網絡技術有限公司金山軟件 2019-09-17

'如何直接下載騰訊愛奇藝優酷的MP4格式視頻？'

"對於國內幾大影視平臺上面的視頻，一般我們直接下載上面的視頻都是加密格式，無法使用其他的播放器進行播放。想要直接獲取MP4格式，卻不是那麼容易。以前小幫也推薦過不少的解析下載工具但都由於形勢嚴峻慢慢都掛掉了。甚至連解密轉換這些加密格式的方法也用過近期小幫發現一款非常老的下載...

MP4 騰訊軟件優酷土豆愛奇藝 2019-09-09

'自學爬蟲分佈式，我需要掌握哪些Python基礎？附贈視頻資料'

"接觸爬蟲已經有一段時間了，常常有人問我：我會點Python，想自學爬蟲，你看用什麼方法好呢？我：我喜歡邊做項目邊學習，爬取過程中遇到問題再百度，擴展xx：我看了網上教材，過程很簡略，最後給了一個編碼，有的我實例一下好像還不成功我：代碼也會“過期”，尤其是爬蟲，需要自己修改...

Python 網絡爬蟲騰訊QQ 2019-09-01

'python爬蟲入門，10分鐘就夠了，這可能是我見過最簡單的基礎教學'

"一、基礎入門1.1什麼是爬蟲爬蟲(spider，又網絡爬蟲)，是指向網站/網絡發起請求，獲取資源後分析並提取有用數據的程序。從技術層面來說就是通過程序模擬瀏覽器請求站點的行為，把站點返回的HTML代碼/JSON數據/二進制數據（圖片、視頻）爬到本地，進而提取自己需要的...

Python 網絡爬蟲瀏覽器 HTML XML 數據庫 JSON CSS 技術 Redis MySQL 2019-08-29

'新一批版號公佈：31款過審，網易《綠茵之巔》、騰訊《長空暗影》等在列 | 熱點'

"編者按：頻繁的好消息國內要聞新一批版號公佈：31款過審，網易《綠茵之巔》、騰訊《長空暗影》等在列繼上週發佈國產網絡遊戲版號後，今日國家新聞出版廣電總局再次發佈2019年8月份國產網絡遊戲審批信息，本次新過審31款遊戲，包括1款頁遊和30款手遊。包括《飛劍問道》、網易《綠茵...

騰訊網易網絡遊戲互動娛樂任天堂 300英雄英偉達 Android 愛奇藝 iOS 索尼 Game Freak 韓國日本 PlayStation 人工智能瑞奇與叮噹技術 2019-08-21

'Python爬蟲實戰：利用scrapy，短短50行代碼下載整站短視頻'

"近日，有朋友向我求助一件小事兒，他在一個短視頻app上看到一個好玩兒的段子，想下載下來，可死活找不到下載的方法。這忙我得幫，少不得就抓包分析了一下這個app，找到了視頻的下載鏈接，幫他解決了這個小問題。因為這個事兒，勾起了我另一個念頭，這不最近一直想把python爬蟲方面...

Scrapy Python 網絡爬蟲技術腳本語言瀏覽器機器學習百度 2019-08-19

'騰訊視頻VIP追《陳情令》需再花錢？！網友：這是欺騙消費者！'

"這個夏天，《陳情令》火了，騰訊視頻的VIP會員也火了。和前者不同的是，VIP會員的火來自於官方的提前點播。“就是騰訊視頻出了一個超前點播直通結局，那VIP的權益還有什麼實際意義？”有網友向記者表示，騰訊視頻的做法傷害了VIP會員的權益，所以自己才會在媒體報料平臺和新浪黑貓...

騰訊視頻騰訊李華沈曉海 2019-08-10

'Python 網絡爬蟲之模擬登陸合集'

"摘要：之前我們爬取的實習僧、糗事百科、網易新聞都是不需要登陸，不需要你去做賬號、Cookies、Session等等，頂多只需要一個 headers （請求頭），但還有一類是需要：你（註冊）賬號登陸才能進行後續的操作。例如：淘寶、知乎、豆瓣之類的需要你登陸的。我們之前又...

Python 網絡爬蟲軟件瀏覽器 Firefox Google 網易知乎豆瓣網網易新聞 2019-08-03

'這遊戲大佬遍地，網易率先動手它緊隨其後，騰訊回過神後已沒位置'

"大佬，作為遊戲中金字塔上層的存在，是無數人憧憬的對象，清潔員作為一個玩家，對大佬這個位置是相當憧憬。不過清潔員和其他人不同，作為一個要立志成為大佬的人，基本上每個遊戲都會努力研究。像魔獸世界，劍網三，逆水寒，這些遊戲，清潔員都努力過，並且都取得了一定的地位（從混子變成不那...

網易騰訊星戰前夜第三人稱射擊遊戲射擊遊戲銀河 2019暴雪打折季地下城與勇士劍網劍網3指尖江湖 MMORPG 2019-08-03

'能免費看全網VIP視頻的手機瀏覽器，可以加擴展腳本，功能超強大'

"上篇文章給大家分享的電腦瀏覽器裡免費觀看vip視頻的方法，這篇文章接著給大家分享一下如何在手機瀏覽器裡免費看VIP視頻的方法。用到的方法其實和我上篇文章裡的方法差不多，也是要加擴展腳本才能夠觀看的。只是，瀏覽器的話要下個米俠瀏覽器。如下圖：1.打開米俠瀏覽器，進入主界面，...

瀏覽器 UC瀏覽器腳本語言騰訊視頻電腦愛奇藝 Flash Chrome 文章騰訊 2019-07-30

'騰訊遊戲不充錢沒法玩？那見識過網易遊戲嗎！'

"現在大家已經意識到了，中國遊戲市場巨頭就這麼幾個，玩來玩去就是他們幾家的遊戲。鵝廠以前風評超低，這兩年打算做口碑，評價有所提高。網易以前評價還行（有水軍的功勞），這兩年急著賺錢，評價急劇下降，水軍顯得非常突兀。大家看到的是“進步的鵝廠、退步的網易”。騰訊氪多少錢，就能看到...

騰訊遊戲網易遊戲網易騰訊運營商逆水寒混江湖 2019-07-29

'面試官：你如果連這幾道Python爬蟲基礎面試題都過不了，就回家吧'

"前言之所以在這裡寫下python爬蟲常見面試題及解答，一是用作筆記，方便日後回憶；二是給自己一個和大家交流的機會，互相學習、進步，希望不正之處大家能給予指正；三是我也是互聯網寒潮下崗的那批人之一，為了找工作而做準備。一、題目部分1、python中常用的數據結構有哪些？請簡...

Python 網絡爬蟲數據結構跳槽那些事兒發現佩奇 2019-07-28

'Python編程學習：這會是你見過講得最清楚的「異步爬蟲指南」'

"前面關於Python編程學習教程中有跟大家提到過異步爬蟲，這幾天想了想，還是得跟大家出一篇詳細的異步爬蟲教程，畢竟一直後臺留言異步爬蟲的夥伴也還不少！有需要的夥伴可得認真閱讀完哦！後期關於異步爬蟲的Python編程學習教程應該不會再像今天這麼詳細了！且看且珍惜哈你們！在執...

Python 網絡爬蟲中央處理器通信跳槽那些事兒讀書 2019-07-19

買了視頻網站VIP才發現，還有VIP專屬廣告？

原標題：免廣告？院線新片？來去自如？視頻網站用戶抱怨買了VIP，卻躲不過“坑”“視頻網站現在動不動就60秒、90秒的片頭廣告，網站提醒VIP可以免廣告，...

優酷土豆愛奇藝騰訊騰訊視頻驚奇隊長電視劇讀書 2019-07-14

騰訊短視頻之殤：30秒，能不能讓微視得到救贖

今年4月，成立於1998年的騰訊，在21歲這一年，總市值再度超越阿里巴巴，重返亞洲第一大市值的寶座。原本該是普天同慶的事，可是這位大佬卻仍然感到很焦慮，焦...

微視騰訊火山小視頻今日頭條騰訊QQ 騰訊視頻移動互聯網愛奇藝新聞 QQ空間亞洲音樂阿里巴巴集團創作者來直播 4月吃什麼 2019-07-05

來這裡免費看vip視頻

福利介紹今天童年說資源網繼續給大家推送福利！現在看vip付費視頻越來越麻煩了，騰訊，愛奇藝，土豆，樂視等等都要會員，有的甚至含有廣告等等！那麼有沒有什麼特...

周潤發劉德華周星馳百度騰訊愛奇藝成龍樂視網頭條女神搜狗 2019-07-04

古裝歷史大劇《大秦帝國之天下》定檔騰訊視頻網絡獨播

延藝執導，張魯一、段奕宏、李乃文、朱珠、辛柏青、鄔君梅、尤勇、李洪濤、王慶祥等出演的古裝歷史大劇《大秦帝國之天下》昨日曝先導預告。並官宣定檔...

大秦帝國騰訊視頻李乃文張魯一歷史鄔君梅李洪濤騰訊王翦秦始皇段奕宏王慶祥辛柏青朱珠尤勇呂不韋李斯 2019-06-15

《大秦帝國之天下》古裝歷史傳奇劇，騰訊視頻網絡獨播

古裝歷史傳奇劇《大秦帝國之天下》即將登陸騰訊視頻網絡獨播；（具體播出時間以官宣為準）張魯一、李乃文亮相騰訊官宣日！該劇由延藝執導，張魯一、段奕宏、李乃文、...

李乃文張魯一騰訊視頻秦昭襄王歷史騰訊秦孝文王朱珠段奕宏春秋戰國 2019-06-14

童年說資源網福利之vip視頻解析網站

怎麼說呢，現在看vip視頻越來越麻煩了，騰訊，愛奇藝等等都要會員，有的甚至含有廣告等等！那麼有沒有什麼特別好的網站可以讓我們免費觀看視頻呢?這裡給大家推薦...

騰訊愛奇藝 2019-06-13

Python爬蟲：scrapy之Cookie和Session

關於cookie和session估計很多程序員面試的時候都會被問到，這兩個概念在寫web以及爬蟲中都會涉及，並且兩者可能很多人直接回答也不好說的特別清楚，...

Python 網絡爬蟲 Scrapy 瀏覽器程序員網景文章 2019-06-10

推薦中...