世界速讯:爸爸偷偷看的小姐姐视频,Python自动下载,一次看个够吧!
小朋友们好,大朋友们好!
(相关资料图)
好久不见了,猫妹很想念大家。
怎么样,大家春节过得快乐吗?
有没有放鞭炮啊?
放鞭炮,那叫一个刺激,那叫一个痛快,那叫一个放松!
有鞭炮才叫过年咧!
玩烟花爆竹一定要在大人的看护下进行,在高兴之余将风险降到最低,安全最重要。
有没有收到很多压岁钱?
这都是长辈对咱们的关爱,一定要对长辈好一些啊!
虽然是春节,猫妹我觉得猫爸也是手机不离手,有空就偷偷刷小视频看。
到底看什么呢?
搞得这么神秘!
有一次,被我以迅雷不及掩耳之势,将脑袋凑了过去,原来是一些漂亮小姐姐的视频。
Python有很多应用领域,比如科学计算、人工智能、爬虫等。
今天,咱们就简单了解下Python在爬虫领域的强势地位。
爬虫初体验:牛
如果没有安装requests库,先用pip install指令安装下requests库。
我们用这个库来下载视频。
建立一个video文件夹,用于存放下载的视频。
在video建立一个py文件,并将下面内容拷贝到该py文件中:
import requestsdef fire(page): url = "https://api-tinyvideo-web.yy.com/home/tinyvideosv2" headers = { "user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36"} for _ in range(page): response = requests.get(url=url, headers=headers) data = response.json() data_list = data["data"]["data"] for d in data_list: video_url = d["resurl"] video_title = str(d["yyNum"]) + ".mp4" video_content = requests.get(url=video_url, headers=headers).content with open("video\\" + video_title, mode="wb") as f: f.write(video_content) print("保存完成:", video_title)if __name__ == "__main__": fire(5) print("完成")
下载日志:
下载到的视频:
尝试播放一个文件试下:
什么是爬虫
在计算机领域上的爬虫,通常是指网络爬虫,英文名Spider(网络蜘蛛)。
通过互联网上一个个的网络节点,进行数据的提取、整合以及存储,从而获取我们想要的部分。
我们所处的计算机网络,如果可以上网,很多信息都可以获取得到,当然也可以查看和下载,用计算机将这些资源自动分析和下载下来,就是爬虫。
举个简单的例子,就像春节放的鞭炮。
包装上写着多少响,就代表有多少个小炮,比如10000响表示一共10000个小炮,它们通过导火索连接了起来。
如果这10000个小炮没有连起来,我们可以一个一个放。
一个一个放,如果10000个,要放到什么时候?
有了导火索,这10000个小炮就可以自动依次放了。
就像爬虫,如果不用爬虫技术,我们当然可以手动下载上面的小姐姐视频,但每次下一个,下得都没有看得快。
有了爬虫呢,分析了其中的关系,用代码模拟了手动访问网站的功能,并模拟了手动下载过程。
这样一来,分分钟给你下载很多视频,保证比你看得快。
手动下载
我们先看下不用爬虫技术,怎么下载视频的。
首先,有个保存了小姐姐视频信息的网站,这个可以通过多种途径获得,就像咱上面用到的这个网站。
咱们直接打开这个网站,可以看到如下信息:
这里面密密麻麻很多信息,视频的地址就在这里面。
刷下这个网站,这里面的数据会变化,也就是会有不同的视频地址。
下面的resurl也就是resource url,视频资源地址:
你可以打开试下,就是在线的视频,可以手动下载。
关键代码含义
我们用到了requests,它是大名鼎鼎的爬虫框架,需要导入它。
fire就是下载函数,需要将页面刷新多少次,参数就传入多少,参数越大,刷新下载的视频就越多。
url就是保存视频信息jason格式的网址。
res = requests.get(url,headers=headers,params,timeout)
参数说明如下:
url:要抓取的 url 地址。headers:用于包装请求头信息。params:请求时携带的查询字符串参数。timeout:超时的时间,超过时间会抛出异常。通过URL去向服务器发出请求,服务器再把相关内容封装成一个Response对象返回给我们,这是通过requests.get()实现的。
我们获取到的Response对象下有四个常用的方法(status_code、content、text、encoding)。
r=requests.get("https://www.baidu.com")r.status_coder.headers["content-type"]r.encodingr.textr.jsonr.request.headers
headers可以在开发者模式下,手动刷新网站获取该网站的headers。
response.json()返回结果的JSON对象
如果结果是以JSON格式编写的,否则返回错误。
Python请求通常用于从特定资源URI中获取内容。每当我们通过Python向指定URI发出请求时,它都会返回一个响应对象。
for _ in range(page):有时循环不关心其中的计数值,我们可以用_。
response.content能把Response对象的内容以二进制数据的形式返回,适用于图片、音频、视频的下载。
video_url:视频的链接
video_title:视频保存到本地的名称
video_content:视频文件
免费群、收费群
猫妹和猫爸计划未来建立一个免费群,一个收费群。
你感兴趣吗?
好了,今天的分享就到这里,谢谢朋友们的阅读。
我是猫妹,咱们下次见!
关键词: Python 网络爬虫 宝贝过大年 WebKit Chrome 2019科技之光 Windows Gecko Safari 郭旭的测试话题 交个朋友吧 Windows Mozilla 岁岁又重阳
推荐阅读
菜籽出油率多少?菜籽出油率高不高?
菜籽出油率多少?很多国家都有菜籽,成片的菜籽,美国农场主也不例外。一般来说,榨菜籽的出油率约为32%-36%。有些地区正常达到38%左右,主 【详细】
蓝太阳什么时候出现过 蓝太阳是怎么形成的?
平常晴天的时候都是可以看见太阳的,不过我们也知道平时看到的太阳是黄色的发光发亮的球体,不过今日北京出现蓝太阳,蓝太阳是什么意思?蓝 【详细】
低碳环保节能产业是什么概念 为什么环保受到大家的重视?
低碳环保节能产业,是什么概念,怎么理解?节能环保产业是指为节约能源资源、发展循环经济和保护生态环境提供物质基础和技术支持的产业,是 【详细】
dwg文件是什么 dwg文件用什么打开?
相信很多人都不知道dwg文件用什么打开?,接下来小编就带大家介绍一些方法,大家可以了解一下。一、看图纸参见图纸DwgSeePlus是一个dwg文件 【详细】
工业革命是什么 工业革命的影响有哪些?
工业革命的影响有哪些?三次工业革命分别是什么时间?影响1、工业革命引起了生产组织形式的变化,用机器工厂制代替手工作坊。影响2 工业革命 【详细】
相关新闻
- 世界速讯:爸爸偷偷看的小姐姐视频,Python自动下载,一次看个够吧!
- 战斗机器人来了,俄首批战斗机器人投入俄乌战争,打击美德的坦克|热门看点
- 借款人自述:为什么微信支付宝被冻结了,自己才知道被仲裁了呢?|独家焦点
- 比亚迪刚下水,吉利、小鹏就要上天! 全球热讯
- Pro版也将拉开差距?曝iPhone 16 Ultra有独占功能,为啥这样做? 全球今日讯
- 点播看不了怎么办_手机快播完美解决该网站不可点播的方法 环球资讯
- 6个不为人知的黑科技网站,我可以玩一整天
- iPhone14Pro将全系降价700元,覆盖所有授权门店
- 从不吸烟为什么还会得肺癌?科学家阐明不吸烟者肺癌起源
- 5G的扑街-从风风火火到偃旗息鼓_要闻速递
- 抖音超市正式上线,天猫京东要慌了? 焦点精选
- "中国有望成为全球首个研发核聚变技术的国家"
- 《流浪地球2》的这项“黑科技”竟是真的!-环球微头条
- 完了,iOS 17 要彻底变了
- 天天动态:阿思翠
- 报道:风来了 曾经的霸主会不会涅磐重生
- 烟台银行股份有限公司因互联网贷款业务严重违反审慎经营规则被罚款35万元 消息
- 每日精选:报告:勒索软件攻击事前防御效果优于事后补救
- 焦点热讯:爱奇艺到底能涨多久?
- 庆幸遇见,我们的互联网时代!读《看见未来》有感 天天微头条