当前位置:科学 > 正文

世界速讯:爸爸偷偷看的小姐姐视频,Python自动下载,一次看个够吧!

2023-02-05 12:59:03  来源:和猫妹学Python

小朋友们好,大朋友们好!


(相关资料图)

好久不见了,猫妹很想念大家。

怎么样,大家春节过得快乐吗?

有没有放鞭炮啊?

放鞭炮,那叫一个刺激,那叫一个痛快,那叫一个放松!

有鞭炮才叫过年咧!

玩烟花爆竹一定要在大人的看护下进行,在高兴之余将风险降到最低,安全最重要。

有没有收到很多压岁钱?

这都是长辈对咱们的关爱,一定要对长辈好一些啊!

虽然是春节,猫妹我觉得猫爸也是手机不离手,有空就偷偷刷小视频看。

到底看什么呢?

搞得这么神秘!

有一次,被我以迅雷不及掩耳之势,将脑袋凑了过去,原来是一些漂亮小姐姐的视频。

Python有很多应用领域,比如科学计算、人工智能、爬虫等。

今天,咱们就简单了解下Python在爬虫领域的强势地位。

爬虫初体验:牛

如果没有安装requests库,先用pip install指令安装下requests库。

我们用这个库来下载视频。

建立一个video文件夹,用于存放下载的视频。

在video建立一个py文件,并将下面内容拷贝到该py文件中:

import requestsdef fire(page):    url = "https://api-tinyvideo-web.yy.com/home/tinyvideosv2"    headers = {        "user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36"}    for _ in range(page):        response = requests.get(url=url, headers=headers)        data = response.json()        data_list = data["data"]["data"]        for d in data_list:            video_url = d["resurl"]            video_title = str(d["yyNum"]) + ".mp4"            video_content = requests.get(url=video_url, headers=headers).content            with open("video\\" + video_title, mode="wb") as f:                f.write(video_content)                print("保存完成:", video_title)if __name__ == "__main__":    fire(5)    print("完成")


下载日志:


下载到的视频:


尝试播放一个文件试下:


什么是爬虫

在计算机领域上的爬虫,通常是指网络爬虫,英文名Spider(网络蜘蛛)。

通过互联网上一个个的网络节点,进行数据的提取、整合以及存储,从而获取我们想要的部分。

我们所处的计算机网络,如果可以上网,很多信息都可以获取得到,当然也可以查看和下载,用计算机将这些资源自动分析和下载下来,就是爬虫。

举个简单的例子,就像春节放的鞭炮。

包装上写着多少响,就代表有多少个小炮,比如10000响表示一共10000个小炮,它们通过导火索连接了起来。

如果这10000个小炮没有连起来,我们可以一个一个放。

一个一个放,如果10000个,要放到什么时候?

有了导火索,这10000个小炮就可以自动依次放了。

就像爬虫,如果不用爬虫技术,我们当然可以手动下载上面的小姐姐视频,但每次下一个,下得都没有看得快。

有了爬虫呢,分析了其中的关系,用代码模拟了手动访问网站的功能,并模拟了手动下载过程。

这样一来,分分钟给你下载很多视频,保证比你看得快。

手动下载

我们先看下不用爬虫技术,怎么下载视频的。

首先,有个保存了小姐姐视频信息的网站,这个可以通过多种途径获得,就像咱上面用到的这个网站。

咱们直接打开这个网站,可以看到如下信息:

这里面密密麻麻很多信息,视频的地址就在这里面。

刷下这个网站,这里面的数据会变化,也就是会有不同的视频地址。

下面的resurl也就是resource url,视频资源地址:

你可以打开试下,就是在线的视频,可以手动下载。


关键代码含义

我们用到了requests,它是大名鼎鼎的爬虫框架,需要导入它。

fire就是下载函数,需要将页面刷新多少次,参数就传入多少,参数越大,刷新下载的视频就越多。

url就是保存视频信息jason格式的网址。

res = requests.get(url,headers=headers,params,timeout)

参数说明如下:

url:要抓取的 url 地址。headers:用于包装请求头信息。params:请求时携带的查询字符串参数。timeout:超时的时间,超过时间会抛出异常。


通过URL去向服务器发出请求,服务器再把相关内容封装成一个Response对象返回给我们,这是通过requests.get()实现的。

我们获取到的Response对象下有四个常用的方法(status_code、content、text、encoding)。

r=requests.get("https://www.baidu.com")r.status_coder.headers["content-type"]r.encodingr.textr.jsonr.request.headers


headers可以在开发者模式下,手动刷新网站获取该网站的headers。

response.json()返回结果的JSON对象

如果结果是以JSON格式编写的,否则返回错误。

Python请求通常用于从特定资源URI中获取内容。每当我们通过Python向指定URI发出请求时,它都会返回一个响应对象。

for _ in range(page):有时循环不关心其中的计数值,我们可以用_。

response.content能把Response对象的内容以二进制数据的形式返回,适用于图片、音频、视频的下载。

video_url:视频的链接

video_title:视频保存到本地的名称

video_content:视频文件

免费群、收费群

猫妹和猫爸计划未来建立一个免费群,一个收费群。

你感兴趣吗?

好了,今天的分享就到这里,谢谢朋友们的阅读。

我是猫妹,咱们下次见!

关键词: Python 网络爬虫 宝贝过大年 WebKit Chrome 2019科技之光 Windows Gecko Safari 郭旭的测试话题 交个朋友吧 Windows Mozilla 岁岁又重阳

推荐阅读

菜籽出油率多少?菜籽出油率高不高?

菜籽出油率多少?很多国家都有菜籽,成片的菜籽,美国农场主也不例外。一般来说,榨菜籽的出油率约为32%-36%。有些地区正常达到38%左右,主 【详细】

蓝太阳什么时候出现过 蓝太阳是怎么形成的?

平常晴天的时候都是可以看见太阳的,不过我们也知道平时看到的太阳是黄色的发光发亮的球体,不过今日北京出现蓝太阳,蓝太阳是什么意思?蓝 【详细】

低碳环保节能产业是什么概念 为什么环保受到大家的重视?

低碳环保节能产业,是什么概念,怎么理解?节能环保产业是指为节约能源资源、发展循环经济和保护生态环境提供物质基础和技术支持的产业,是 【详细】

dwg文件是什么 dwg文件用什么打开?

相信很多人都不知道dwg文件用什么打开?,接下来小编就带大家介绍一些方法,大家可以了解一下。一、看图纸参见图纸DwgSeePlus是一个dwg文件 【详细】

工业革命是什么 工业革命的影响有哪些?

工业革命的影响有哪些?三次工业革命分别是什么时间?影响1、工业革命引起了生产组织形式的变化,用机器工厂制代替手工作坊。影响2 工业革命 【详细】

关于我们  |  联系方式  |  免责条款  |  招聘信息  |  广告服务  |  帮助中心

联系我们:85 572 98@qq.com备案号:粤ICP备18023326号-40

科技资讯网 版权所有