在上一篇教程从零开始的爬虫教程(1)——从urllib开始中我简单地介绍了Python中使用urllib获取的方法,并介绍了根据已有链接列表批量获取网页的方法。但是在实际爬取TechPowerUp数据库的过程中,常常由于网络质量不佳,每次获取都需要大量的无效等待时间。在这篇教程中,我将会讲讲加速爬取的方法。注意,这篇文章不适用于Windows。我将会在不久后特别写一篇在Windows下加速爬取的方法。

google-logo-vendetta.jpg

- 阅读剩余部分 -

随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。在这样的背景下,网络爬虫(Internet Bot)应运而生。在本课程中我将会较为系统地介绍简单Python爬虫的制作。我们从爬取著名硬件测评网站TechPowerUp的GPU数据库开始。

1.jpg

- 阅读剩余部分 -

近日微软发布声明,Windows 7的支持将在2020年1月14日结束,届时将停止一切安全更新和质量更新。这意味着如果爆发全球性的病毒,微软将没有义务为Windows 7用户提供防护,Windows 7的安全性将会不被保证。现在已经是2019年下旬了,对于Windows 7用户来说,将自己的设备升级到Windows 10迫在眉睫。
Windows 7 停止支持公告


- 阅读剩余部分 -

Serveo是一个SSH服务器,仅用于远程端口转发,可以快速将本地端口暴露在外网。官方声称其为Ngrok的绝佳替代品,对其优点是使用现有的SSH客户端,无需安装客户端即可完成端口转发。当用户连接到Serveo时,他们会获得一个公共URL,任何人都可以使用它来连接到他们的localhost服务器。

无标题.jpg

- 阅读剩余部分 -

本次活动收益颇多。虽然大多数内容并不是与我的主课学科或英才计划学科有直接关系,但这些知识大多是我所从未见闻的,拓展了我的知识面。在学习的过程中,必然存在一定的知识断层,这令我无法很好的吸收老师所讲解的知识。但是老师们都十分平易近人、和蔼可亲,愿意为我讲解我所不了解的知识。或许在大学前,这是拓展我的知识面的最好途径。

WeChat Image_20190808103206.jpg

- 阅读剩余部分 -