当前位置:首页 > CN2资讯 > 正文内容

爬虫之代理IP爬虫代理ip购买

7小时前CN2资讯

如果一个IP访问频率过高,则有可能会被对方的服务器封掉。

解决方法:

1. 降低访问频率,使用time.sleep()

2. 使用代理IP

推荐使用的代理IP网站:

西刺代理:

快代理:https://www.kuaidaili.com/

芝麻代理的使用方法:https://www.bilibili.com/video/BV1x5411c7hf?from=search&seid=9358258166195933835

代理网站通常提供免费代理和付费代理。免费代理不好用。快代理上提供的收费代理中,开发代理和私密代理中提供的IP不一定都可用,但是比免费的IP要好。

开放代理可利用率低,私密代理还可以。通常使用私密代理。

可以建立自己的IP代理池,并试用代理IP的可用情况。可以使用www.baidu.com或httpbin.org/get测试代理IP的有效性。

import requestsfrom lxml import etreeimport timeimport randomclass ProxyPool:    def __init__(self):         self.url = 'https://www.kuaidaili.com/free/inha/%d'         self.test_url = 'http://www.baidu.com/'         self.headers = {        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36'     }    def get_proxy_pool(self,url):         html = requests.get(url=url,headers=self.headers).text         p = etree.HTML(html)         tr_list = p.xpath('//*[@id="list"]/table//tr')        for tr in tr_list[1:]:             ip = tr.xpath('./td[1]/text()')[0].strip()             port = tr.xpath('./td[2]/text()')[0].strip()             self.test_proxy(ip,port)    def test_proxy(self,ip,port):         proxies = {            'http':'http://{}:{}'.format(ip,port),            'https':'https://{}:{}'.format(ip,port)         }        try:             res = requests.get(url=self.test_url,proxies=proxies,headers=self.headers,timeout=2)             time.sleep(3)            if res.status_code==200:                print(ip,port,'\033[31m可用\033[0m')                 with open('proxy.text','a') as f:                     f.write(ip+':'+port+'\n')        except Exception as e:            print(ip,port,'不可用')    def run(self):        for i in range(1,5):             url = self.url%i            print(url)             self.get_proxy_pool(url=url)if __name__ == '__main__':     spider = ProxyPool()     spider.run()
    你可能想看:

    扫描二维码推送至手机访问。

    版权声明:本文由皇冠云发布,如需转载请注明出处。

    本文链接:https://www.idchg.com/info/32238.html

    分享给朋友:

    “爬虫之代理IP爬虫代理ip购买” 的相关文章

    **解析cn2线路的美国vps:为什么它是你的最佳选择?**

    ---##cn2线路的美国vps,为什么它如此受欢迎?在数字化时代,VPS(虚拟私人服务器)已经成为企业和个人用户不可或缺的工具。无论是用于网站托管、游戏服务器搭建,还是作为企业数据中转站,VPS的功能和性能直接影响用户体验。在众多VPS服务中,"cn2线路的美国vps"凭借其独特的优势,迅速成为市...

    探索日本V文化:从排球V联赛到Vtuber的多元化发展

    在谈到日本的多元化时,首先无法忽视的是“日本 v”这个词汇所涵盖的多个领域。它不仅代表了排球运动的一个新平台,也象征着现代金融科技,以及独特的二次元文化。这些领域虽然各自独立,但它们共同描绘出日本社会在多个层面上的文化与技术的融合。 1.1 日本排球V联赛 自2018年启幕以来,日本排球V联赛(V....

    CN2 VPS:选择优质虚拟专用服务器的最佳指南

    CN2 VPS概述 在如今的网络环境中,CN2 VPS(虚拟专用服务器)吸引了不少关注。简单来说,它是一种基于中国电信CN2线路的云服务器。CN2线路是中国电信提供的优质网络线路,拥有低延迟、高速度及良好的稳定性。对于那些希望搭建网站、进行外贸交易、跨境办公或者需要远程协作的人来说,CN2 VPS是...

    购买DNS解锁服务器的最佳选择与配置指南

    在当今的信息时代,获取我们想要的内容常常并不像想象中那样简单。很多流媒体服务在不同地区的可用性有所限制,这使得我们在享受内容时常常受到阻碍。这时候,DNS解锁服务器就成为了解决这个问题的有效工具。DNS解锁技术通过修改服务器上的DNS设置,可以帮助用户突破地理限制,顺利访问各种国际流媒体服务。 我刚...

    Virmach Coupons: 轻松获取超值优惠,优化你的VPS选择

    Virmach成立于2014年,作为一家美国VPS服务商,在业内享有良好的声誉。它的总部位于加利福尼亚州洛杉矶,正是这样得天独厚的地理位置让它能迅速成长并服务全球用户。到现在为止,Virmach已经发展成为一家提供各种配置和价格方案的服务商,特别以低价VPS而闻名,吸引了大量希望降低运营成本的个人和...

    Vultr Cloud Computer与High Frequency服务器的全面对比

    在云服务的世界中,Vultr无疑是一个备受瞩目的名字。它提供两种主要的云服务器类型:Vultr Cloud Compute和High Frequency服务器。这两种服务器各有其独特之处,适合不同类型的用户和使用场景。 首先,Vultr Cloud Compute是其最基础的产品,主要以高性价比为卖...