百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

6个强大且流行的Python爬虫库,强烈推荐!

myzbx 2025-03-03 19:25 48 浏览

Python中有非常多用于网络数据采集的库,功能非常强大,有的用于抓取网页,有的用于解析网页,这里介绍6个最常用的库。

1. BeautifulSoup

BeautifulSoup是最常用的Python网页解析库之一,可将 HTML 和 XML 文档解析为树形结构,能更方便地识别和提取数据。

BeautifulSoup可以自动将输入文档转换为 Unicode,将输出文档转换为 UTF-8。此外,你还可以设置 BeautifulSoup 扫描整个解析页面,识别所有重复的数据(例如,查找文档中的所有链接),只需几行代码就能自动检测特殊字符等编码。

from bs4 import BeautifulSoup  
  
# 假设这是我们从某个网页获取的HTML内容(这里直接以字符串形式给出)  
html_content = """  
  
  
    示例网页  
  
  
    

欢迎来到BeautifulSoup示例

这是一个关于BeautifulSoup的简单示例。

关于我们 """ # 使用BeautifulSoup解析HTML内容,这里默认使用Python的html.parser作为解析器 # 你也可以指定其他解析器,如'lxml'或'html5lib',但需要先安装它们 soup = BeautifulSoup(html_content, 'html.parser') # 提取并打印标签的文本内容 print("网页标题:", soup.title.string) # 网页标题: 示例网页 # 提取并打印<p>标签的文本内容,这里使用class属性来定位 print("介绍内容:", soup.find('p', class_='introduction').string) # 介绍内容: 这是一个关于BeautifulSoup的简单示例。 # 提取并打印<a>标签的href属性和文本内容 link = soup.find('a', class_='link') print("链接地址:", link['href']) # 链接地址: https://www.example.com/about print("链接文本:", link.string) # 链接文本: 关于我们 # 注意:如果HTML内容中包含多个相同条件的标签,你可以使用find_all()来获取它们的一个列表 # 例如,要获取所有<a>标签的href属性,可以这样做: all_links = [a['href'] for a in soup.find_all('a')] print("所有链接地址:", all_links) # 假设HTML中有多个<a>标签,这里将列出它们的href属性 # 注意:上面的all_links列表在当前的HTML内容中只有一个元素,因为只有一个<a>标签 </code></pre><h1 class="pgc-h-arrow-right" data-track="6">2. Scrapy</h1><p style="text-align: left;" data-track="7"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">Scrapy是一个流行的高级爬虫框架,可快速高效地抓取网站并从其页面中提取结构化数据。</span></span></p><p style="text-align: left;" data-track="8"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">由于 Scrapy 主要用于构建复杂的爬虫项目,并且它通常与项目文件结构一起使用</span></span></p><p style="text-align: left;" data-track="9"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">Scrapy 不仅仅是一个库,还可以用于各种任务,包括监控、自动测试和数据挖掘。这个 Python 库包含一个内置的选择器(Selectors)功能,可以快速异步处理请求并从网站中提取数据。</span></span></p><pre class="prism-highlight prism-language-bash" class="syl-page-code"><code># 假设这个文件名为 my_spider.py,但它实际上应该放在 Scrapy 项目的 spiders 文件夹中 import scrapy class MySpider(scrapy.Spider): # Spider 的名称,必须是唯一的 name = 'example_spider' # 允许爬取的域名列表(可选) # allowed_domains = ['example.com'] # 起始 URL 列表 start_urls = [ 'http://example.com/', ] def parse(self, response): # 这个方法用于处理每个响应 # 例如,我们可以提取网页的标题 title = response.css('title::text').get() if title: # 打印标题(在控制台输出) print(f'Title: {title}') # 你还可以继续爬取页面中的其他链接,这里只是简单示例 # 例如,提取所有链接并请求它们 # for href in response.css('a::attr(href)').getall(): # yield scrapy.Request(url=response.urljoin(href), callback=self.parse) # 注意:上面的代码只是一个 Spider 类的定义。 # 要运行这个 Spider,你需要将它放在一个 Scrapy 项目中,并使用 scrapy crawl 命令来启动爬虫。 # 例如,如果你的 Scrapy 项目名为 myproject,并且你的 Spider 文件名为 my_spider.py, # 那么你应该在项目根目录下运行以下命令: # scrapy crawl example_spider </code></pre><h1 class="pgc-h-arrow-right" data-track="11">3. Selenium</h1><p style="text-align: left;" data-track="12"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">Selenium 是一款基于浏览器地自动化程序库,可以抓取网页数据。它能在 JavaScript 渲染的网页上高效运行,这在其他 Python 库中并不多见。</span></span></p><p style="text-align: left;" data-track="13"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">在开始使用 Python 处理 Selenium 之前,需要先使用 Selenium Web 驱动程序创建功能测试用例。</span></span></p><p style="text-align: left;" data-track="14"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">Selenium 库能很好地与任何浏览器(如 Firefox、Chrome、IE 等)配合进行测试,比如表单提交、自动登录、数据添加/删除和警报处理等。</span></span></p><pre class="prism-highlight prism-language-bash" class="syl-page-code"><code>from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC # 设置WebDriver的路径(根据你的系统路径和WebDriver版本修改) driver_path = '/path/to/your/chromedriver' # 初始化WebDriver driver = webdriver.Chrome(executable_path=driver_path) try: # 打开网页 driver.get('https://www.example.com') # 等待页面加载完成(这里使用隐式等待,针对所有元素) # 注意:隐式等待可能会影响性能,通常在脚本开始时设置一次 driver.implicitly_wait(10) # 秒 # 查找并输入文本到搜索框(假设搜索框有一个特定的ID或类名等) # 这里以ID为'search'的输入框为例 search_box = driver.find_element(By.ID, 'search') search_box.send_keys('Selenium WebDriver') # 提交搜索(假设搜索按钮是一个类型为submit的按钮或是一个可以点击的输入框) # 如果搜索是通过按Enter键触发的,可以直接在search_box上使用send_keys(Keys.ENTER) # 这里假设有一个ID为'submit'的按钮 submit_button = driver.find_element(By.ID, 'submit') submit_button.click() # 等待搜索结果加载完成(这里使用显式等待作为示例) # 假设搜索结果页面有一个特定的元素,我们等待它出现 wait = WebDriverWait(driver, 10) # 等待最多10秒 element = wait.until(EC.presence_of_element_located((By.ID, 'results'))) # 执行其他操作... finally: # 关闭浏览器 driver.quit() </code></pre><h1 class="pgc-h-arrow-right" data-track="16">4. requests</h1><p style="text-align: left;" data-track="17"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">不用多说,requests 是 Python 中一个非常流行的第三方库,用于发送各种 HTTP 请求。它简化了 HTTP 请求的发送过程,使得从网页获取数据变得非常简单和直观。</span></span></p><p style="text-align: left;" data-track="18"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">requests 库提供了丰富的功能和灵活性,支持多种请求类型(如 GET、POST、PUT、DELETE 等),可以发送带有参数、头信息、文件等的请求,并且能够处理复杂的响应内容(如 JSON、XML 等)。</span></span></p><pre class="prism-highlight prism-language-bash" class="syl-page-code"><code>import requests # 目标URL url = 'https://httpbin.org/get' # 发送GET请求 response = requests.get(url) # 检查请求是否成功 if response.status_code == 200: # 打印响应内容 print(response.text) else: # 打印错误信息 print(f'请求失败,状态码:{response.status_code}') </code></pre><h1 class="pgc-h-arrow-right" data-track="20">5. urllib3</h1><p style="text-align: left;" data-track="21"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">urllib3 是 Python内置网页请求库,类似于 Python 中的requests库,主要用于发送HTTP请求和处理HTTP响应。它建立在Python标准库的urllib模块之上,但提供了更高级别、更健壮的API。</span></span></p><p style="text-align: left;" data-track="22"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">urllib3可以用于处理简单身份验证、cookie 和代理等复杂任务。</span></span></p><pre class="prism-highlight prism-language-bash" class="syl-page-code"><code>import urllib3 # 创建一个HTTP连接池 http = urllib3.PoolManager() # 目标URL url = 'https://httpbin.org/get' # 使用连接池发送GET请求 response = http.request('GET', url) # 检查响应状态码 if response.status == 200: # 打印响应内容(注意:urllib3默认返回的是bytes类型,这里我们将其解码为str) print(response.data.decode('utf-8')) else: # 如果响应状态码不是200,则打印错误信息 print(f'请求失败,状态码:{response.status}') # 注意:urllib3没有直接的方法来处理JSON响应,但你可以使用json模块来解析 # 如果响应内容是JSON,你可以这样做: # import json # json_response = json.loads(response.data.decode('utf-8')) # print(json_response) </code></pre><h1 class="pgc-h-arrow-right" data-track="24">6. lxml</h1><p style="text-align: left;" data-track="25"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">lxml是一个功能强大且高效的Python库,主要用于处理XML和HTML文档。它提供了丰富的API,使得开发者可以轻松地读取、解析、创建和修改XML和HTML文档。</span></span></p><pre class="prism-highlight prism-language-bash" class="syl-page-code"><code>from lxml import etree # 假设我们有一段HTML或XML内容,这里以HTML为例 html_content = """ <html> <head> <title>示例页面

欢迎来到我的网站

这是一个使用lxml解析的示例页面。

  • 项目1
  • 项目2
""" # 使用lxml的etree模块来解析HTML或XML字符串 # 注意:对于HTML内容,我们使用HTMLParser解析器 parser = etree.HTMLParser() tree = etree.fromstring(html_content, parser=parser) # 查找并打印标签的文本 title = tree.find('.//title').text print("页面标题:", title) # 查找并打印class为"description"的<p>标签的文本 description = tree.find('.//p[@class="description"]').text print("页面描述:", description) # 查找所有的<li>标签,并打印它们的文本 for li in tree.findall('.//li'): print("列表项:", li.text) # 注意:lxml也支持XPath表达式来查找元素,这里只是简单展示了find和findall的用法 # XPath提供了更强大的查询能力 </code></pre><h1 class="pgc-h-arrow-right" data-track="27">其他爬虫工具</h1><p style="text-align: left;" data-track="28"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">除了Python库之外,还有其他爬虫工具可以使用。</span></span></p><h1 class="pgc-h-arrow-right" data-track="29">八爪鱼爬虫</h1><p style="text-align: left;" data-track="30"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">八爪鱼爬虫是一款功能强大的桌面端爬虫软件,主打可视化操作,即使是没有任何编程基础的用户也能轻松上手。</span></span></p><p style="text-align: left;" data-track="31"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">官网:<a class="pgc-link" data-content="mp" data-source="outerLink" href="https://affiliate.bazhuayu.com/hEvPKU" rel="noopener noreferrer noopener noreferrer" target="_blank">1.软件分享<i class="syl-emoji" style="background-image:url(https://lf6-cdn2-tos.bytegoofy.com/toutiao/tt_tps/static/images/ttemoji_v2/emoji_18_ye@3x.png)"></i>八爪鱼,爬取了几百条网站上的公开数据,不用学代码真的很方便。<i class="syl-emoji" style="background-image:url(https://lf6-cdn2-tos.bytegoofy.com/toutiao/tt_tps/static/images/ttemoji_v2/emoji_41_cool@3x.png)"></i>2.发现了一个很棒的软件,?不用学python也可以爬数据!用它爬了n多数据。3.微博、电商、各大新闻平台的数据,很多可以用模版一键爬取数据,非常方便!4.做科研项目要采集很多数据,<i class="syl-emoji" style="background-image:url(https://lf6-cdn2-tos.bytegoofy.com/toutiao/tt_tps/static/images/ttemoji_v2/emoji_18_ye@3x.png)"></i>科研人的救命神器,推荐!5.实时获取楼市动态,用八爪鱼收集网上关于楼盘的用户评价,不用学代码直接爬了很多数据6.用八爪鱼实时爬取电商数据,追踪竞争对手价格,商品信息一手掌握<i class="syl-emoji" style="background-image:url(https://lf6-cdn2-tos.bytegoofy.com/toutiao/tt_tps/static/images/ttemoji_v2/emoji_41_cool@3x.png)"></i>7.用八爪鱼自动收集全网最新新闻,迅速获取热点资讯,超方便?</a></span></span></p><p style="text-align: left;" data-track="32"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">八爪鱼支持多种数据类型采集,包括文本、图片、表格等,并提供强大的自定义功能,能够满足不同用户需求。此外,八爪鱼爬虫支持将采集到的数据导出为多种格式,方便后续分析处理。</span></span></p><h1 class="pgc-h-arrow-right" data-track="33">亮数据爬虫</h1><p style="text-align: left;" data-track="34"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">亮数据平台提供了强大的数据采集工具,比如Web Scraper IDE、亮数据浏览器、SERP API等,能够自动化地从网站上抓取所需数据,无需分析目标平台的接口,直接使用亮数据提供的方案即可安全稳定地获取数据。</span></span></p><p style="text-align: left;" data-track="35"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">网站:<a class="pgc-link" data-content="mp" data-source="outerLink" href="https://get.brightdata.com/weijun" rel="noopener noreferrer noopener noreferrer" target="_blank">「链接」</a></span></span></p><p style="text-align: left;" data-track="36"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">亮数据浏览器支持对多个网页进行批量数据抓取,适用于需要JavaScript渲染的页面或需要进行网页交互的场景。</span></span></p><h1 class="pgc-h-arrow-right" data-track="37">Web Scraper</h1><p style="text-align: left;" data-track="38"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">Web Scraper是一款轻便易用的浏览器扩展插件,用户无需安装额外的软件,即可在Chrome浏览器中进行爬虫。插件支持多种数据类型采集,并可将采集到的数据导出为多种格式。</span></span></p><p style="text-align: left;" data-track="39"><span style="letter-spacing: 1.5px;"><span style="color: #595959; --tt-darkmode-color: #595959;">无论是Python库还是爬虫软件,都能实现数据采集任务,可以选择适合自己的。当然记得在使用这些工具时,一定要遵守相关网站的爬虫政策和法律法规。</span></span></p></div> <div class="clearfix mb10"> <div class="share fr"> <div class="social-share mb20 ta-c" data-initialized="true"> <a href="#" class="social-share-icon iconfont icon-weibo"></a> <a href="#" class="social-share-icon iconfont icon-qq"></a> <a href="#" class="social-share-icon iconfont icon-wechat"></a> <a href="#" class="social-share-icon iconfont icon-qzone"></a> </div> <script src="http://www.myzbx.com/zb_users/theme/tx_hao/script/social-share.min.js"></script> </div> <div class="info-tag"> <a href="http://www.myzbx.com/tags-155.html" title="查看更多CSS 图片库内容" rel="tag" target="_blank">CSS 图片库</a> </div> </div> <div class="info-next"> <ul class="row"> <li class="col-12 col-m-24 mb10">上一篇:<a href="http://www.myzbx.com/post/2576.html" title="2023 年最受前端欢迎的 10 大 CSS-in-JS 库!">2023 年最受前端欢迎的 10 大 CSS-in-JS 库!</a></li> <li class="col-12 col-m-24 ta-r mb10">下一篇:<a href="http://www.myzbx.com/post/2578.html" title="分享设计师私藏多年的28个图片素材网站">分享设计师私藏多年的28个图片素材网站</a></li> </ul> </div> </div> <h2 class="tx-title">相关推荐</h2> <div class="home-news"> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5731.html" title="如何设计一个优秀的电子商务产品详情页" class="f-black" target="_blank">如何设计一个优秀的电子商务产品详情页</a></dt> <dd class="news-txt"> <p class="f-gray f-13">加入人人都是产品经理【起点学院】产品经理实战训练营,BAT产品总监手把手带你学产品电子商务网站的产品详情页面无疑是设计师和开发人员关注的最重要的网页之一。产品详情页面是客户作出“加入购物车”决定的页面...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5730.html" title="怎么在JS中使用Ajax进行异步请求?" class="f-black" target="_blank">怎么在JS中使用Ajax进行异步请求?</a></dt> <dd class="news-txt"> <p class="f-gray f-13">大家好,今天我来分享一项JavaScript的实战技巧,即如何在JS中使用Ajax进行异步请求,让你的网页速度瞬间提升。Ajax是一种在不刷新整个网页的情况下与服务器进行数据交互的技术,可以实现异步加...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5729.html" title="中小企业如何组建,管理团队_中小企业应当如何开展组织结构设计变革" class="f-black" target="_blank">中小企业如何组建,管理团队_中小企业应当如何开展组织结构设计变革</a></dt> <dd class="news-txt"> <p class="f-gray f-13">前言写了太多关于产品的东西觉得应该换换口味.从码农到架构师,从前端到平面再到UI、UE,最后走向了产品这条不归路,其实以前一直再给你们讲.产品经理跟项目经理区别没有特别大,两个岗位之间有很...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5728.html" title="前端监控 SDK 开发分享_前端监控系统 开源" class="f-black" target="_blank">前端监控 SDK 开发分享_前端监控系统 开源</a></dt> <dd class="news-txt"> <p class="f-gray f-13">一、前言随着前端的发展和被重视,慢慢的行业内对于前端监控系统的重视程度也在增加。这里不对为什么需要监控再做解释。那我们先直接说说需求。对于中小型公司来说,可以直接使用三方的监控,比如自己搭建一套免费的...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5727.html" title="Ajax 会被 fetch 取代吗?Axios 怎么办?" class="f-black" target="_blank">Ajax 会被 fetch 取代吗?Axios 怎么办?</a></dt> <dd class="news-txt"> <p class="f-gray f-13">大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发!今天给大家带来的主题是ajax、fetch...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5726.html" title="前端面试题《AJAX》_前端面试ajax考点汇总" class="f-black" target="_blank">前端面试题《AJAX》_前端面试ajax考点汇总</a></dt> <dd class="news-txt"> <p class="f-gray f-13">1.什么是ajax?ajax作用是什么?AJAX=异步JavaScript和XML。AJAX是一种用于创建快速动态网页的技术。通过在后台与服务器进行少量数据交换,AJAX可以使网页实...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5725.html" title="Ajax 详细介绍_ajax" class="f-black" target="_blank">Ajax 详细介绍_ajax</a></dt> <dd class="news-txt"> <p class="f-gray f-13">1、ajax是什么?asynchronousjavascriptandxml:异步的javascript和xml。ajax是用来改善用户体验的一种技术,其本质是利用浏览器内置的一个特殊的...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5724.html" title="6款可替代dreamweaver的工具_替代powerdesigner的工具" class="f-black" target="_blank">6款可替代dreamweaver的工具_替代powerdesigner的工具</a></dt> <dd class="news-txt"> <p class="f-gray f-13">dreamweaver对一个web前端工作者来说,再熟悉不过了,像我07年接触web前端开发就是用的dreamweaver,一直用到现在,身边的朋友有跟我推荐过各种更好用的可替代dreamweaver...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5723.html" title="我敢保证,全网没有再比这更详细的Java知识点总结了,送你啊" class="f-black" target="_blank">我敢保证,全网没有再比这更详细的Java知识点总结了,送你啊</a></dt> <dd class="news-txt"> <p class="f-gray f-13">接下来你看到的将是全网最详细的Java知识点总结,全文分为三大部分:Java基础、Java框架、Java+云数据小编将为大家仔细讲解每大部分里面的详细知识点,别眨眼,从小白到大佬、零基础到精通,你绝...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5722.html" title="福斯《死侍》发布新剧照 &quot;小贱贱&quot;韦德被改造前造型曝光" class="f-black" target="_blank">福斯《死侍》发布新剧照 &quot;小贱贱&quot;韦德被改造前造型曝光</a></dt> <dd class="news-txt"> <p class="f-gray f-13">时光网讯福斯出品的科幻片《死侍》今天发布新剧照,其中一张是较为罕见的死侍在被改造之前的剧照,其余两张剧照都是死侍在执行任务中的状态。据外媒推测,片方此时发布剧照,预计是为了给不久之后影片发布首款正式预...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5721.html" title="2021年超详细的java学习路线总结—纯干货分享" class="f-black" target="_blank">2021年超详细的java学习路线总结—纯干货分享</a></dt> <dd class="news-txt"> <p class="f-gray f-13">本文整理了java开发的学习路线和相关的学习资源,非常适合零基础入门java的同学,希望大家在学习的时候,能够节省时间。纯干货,良心推荐!第一阶段:Java基础重点知识点:数据类型、核心语法、面向对象...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5720.html" title="不用海淘,真黑五来到你身边:亚马逊15件热卖爆款推荐!" class="f-black" target="_blank">不用海淘,真黑五来到你身边:亚马逊15件热卖爆款推荐!</a></dt> <dd class="news-txt"> <p class="f-gray f-13">Fujifilm富士instaxMini8小黄人拍立得相机(黄色/蓝色)扫二维码进入购物页面黑五是入手一个轻巧可爱的拍立得相机的好时机,此款是mini8的小黄人特别版,除了颜色涂装成小黄人...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5719.html" title="2025 年 Python 爬虫四大前沿技术:从异步到 AI" class="f-black" target="_blank">2025 年 Python 爬虫四大前沿技术:从异步到 AI</a></dt> <dd class="news-txt"> <p class="f-gray f-13">作为互联网大厂的后端Python爬虫开发,你是否也曾遇到过这些痛点:面对海量目标URL,单线程爬虫爬取一周还没完成任务;动态渲染的SPA页面,requests库返回的全是空白代码;好不容易...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5718.html" title="最贱超级英雄《死侍》来了!_死侍超燃" class="f-black" target="_blank">最贱超级英雄《死侍》来了!_死侍超燃</a></dt> <dd class="news-txt"> <p class="f-gray f-13">死侍Deadpool(2016)导演:蒂姆·米勒编剧:略特·里斯/保罗·沃尼克主演:瑞恩·雷诺兹/莫蕾娜·巴卡林/吉娜·卡拉诺/艾德·斯克林/T·J·米勒类型:动作/...</p> </dd> </dl> <dl class="news-box clearfix pd20 "> <dt class="f-18 mb10"><a href="http://www.myzbx.com/post/5717.html" title="停止javascript的ajax请求,取消axios请求,取消reactfetch请求" class="f-black" target="_blank">停止javascript的ajax请求,取消axios请求,取消reactfetch请求</a></dt> <dd class="news-txt"> <p class="f-gray f-13">一、Ajax原生里可以通过XMLHttpRequest对象上的abort方法来中断ajax。注意abort方法不能阻止向服务器发送请求,只能停止当前ajax请求。停止javascript的ajax请求...</p> </dd> </dl> </div> </div> <div class="side-box col-6 col-m-24 col2-"> <dl class="side-hot"> <dt>一周热门</dt> <dd> <ul> <li> <a href="http://www.myzbx.com/post/3065.html" title="使用VSCode模板提高Vue开发效率(vscode开发vue3)" target="_blank"> <h2 class="f-15">使用VSCode模板提高Vue开发效率(vscode开发vue3)</h2> </a> </li> <li> <a href="http://www.myzbx.com/post/3070.html" title="吃透 Vue 项目开发实践|16个方面深入前端工程化开发技巧【下】" target="_blank"> <h2 class="f-15">吃透 Vue 项目开发实践|16个方面深入前端工程化开发技巧【下】</h2> </a> </li> <li> <a href="http://www.myzbx.com/post/3074.html" title="8.7k star,一款超炫酷的动态可视化大屏项目" target="_blank"> <h2 class="f-15">8.7k star,一款超炫酷的动态可视化大屏项目</h2> </a> </li> <li> <a href="http://www.myzbx.com/post/3064.html" title="说下你的vue项目的目录结构,该怎么划分?" target="_blank"> <h2 class="f-15">说下你的vue项目的目录结构,该怎么划分?</h2> </a> </li> <li> <a href="http://www.myzbx.com/post/3073.html" title="用上Vue3,你真的变了吗?(vue3 key)" target="_blank"> <h2 class="f-15">用上Vue3,你真的变了吗?(vue3 key)</h2> </a> </li> <li> <a href="http://www.myzbx.com/post/3075.html" title="移动前端重构实战系列:5-7章(前端移动端主要技术有哪些)" target="_blank"> <h2 class="f-15">移动前端重构实战系列:5-7章(前端移动端主要技术有哪些)</h2> </a> </li> <li> <a href="http://www.myzbx.com/post/3066.html" title="这么牛逼的cursor功能,赶紧用起来" target="_blank"> <h2 class="f-15">这么牛逼的cursor功能,赶紧用起来</h2> </a> </li> <li> <a href="http://www.myzbx.com/post/5362.html" title="browser-use:AI 驱动的浏览器自动化神器——DOM识别与交互详解" target="_blank"> <h2 class="f-15">browser-use:AI 驱动的浏览器自动化神器——DOM识别与交互详解</h2> </a> </li> <li> <a href="http://www.myzbx.com/post/5363.html" title="巧克力:从一朵花开始的华丽变身_巧克力花束教程视频" target="_blank"> <h2 class="f-15">巧克力:从一朵花开始的华丽变身_巧克力花束教程视频</h2> </a> </li> <li> <a href="http://www.myzbx.com/post/3143.html" title="comfyui安装MimicMotion扩展,AI跳舞动作模仿" target="_blank"> <h2 class="f-15">comfyui安装MimicMotion扩展,AI跳舞动作模仿</h2> </a> </li> </ul> </dd> </dl> <dl class="function" id="divPrevious"> <dt class="function_t">最近发表</dt><dd class="function_c"> <ul><li><a title="如何设计一个优秀的电子商务产品详情页" href="http://www.myzbx.com/post/5731.html">如何设计一个优秀的电子商务产品详情页</a></li> <li><a title="怎么在JS中使用Ajax进行异步请求?" href="http://www.myzbx.com/post/5730.html">怎么在JS中使用Ajax进行异步请求?</a></li> <li><a title="中小企业如何组建,管理团队_中小企业应当如何开展组织结构设计变革" href="http://www.myzbx.com/post/5729.html">中小企业如何组建,管理团队_中小企业应当如何开展组织结构设计变革</a></li> <li><a title="前端监控 SDK 开发分享_前端监控系统 开源" href="http://www.myzbx.com/post/5728.html">前端监控 SDK 开发分享_前端监控系统 开源</a></li> <li><a title="Ajax 会被 fetch 取代吗?Axios 怎么办?" href="http://www.myzbx.com/post/5727.html">Ajax 会被 fetch 取代吗?Axios 怎么办?</a></li> <li><a title="前端面试题《AJAX》_前端面试ajax考点汇总" href="http://www.myzbx.com/post/5726.html">前端面试题《AJAX》_前端面试ajax考点汇总</a></li> <li><a title="Ajax 详细介绍_ajax" href="http://www.myzbx.com/post/5725.html">Ajax 详细介绍_ajax</a></li> <li><a title="6款可替代dreamweaver的工具_替代powerdesigner的工具" href="http://www.myzbx.com/post/5724.html">6款可替代dreamweaver的工具_替代powerdesigner的工具</a></li> <li><a title="我敢保证,全网没有再比这更详细的Java知识点总结了,送你啊" href="http://www.myzbx.com/post/5723.html">我敢保证,全网没有再比这更详细的Java知识点总结了,送你啊</a></li> <li><a title="福斯《死侍》发布新剧照 &quot;小贱贱&quot;韦德被改造前造型曝光" href="http://www.myzbx.com/post/5722.html">福斯《死侍》发布新剧照 &quot;小贱贱&quot;韦德被改造前造型曝光</a></li> </ul> </dd> </dl> <dl class="function" id="divTags"> <dt class="function_t">标签列表</dt><dd class="function_c"> <ul><li><a title="HTML 简介" href="http://www.myzbx.com/tags-3.html">HTML 简介<span class="tag-count"> (30)</span></a></li> <li><a title="HTML 响应式设计" href="http://www.myzbx.com/tags-28.html">HTML 响应式设计<span class="tag-count"> (31)</span></a></li> <li><a title="HTML URL 编码" href="http://www.myzbx.com/tags-39.html">HTML URL 编码<span class="tag-count"> (32)</span></a></li> <li><a title="HTML Web 服务器" href="http://www.myzbx.com/tags-40.html">HTML Web 服务器<span class="tag-count"> (31)</span></a></li> <li><a title="HTML 表单属性" href="http://www.myzbx.com/tags-48.html">HTML 表单属性<span class="tag-count"> (32)</span></a></li> <li><a title="HTML 音频" href="http://www.myzbx.com/tags-59.html">HTML 音频<span class="tag-count"> (31)</span></a></li> <li><a title="HTML5 支持" href="http://www.myzbx.com/tags-63.html">HTML5 支持<span class="tag-count"> (33)</span></a></li> <li><a title="HTML API" href="http://www.myzbx.com/tags-66.html">HTML API<span class="tag-count"> (36)</span></a></li> <li><a title="HTML 总结" href="http://www.myzbx.com/tags-76.html">HTML 总结<span class="tag-count"> (32)</span></a></li> <li><a title="HTML 全局属性" href="http://www.myzbx.com/tags-81.html">HTML 全局属性<span class="tag-count"> (32)</span></a></li> <li><a title="HTML 事件" href="http://www.myzbx.com/tags-82.html">HTML 事件<span class="tag-count"> (31)</span></a></li> <li><a title="HTML 画布" href="http://www.myzbx.com/tags-83.html">HTML 画布<span class="tag-count"> (32)</span></a></li> <li><a title="HTTP 方法" href="http://www.myzbx.com/tags-88.html">HTTP 方法<span class="tag-count"> (30)</span></a></li> <li><a title="键盘快捷键" href="http://www.myzbx.com/tags-89.html">键盘快捷键<span class="tag-count"> (30)</span></a></li> <li><a title="CSS 语法" href="http://www.myzbx.com/tags-93.html">CSS 语法<span class="tag-count"> (35)</span></a></li> <li><a title="CSS 轮廓宽度" href="http://www.myzbx.com/tags-118.html">CSS 轮廓宽度<span class="tag-count"> (31)</span></a></li> <li><a title="CSS 谷歌字体" href="http://www.myzbx.com/tags-131.html">CSS 谷歌字体<span class="tag-count"> (33)</span></a></li> <li><a title="CSS 链接" href="http://www.myzbx.com/tags-134.html">CSS 链接<span class="tag-count"> (31)</span></a></li> <li><a title="CSS 定位" href="http://www.myzbx.com/tags-140.html">CSS 定位<span class="tag-count"> (31)</span></a></li> <li><a title="CSS 图片库" href="http://www.myzbx.com/tags-155.html">CSS 图片库<span class="tag-count"> (32)</span></a></li> <li><a title="CSS 图像精灵" href="http://www.myzbx.com/tags-156.html">CSS 图像精灵<span class="tag-count"> (31)</span></a></li> <li><a title="SVG 文本" href="http://www.myzbx.com/tags-281.html">SVG 文本<span class="tag-count"> (32)</span></a></li> <li><a title="时钟启动" href="http://www.myzbx.com/tags-307.html">时钟启动<span class="tag-count"> (33)</span></a></li> <li><a title="HTML 游戏" href="http://www.myzbx.com/tags-308.html">HTML 游戏<span class="tag-count"> (34)</span></a></li> <li><a title="JS Loop For" href="http://www.myzbx.com/tags-375.html">JS Loop For<span class="tag-count"> (32)</span></a></li> </ul> </dd> </dl> </div> </div> </div> </div> <div class="footer"> <div class="wide ta-c f-12"> </div> </div> <div class="fixed-box "> <ul> <li class="pchide wapflex"><a href="http://www.myzbx.com/"><i class="fa fa-home"></i> 首页</a></li> <li><a href="http://www.myzbx.com/shoulu.html" title="收录申请" target="_blank"><i class="fa fa-chain-broken mr5"></i>收录</a></li> <li><span class="gotop"><i class="fa fa-caret-up mr5"></i> 顶部</span></li> </ul> </div> <script src="http://www.myzbx.com/zb_users/theme/tx_hao/script/txcstx.min.js?v=2025-04-20"></script> </body> </html><!--130.22 ms , 13 queries , 3686kb memory , 0 error-->