[源码] 使用Python爬虫一键爬取XX阁小说

sleepyou · 发表于 2022-08-02 22:15

本帖最后由 sleepyou 于 2022-08-02 22:15 编辑

超级简单爬取笔趣阁小说的Python代码，只需要一个Python环境就能运行技术栈：requests，xpath

直接上代码

import os
 
import requests
from lxml import etree
 
def download_txt(name):
    params = {
        "keyword": name
    }
    host = "https://www.1biqug.com"
    resp = requests.get("https://www.1biqug.com/searchbook.php", params=params)
    html = resp.content.decode()
    html = etree.HTML(html)
    ret_list = html.xpath("//li/span[@class='s2']/a/@href")
    detail_url = host + ret_list[0]
    resp = requests.get(detail_url)
    html = etree.HTML(resp.content.decode())
    ret_list = html.xpath("//div[@id='list']//dd//a/@href")
    print(ret_list)
    if not os.path.exists("./{}".format(name)):
        os.mkdir("./{}".format(name))
    for ret in ret_list[12:]:
        url = host + ret
        resp = requests.get(url)
        info = resp.content.decode()
        html = etree.HTML(info)
        title = html.xpath("//h1/text()")
        print(title[0])
        path = os.path.join(name, title[0] + ".html")
        path = path.replace("*", "")
        with open(path, 'w', encoding="utf8") as f:
            f.write(info)
    print(name, "下载完成了")
 
if __name__ == '__main__':
    story = input("请输入小说名")
    download_txt(story)

		自动登录	找回密码
密码			快速注册

扫码赞助关闭

用户登录关闭

找回密码关闭

用户登录关闭

[源码] 使用Python爬虫一键爬取XX阁小说

举报关闭

评分关闭

可选评分理由:


	扫码赞助关闭微信赞助支付宝赞助微信扫一扫有你们的支持大神论坛会做得更好! 支付宝扫一扫有你们的支持大神论坛会做得更好!


	举报关闭请点击举报理由广告垃圾违规内容恶意灌水重复发帖其他请填写举报内容还可输入 200 个字符

扫码赞助 关闭

用户登录 关闭

找回密码 关闭

用户登录 关闭

[源码] 使用Python爬虫一键爬取XX阁小说

举报 关闭

评分 关闭

可选评分理由:

扫码赞助关闭

用户登录关闭

找回密码关闭

用户登录关闭

举报关闭

评分关闭