找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 2925|回复: 4

[代码与实例] 爬虫

5

主题

15

帖子

15

积分

贫民

积分
15
wx_Z9LTRnIn 发表于 2021-6-5 19:17:10 | 显示全部楼层 |阅读模式
可不可以麻烦大佬发一份成功爬取网上某篇文章的某一段落的文字,就是
http://www.ruiwen.com/wenxue/zhuziqing/419754.html
朱自清散文,只爬取开头一段
回复

使用道具 举报

0

主题

1

帖子

1

积分

贫民

积分
1
小菜闹 发表于 2021-6-12 16:32:10 | 显示全部楼层
我有爬小说的异曲同工你要不要
回复 支持 反对

使用道具 举报

0

主题

3

帖子

3

积分

贫民

积分
3
1906810445 发表于 2021-9-29 09:44:00 | 显示全部楼层
爬取第一段话:
import requests
from lxml import etree

def get_art(url):
    res = requests.get(url).text
    html = etree.HTML(res)
    art = html.xpath('//div[@class="content"]/p[5]/text()')[0]
    print(art)

if __name__ == '__main__':
    get_art('https://www.ruiwen.com/wenxue/zhuziqing/419754.html')

结果:
  这几天心里颇不宁静。今晚在院子里坐着乘凉,忽然想起日日走过的荷塘,在这满月的光里,总该另有一番样子吧。月亮渐渐地升高了,墙外马路上孩子们的欢笑,已经听不见了;妻在屋里拍着闰儿,迷迷糊糊地哼着眠歌。我悄悄地披了大衫,带上门出去。
回复 支持 反对

使用道具 举报

0

主题

3

帖子

3

积分

贫民

积分
3
ll1218 发表于 2021-11-3 15:59:12 | 显示全部楼层
运行出错,提示没有模块命名。菜鸟乱问
回复 支持 反对

使用道具 举报

0

主题

1

帖子

1

积分

贫民

积分
1
tanrenjun520 发表于 2021-12-26 10:07:54 | 显示全部楼层
安装requests库
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表