爬取本blog的所有标题和链接-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

爬取本blog的所有标题和链接

阅读量：7109 次

发布时间：2019-06-28

本文共 540 字，大约阅读时间需要 1 分钟。

#coding=utf-8from bs4 import BeautifulSoupimport urllib.requestfor i in range(1,54):    url = "http://www.cnblogs.com/php-linux/?page="+str(i)    res = urllib.request.urlopen(url)    soup = BeautifulSoup(res,'lxml')    book_div = soup.find(attrs={'id':"mainContent"})    book_a = book_div.findAll(attrs={"class":'postTitle2'})    f = open('a.txt',"a",encoding='utf8')    for book in book_a :        f.write(book.string+str("链接:")+ str(book.get('href')) + "\n")    f.close()    print("保存成功"+ book.string+str("链接:")+ str(book.get('href')))

　　

你可能感兴趣的文章

PRTG参考价格

jfinal框架教程-学习笔记(二)

MapReduce实现排序功能

Android -- 内容观察者

SSH框架总结（框架分析+环境搭建+实例源代码下载）

aop注解事例

转发）微博短网址生成算法原理

[再寄小读者之数学篇](2014-07-16 与对数有关的不等式)

Android静态图片人脸识别的完整demo(附完整源码)

Oracle 11g安装GI后，运行roothas.pl脚本报错libcap.so.1找不到

atitit.java给属性赋值方法总结and BeanUtils 1.6.1 .copyProperty的bug

Git操作指南

FORM验证简单demo

FindWindow使用方法

数据挖掘十大经典算法

VirtualBox 扩展虚拟硬盘容量

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-09 02:49:45 当前IP: 13.58.130.38 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我