博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
爬取本blog的所有标题和链接
阅读量:7109 次
发布时间:2019-06-28

本文共 540 字,大约阅读时间需要 1 分钟。

#coding=utf-8from bs4 import BeautifulSoupimport urllib.requestfor i in range(1,54):    url = "http://www.cnblogs.com/php-linux/?page="+str(i)    res = urllib.request.urlopen(url)    soup = BeautifulSoup(res,'lxml')    book_div = soup.find(attrs={'id':"mainContent"})    book_a = book_div.findAll(attrs={"class":'postTitle2'})    f = open('a.txt',"a",encoding='utf8')    for book in book_a :        f.write(book.string+str("链接:")+ str(book.get('href')) + "\n")    f.close()    print("保存成功"+ book.string+str("链接:")+ str(book.get('href')))

  

你可能感兴趣的文章
13 集合
查看>>
PRTG参考价格
查看>>
jfinal框架教程-学习笔记(二)
查看>>
MapReduce实现排序功能
查看>>
Android -- 内容观察者
查看>>
SSH框架总结(框架分析+环境搭建+实例源代码下载)
查看>>
iOS IAP教程
查看>>
aop注解 事例
查看>>
Fragment
查看>>
转发)微博短网址生成算法原理
查看>>
[再寄小读者之数学篇](2014-07-16 与对数有关的不等式)
查看>>
Android静态图片人脸识别的完整demo(附完整源码)
查看>>
Oracle 11g安装GI后,运行roothas.pl脚本报错libcap.so.1找不到
查看>>
Why Hadoop2
查看>>
atitit.java给属性赋值方法总结and BeanUtils 1.6.1 .copyProperty的bug
查看>>
Git操作指南
查看>>
FORM验证简单demo
查看>>
FindWindow使用方法
查看>>
数据挖掘十大经典算法
查看>>
VirtualBox 扩展虚拟硬盘容量
查看>>