Zookeeper 数据结构 cordova mui 网赚视频教程 jq获取最后一个子元素 excel动态图表制作 android自定义控件 java上传图片 php获取当天的0点时间戳 pyhton中异常和模块 mysql时间戳转换日期 python编译环境 python或运算 python包 python函数的调用 python创建文件 java正则表达式 java在线教程 java方法的重载 java时间格式 java怎么写接口 java字符串比较 java索引 nginx安装教程 php案例 ntscan unix操作系统下载 音频录制软件 js闭包的理解 苹果双微信 x64dbg 免费微信答题制作 骰子牛牛怎么玩 免费ftp空间 qq浏览器手机版 lol无法连接服务器 搜狐影音播放器 WVS php保留两位小数
当前位置: 首页 > 学习教程  > python

Python爬虫初体验

2021/2/7 11:43:19 文章标签: 测试文章如有侵权请发送至邮箱809451989@qq.com投诉后文章立即删除

Python爬虫初体验 闲来无事,试着写一个小爬虫,功能是爬取一个网页上的url链接,话不多说上代码: import requests #导入爬虫的库,不然调用不了爬虫的函数 需要pip install import re#提取所有的url def Find(string):url re.findall(https?://(?:[-\w.]|(?:%[\…

Python爬虫初体验

  • 闲来无事,试着写一个小爬虫,功能是爬取一个网页上的url链接,话不多说上代码:
import requests #导入爬虫的库,不然调用不了爬虫的函数 需要pip install
import re

#提取所有的url
def Find(string):
    url = re.findall('https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+/[a-z,A-Z,0-9,/,.]+', string)
    return url 

#获取页面内容
def Url(string):
    response = requests.get(string)  #生成一个response对象

    response.encoding = response.apparent_encoding
    if response.status_code == 200:
        return Find(response.text)
    else:
        return False

#获取用户输入的url开始爬取
string =input("请输入一个带http的url链接:")
result =Url(string)
if False == result:
    print("没有获取到信息")
else:
    print("爬取到的url链接有:")    
    print(result)    
  • 总结:写python的代码还是很舒服的,没有那么多限制,想怎么写就怎么写.

本文链接: http://www.dtmao.cc/news_show_2000284.shtml

附件下载

相关教程

    暂无相关的数据...

共有条评论 网友评论

验证码: 看不清楚?