dtcms matlab Docker 数据结构 PaddleHub 作用域 JS jsf servlets collections paypal datatables vue代码规范 webpack视频 jquery选择器找子元素 jquery获取元素 mac脚本编辑器 js原生点击事件 网页设计公司 python生成多个随机数 python入门指南 python中的if语句 python数字类型 java环境 java覆盖 java数据结构 java数组删除 java时间转时间戳 linux启动 linux密码 php项目实例 props 隐藏虚拟键 bat脚本 51脚本 整站系统 橄榄山快模 催眠魔蛙 R语言初学者指南 java获取时间戳
当前位置: 首页 > 学习教程  > 编程语言

Java正则表达式匹配链接(及注意事项)

2020/11/24 10:37:23 文章标签: 测试文章如有侵权请发送至邮箱809451989@qq.com投诉后文章立即删除

一、场景 匹配已爬取网页中的某一个url链接。 示例: if (window!top){top.location.href window.location.href;}var classid"283";var status"1";var meida {mp3:"http://mp3.9ku.com/hot/2007/11-01/91161.mp3"};{"contex…

一、场景

匹配已爬取网页中的某一个url链接。

示例:

if (window!=top){top.location.href =window.location.href;}var classid="283";var status="1";var meida = {mp3:"http://mp3.9ku.com/hot/2007/11-01/91161.mp3"};
    {
        "@context": "https://zhanzhang.baidu.com/contexts/cambrian.jsonld",
        "images": ["http://aliyunimg.9ku.com/pic/zjpic/4/32111.jpg?x-oss-process=image/resize,m_fill,w_150,h_150,limit_0/auto-orient,0"],
        "description": "《青花瓷》 是 周杰伦 演唱的歌曲,时长04分00秒,由作词,作曲,该歌曲收录在周杰伦2007年的专辑《我很忙》之中,如果您觉得好听的话,就把这首歌分享给您的朋友共同聆听,一起支持歌手周杰伦吧!",
        "pubDate": "2007-11-02T00:00:00",
        "upDate": "2020-09-03T01:13:18"
    }

匹配其中的链接:http://mp3.9ku.com/hot/2007/11-01/91161.mp3

二、解决方法

正则表达式:(?<=mp3:")(.*)(?="})

解释:
?<=:表示找到以mp3:"开头的字符串
?=:表示找到以"}结尾的字符串

代码:

Pattern pattern = Pattern.compile("(?<=mp3:\")(.*)(?=\"})");
Matcher matcher = pattern.matcher(data);
 while(matcher.find()){
     System.out.println(matcher.group(1));
 }

注意:
这里需要循环matcher.find(),直到匹配成功才能打印matcher.group(1),否则会报错找不到。


本文链接: http://www.dtmao.cc/news_show_400305.shtml

附件下载

相关教程

    暂无相关的数据...

共有条评论 网友评论

验证码: 看不清楚?