全部分类
移动开发与应用
WEB前端
架构与运维
程序设计
数据库
操作系统
热点技术
综合
求助,取文本中超链接的地址
498阅读 0评论
2009-08-03
greendays
分类:
[] [] [] [] []
[已解决] 本主题悬赏 可用积分 10
(人不知而不愠)
版主-法师
技術之路只有起點沒有終點.
CU编号: 53267
注册:2003-4-22
最后登录: 2009-08-03
帖子:
精华:
来自:昆侖山狐貍洞
状态:...保密...
[] [] [
博客
]
[]
发表于 2009-7-31 15:40
比如以下文本
CODE:
adfjlmnnzlkjlkfjoj
1hello
22
33
two
44
要取出其中的所有超链接地址,比如
CODE:
/1/1
...
3/3.jpg
...
正则表达式该怎么写,谢谢!折腾了好几天了
[
本帖最后由 yuhuohu 于 2009-7-31 15:56 编辑
]
您对本贴的看法:
__________________________________
┏☆━━━━━━━━━━★━━━━━━━━━━☆┓
┃
┗★━━━━━━━━━━☆━━━━━━━━━━★┛
| | |
(Tim)
法师
CU编号: 465018
注册:2006-9-13
最后登录: 2009-08-03
帖子:
精华:0
来自:长春
状态:
...在线...
[] [] [
博客
]
[]
最佳答案
发表于 2009-7-31 15:40
awk -F "[ ='\"]+" '{for(i=1;i
您对本贴的看法:
__________________________________
记住该记住的,忘记该忘记的。改变能改变的,接受不能改变的。
| | |
(狼烟)
天使
八十万色狼总教头
CU编号: 547805
注册:2007-4-5
最后登录: 2009-08-02
帖子:
精华:0
来自:北京
状态:
...离线...
[] [] [
博客
]
[]
发表于 2009-7-31 15:42
[ img ]标签的添加是根据后缀决定的吗?
您对本贴的看法:
| | |
(狼烟)
天使
八十万色狼总教头
CU编号: 547805
注册:2007-4-5
最后登录: 2009-08-02
帖子:
精华:0
来自:北京
状态:
...离线...
[] [] [
博客
]
[]
发表于 2009-7-31 15:49
CODE:
awk -F"[' \"]" -v RS="href=['\"]*" 'NR!=1{print $1}' URFILE
您对本贴的看法:
| | |
(人不知而不愠)
版主-法师
技術之路只有起點沒有終點.
CU编号: 53267
注册:2003-4-22
最后登录: 2009-08-03
帖子:
精华:
来自:昆侖山狐貍洞
状态:...保密...
[] [] [
博客
]
[]
发表于 2009-7-31 15:55
回复 #2 kwokcn 的帖子
没有img,那是这个论坛自己加上去的 yun
您对本贴的看法:
__________________________________
┏☆━━━━━━━━━━★━━━━━━━━━━☆┓
┃
┗★━━━━━━━━━━☆━━━━━━━━━━★┛
| | |
(人不知而不愠)
版主-法师
技術之路只有起點沒有終點.
CU编号: 53267
注册:2003-4-22
最后登录: 2009-08-03
帖子:
精华:
来自:昆侖山狐貍洞
状态:...保密...
[] [] [
博客
]
[]
发表于 2009-7-31 15:59
谢谢 各路高人 4楼的也可以用
您对本贴的看法:
__________________________________
┏☆━━━━━━━━━━★━━━━━━━━━━☆┓
┃
┗★━━━━━━━━━━☆━━━━━━━━━━★┛
| | |
(狼烟)
天使
八十万色狼总教头
CU编号: 547805
注册:2007-4-5
最后登录: 2009-08-02
帖子:
精华:0
来自:北京
状态:
...离线...
[] [] [
博客
]
[]
发表于 2009-7-31 16:00
早知道第一个回帖的时候不问,直接给答案了…… T_T
您对本贴的看法:
| | |
(人不知而不愠)
版主-法师
技術之路只有起點沒有終點.
CU编号: 53267
注册:2003-4-22
最后登录: 2009-08-03
帖子:
精华:
来自:昆侖山狐貍洞
状态:...保密...
[] [] [
博客
]
[]
发表于 2009-7-31 16:01
能不能稍微解释一下:em17: 再次谢过
您对本贴的看法:
__________________________________
┏☆━━━━━━━━━━★━━━━━━━━━━☆┓
┃
┗★━━━━━━━━━━☆━━━━━━━━━━★┛
| | |
(人不知而不愠)
版主-法师
技術之路只有起點沒有終點.
CU编号: 53267
注册:2003-4-22
最后登录: 2009-08-03
帖子:
精华:
来自:昆侖山狐貍洞
状态:...保密...
[] [] [
博客
]
[]
发表于 2009-7-31 16:02
回复 #7 kwokcn 的帖子
送鲜花 呵呵,可否稍微解释一下 谢谢
您对本贴的看法:
__________________________________
┏☆━━━━━━━━━━★━━━━━━━━━━☆┓
┃
┗★━━━━━━━━━━☆━━━━━━━━━━★┛
| | |
(Tim)
法师
CU编号: 465018
注册:2006-9-13
最后登录: 2009-08-03
帖子:
精华:0
来自:长春
状态:
...在线...
[] [] [
博客
]
[]
发表于 2009-7-31 16:05
回复 #8 yuhuohu 的帖子
就是以 空格 或 单引号 或 双引号 或 等号 为分割符,如果前一个字段是href,那么取它后面的字段。
您对本贴的看法:
__________________________________
记住该记住的,忘记该忘记的。改变能改变的,接受不能改变的。
| | |
» » »
1
[] [] [] [] []
[已解决] 本主题悬赏 可用积分 10
(人不知而不愠)
版主-法师
技術之路只有起點沒有終點.
CU编号: 53267
注册:2003-4-22
最后登录: 2009-08-03
帖子:
精华:
来自:昆侖山狐貍洞
状态:...保密...
[] [] [
博客
]
[]
发表于 2009-7-31 15:40
比如以下文本
CODE:
adfjlmnnzlkjlkfjoj
1hello
22
33
two
44
要取出其中的所有超链接地址,比如
CODE:
/1/1
...
3/3.jpg
...
正则表达式该怎么写,谢谢!折腾了好几天了
[
本帖最后由 yuhuohu 于 2009-7-31 15:56 编辑
]
您对本贴的看法:
__________________________________
┏☆━━━━━━━━━━★━━━━━━━━━━☆┓
┃
┗★━━━━━━━━━━☆━━━━━━━━━━★┛
| | |
(Tim)
法师
CU编号: 465018
注册:2006-9-13
最后登录: 2009-08-03
帖子:
精华:0
来自:长春
状态:
...在线...
[] [] [
博客
]
[]
最佳答案
发表于 2009-7-31 15:40
awk -F "[ ='\"]+" '{for(i=1;i
您对本贴的看法:
__________________________________
记住该记住的,忘记该忘记的。改变能改变的,接受不能改变的。
| | |
(狼烟)
天使
八十万色狼总教头
CU编号: 547805
注册:2007-4-5
最后登录: 2009-08-02
帖子:
精华:0
来自:北京
状态:
...离线...
[] [] [
博客
]
[]
发表于 2009-7-31 15:42
[ img ]标签的添加是根据后缀决定的吗?
您对本贴的看法:
| | |
(狼烟)
天使
八十万色狼总教头
CU编号: 547805
注册:2007-4-5
最后登录: 2009-08-02
帖子:
精华:0
来自:北京
状态:
...离线...
[] [] [
博客
]
[]
发表于 2009-7-31 15:49
CODE:
awk -F"[' \"]" -v RS="href=['\"]*" 'NR!=1{print $1}' URFILE
您对本贴的看法:
| | |
(人不知而不愠)
版主-法师
技術之路只有起點沒有終點.
CU编号: 53267
注册:2003-4-22
最后登录: 2009-08-03
帖子:
精华:
来自:昆侖山狐貍洞
状态:...保密...
[] [] [
博客
]
[]
发表于 2009-7-31 15:55
回复 #2 kwokcn 的帖子
没有img,那是这个论坛自己加上去的 yun
您对本贴的看法:
__________________________________
┏☆━━━━━━━━━━★━━━━━━━━━━☆┓
┃
┗★━━━━━━━━━━☆━━━━━━━━━━★┛
| | |
(人不知而不愠)
版主-法师
技術之路只有起點沒有終點.
CU编号: 53267
注册:2003-4-22
最后登录: 2009-08-03
帖子:
精华:
来自:昆侖山狐貍洞
状态:...保密...
[] [] [
博客
]
[]
发表于 2009-7-31 15:59
谢谢 各路高人 4楼的也可以用
您对本贴的看法:
__________________________________
┏☆━━━━━━━━━━★━━━━━━━━━━☆┓
┃
┗★━━━━━━━━━━☆━━━━━━━━━━★┛
| | |
(狼烟)
天使
八十万色狼总教头
CU编号: 547805
注册:2007-4-5
最后登录: 2009-08-02
帖子:
精华:0
来自:北京
状态:
...离线...
[] [] [
博客
]
[]
发表于 2009-7-31 16:00
早知道第一个回帖的时候不问,直接给答案了…… T_T
您对本贴的看法:
| | |
(人不知而不愠)
版主-法师
技術之路只有起點沒有終點.
CU编号: 53267
注册:2003-4-22
最后登录: 2009-08-03
帖子:
精华:
来自:昆侖山狐貍洞
状态:...保密...
[] [] [
博客
]
[]
发表于 2009-7-31 16:01
能不能稍微解释一下:em17: 再次谢过
您对本贴的看法:
__________________________________
┏☆━━━━━━━━━━★━━━━━━━━━━☆┓
┃
┗★━━━━━━━━━━☆━━━━━━━━━━★┛
| | |
(人不知而不愠)
版主-法师
技術之路只有起點沒有終點.
CU编号: 53267
注册:2003-4-22
最后登录: 2009-08-03
帖子:
精华:
来自:昆侖山狐貍洞
状态:...保密...
[] [] [
博客
]
[]
发表于 2009-7-31 16:02
回复 #7 kwokcn 的帖子
送鲜花 呵呵,可否稍微解释一下 谢谢
您对本贴的看法:
__________________________________
┏☆━━━━━━━━━━★━━━━━━━━━━☆┓
┃
┗★━━━━━━━━━━☆━━━━━━━━━━★┛
| | |
(Tim)
法师
CU编号: 465018
注册:2006-9-13
最后登录: 2009-08-03
帖子:
精华:0
来自:长春
状态:
...在线...
[] [] [
博客
]
[]
发表于 2009-7-31 16:05
回复 #8 yuhuohu 的帖子
就是以 空格 或 单引号 或 双引号 或 等号 为分割符,如果前一个字段是href,那么取它后面的字段。
您对本贴的看法:
__________________________________
记住该记住的,忘记该忘记的。改变能改变的,接受不能改变的。
| | |
» » »
1
上一篇:
sed,n和N命令的区别
下一篇:
关于sed的N说明