求一个匹配域名采集的正则表达式,比如 www.yuming.com 我要匹配页面中所有包含域名 :yuming 的链接

PHP 的
2025-05-15 19:24:56
推荐回答(1个)
回答(1):

string pattern="(http://){0,1}(/w/d)*.yuming.(com|cn|net)";
解析:(http://){0,1}指示无论域名出现时是否带有http://字样都要进行匹配。
(/w/d)*:指示无论出现二级域名与否,只要带有yuming字样都要进行匹配
yuming指你要采集的域名,你自行替换吧。
(com|net|cn):要取域名的后缀,根据需要,你可以自行添加或删减。
这个表达式相比较来说比做蜘蛛程序的表达式容易写,你应当研究一下。做.net采集,不会正则无疑是瘸了条腿。