谷歌浏览器直接提取的xpath,在python中为什么无法提取相应内容

2025-05-22 17:27:05
推荐回答(2个)
回答(1):

你的xpath写的太长了吧,很容易出错的 内容的tr的class都是provincetr,用这个筛选容易多了,//tr[@class="provincetr"]/td/a/text() xpath不熟悉,看了下wiki写出来的,写的不好 补充,这个才算真正回答你的问题,为什么浏览器可以,但是lxml不可以 因为浏览器对不标准的HTML文档都有纠正功能,而lxml不会 查看page source,注意是源代码,不是developer tool那个;最后一个table并没有包含tbody,浏览器会自动补充tbody,而lxml没有这么做,所以你的xpath没有找到

回答(2):

军事家吻擞采纳苍灯