Xpathtext()爬取表格 其中一个标签为空导致列表长度不一致

tech2024-09-25  20

需求:想要获取列表["null","00"],但是使用text()只能得到["00"]解决 如果是Xpath2.0的话,可以使用 contents4=selector.xpath('//li[@class = "tag_1"]//td/split(.)')

但是相信大多数人使用lxml,貌似仅仅支持Xpath1.0的亚子,因此只能先用//td获取td标签列表,再针对标签列表中每个标签调用.text

html = ''' <li class="tag_1"> <td></td> <td>00</td> </li> ''' selector = etree.HTML(html ) contents4=selector.xpath('//li[@class = "tag_1"]//td') x=[] for c in contents4: x.append(c.text) print(x)

 吐槽:在国内论坛上没有搜到相关的解决方式,只能感谢万能的StackOverflow

 

 

最新回复(0)