Xpathtext()爬取表格其中一个标签为空导致列表长度不一致

tech2024-09-25 145

需求：想要获取列表["null","00"]，但是使用text()只能得到["00"]解决如果是Xpath2.0的话，可以使用 contents4=selector.xpath('//li[@class = "tag_1"]//td/split(.)')

但是相信大多数人使用lxml，貌似仅仅支持Xpath1.0的亚子，因此只能先用//td获取td标签列表，再针对标签列表中每个标签调用.text

html = ''' <li class="tag_1"> <td></td> <td>00</td> </li> ''' selector = etree.HTML(html ) contents4=selector.xpath('//li[@class = "tag_1"]//td') x=[] for c in contents4: x.append(c.text) print(x)

吐槽：在国内论坛上没有搜到相关的解决方式，只能感谢万能的StackOverflow

最新回复(0)

Xpathtext()爬取表格 其中一个标签为空导致列表长度不一致

Xpathtext()爬取表格其中一个标签为空导致列表长度不一致