我想获取所有具有与某些正则表达式匹配的文本的div / links / ..的xpath计数。例如:
<span> day 2 night </span> <span> day 4 night </span> <span> day 17 night</span>
我希望能够致电:
sel.get_xpath_count('regexp:day \d night')
并使其返回2。(当然,这是一个简单的示例,我想使用各种正则表达式)
这可能吗,怎么办?
使用dom=允许您使用javascript 的协议。而javascript具有regexp:
dom=
# sorry, example in Perl: $sel->get(qq{dom=(function(){ var x = document.getElementsByTagName('span'); var result = []; for (var i=0;i<x.length;i++) { var txt = x[i].innerHTML; if (txt.match(/day \d night/)) { result.push(x[i]); } } return result; })()});