一尘不染

如何使用Perl动态获取Web内容?

ajax

这有点棘手。我猜有一个网页,它使用某种AJAX来基于搜索查询提取内容。当我使用Perl中的get来获取页面时,它将获取php /
html后面的脚本代码,但不会获取手动搜索查询时显示的结果。我需要能够获取结果页面的内容。无论如何,在Perl中有这样做吗?


阅读 206

收藏
2020-07-26

共1个答案

一尘不染

看一下Selenium
RC
WWW::SeleniumPerl中的模块。使用它们,您可以控制真正的Web浏览器。

另一个选项是WWW::HtmlUnit使用HtmlUnit Java库在没有Web浏览器的情况下执行JavaScript。
WWW::HtmlUnit使用Inline :: Java授予Perl访问该库的权限。我发现在安装时,最好对“您是否要构建JNI扩展?”这个问题说不。

2020-07-26