WebView
。如何在不再次请求页面的情况下获取页面源?
WebView
似乎应该具有某种getPageSource()
返回字符串的方法,但可惜它不会。如果启用JavaScript,则在此调用中放入适当的JavaScript以获取内容是什么?
webview.loadUrl("javascript:(function() { " +
"document.getElementsByTagName('body')[0].style.color = 'red'; " +
"})()");
#1 楼
我知道这是一个较晚的答案,但是我发现了这个问题,因为我遇到了同样的问题。我想我在lexandera.com上的这篇文章中找到了答案。下面的代码基本上是从站点上剪切并粘贴的。似乎可以解决问题。final Context myApp = this;
/* An instance of this class will be registered as a JavaScript interface */
class MyJavaScriptInterface
{
@JavascriptInterface
@SuppressWarnings("unused")
public void processHTML(String html)
{
// process the html as needed by the app
}
}
final WebView browser = (WebView)findViewById(R.id.browser);
/* JavaScript must be enabled if you want it to work, obviously */
browser.getSettings().setJavaScriptEnabled(true);
/* Register a new JavaScript interface called HTMLOUT */
browser.addJavascriptInterface(new MyJavaScriptInterface(), "HTMLOUT");
/* WebViewClient must be set BEFORE calling loadUrl! */
browser.setWebViewClient(new WebViewClient() {
@Override
public void onPageFinished(WebView view, String url)
{
/* This call inject JavaScript into the page which just finished loading. */
browser.loadUrl("javascript:window.HTMLOUT.processHTML('<head>'+document.getElementsByTagName('html')[0].innerHTML+'</head>');");
}
});
/* load a web page */
browser.loadUrl("http://lexandera.com/files/jsexamples/gethtml.html");
评论
注意,这可能不是页面的原始HTML。在执行onPageFinished()之前,页面内容可能已通过JavaScript动态更改。
– Paul Lammertsma
2011-12-13 18:43
很棒,但是在onPageFinished中调用方法browser.loadUrl将导致再次调用onPageFinished。您可能需要在调用browser.loadUrl之前检查它是否是onPageFinished的首次调用。
–易H.
2012年12月30日上午8:57
谢谢@Blundell它对我有用。我想知道如何将其实现为服务。因为这是一项没有布局和Web视图来存储结果的服务。有没有一种方法可以将数据放入不同于webView的其他对象中,以便我们可以将javascript来获得生成的html代码?
–塔塔利斯
2014年2月12日在3:19
@Totalys甚至更容易String html = new Scanner(new DefaultHttpClient()。execute(new HttpGet(“ www.the url”))。getEntity()。getContent(),“ UTF-8”)。useDelimiter(“ \\ A“)。next(); (缩写为适合评论:-))
–布伦德尔
2014年2月12日在9:31
不要忘记将runOnUiThread(new Runnable(){...插入公共无效的processHTML中。
– CoolMind
16年4月19日在16:43
#2 楼
根据问题12987,Blundell的答案崩溃了(至少在我的2.3 VM上)。相反,我截取了一个带有特殊前缀的console.log调用:// intercept calls to console.log
web.setWebChromeClient(new WebChromeClient() {
public boolean onConsoleMessage(ConsoleMessage cmsg)
{
// check secret prefix
if (cmsg.message().startsWith("MAGIC"))
{
String msg = cmsg.message().substring(5); // strip off prefix
/* process HTML */
return true;
}
return false;
}
});
// inject the JavaScript on page load
web.setWebViewClient(new WebViewClient() {
public void onPageFinished(WebView view, String address)
{
// have the page spill its guts, with a secret prefix
view.loadUrl("javascript:console.log('MAGIC'+document.getElementsByTagName('html')[0].innerHTML);");
}
});
web.loadUrl("http://www.google.com");
#3 楼
这是基于jluckyiv的答案,但我认为按如下所示更改Javascript更好,更简单。browser.loadUrl("javascript:HTMLOUT.processHTML(document.documentElement.outerHTML);");
#4 楼
您是否考虑过分别获取HTML,然后将其加载到Webview中?String fetchContent(WebView view, String url) throws IOException {
HttpClient httpClient = new DefaultHttpClient();
HttpGet get = new HttpGet(url);
HttpResponse response = httpClient.execute(get);
StatusLine statusLine = response.getStatusLine();
int statusCode = statusLine.getStatusCode();
HttpEntity entity = response.getEntity();
String html = EntityUtils.toString(entity); // assume html for simplicity
view.loadDataWithBaseURL(url, html, "text/html", "utf-8", url); // todo: get mime, charset from entity
if (statusCode != 200) {
// handle fail
}
return html;
}
评论
这不会携带饼干。
–基思·阿德勒(Keith Adler)
2015年5月29日,下午2:56
此方法触发验证码对话框
–赫克托
17年7月19日在15:37
#5 楼
我使用@jluckyiv的答案中的代码设法使此工作正常进行,但是我不得不在MyJavaScriptInterface中的processHTML方法中添加@JavascriptInterface批注。class MyJavaScriptInterface
{
@SuppressWarnings("unused")
@JavascriptInterface
public void processHTML(String html)
{
// process the html as needed by the app
}
}
#6 楼
如果targetSdkVersion> = 17,则还需要使用@JavascriptInterface注释该方法-因为SDK 17中存在新的安全性要求,即所有javascript方法都必须使用@JavascriptInterface注释。否则,您将看到类似以下错误:未捕获的TypeError:对象[object Object]在null处没有方法'processHTML':1#7 楼
如果您使用的是kitkat及以上版本,则可以使用chrome远程调试工具查找进入和退出您的Web视图的所有请求和响应,以及所查看页面的html源代码。https://developer.chrome.com/devtools/docs/remote-debugging
评论
问题将以编程方式访问。您能解释一下您的帖子如何有用吗?
–阿杰(Ajay Prajapati)
12月3日9:43
评论
使用jquery脚本和js接口从webview window.interface.processHTML($(\“ body \”)。html());中获取HTML内容;stackoverflow.com/questions/8200945/…
您显然可以使用HTTP请求以HTML形式获取响应,但是如果某些页面需要加载后数据(例如,用户凭据等),则此方法只会失败。我认为这应该是这样,因为如果您可以做到,那么您可能可以为任何网站制作自己的android应用,这会很糟糕!