一尘不染

使用c#.net解析HTML

c#

我正在尝试解析以下HTML文件,我想获取key的值。这是在Windows Phone的Silverlight上完成的。

<HTML>
<link ref="shortcut icon" href="favicon.ico">
<BODY>
<script Language="JavaScript">
location.href="login.html?key=UEFu1EIsgGTgAV7guTRhsgrTQU28TImSZkYhPMLj7BChpBkvlCO11aJU2Alj4jc5"
</script>
<CENTER><a href="login.html?key=UEFu1EIsgGTgAV7guTRhsgrTQU28TImSZkYhPMLj7BChpBkvlCO11aJU2Alj4jc5">Welcome</a></CENTER></BODY></HTML>

有什么想法要从这里去吗?

谢谢


阅读 290

收藏
2020-05-19

共1个答案

一尘不染

看一下HTMLAgilityPack。它是一个相当不错的HTML解析器

http://html-agility-pack.net/?z=codeplex

======

这是一些入门的代码(需要进行错误检查)

HtmlDocument document = new HtmlDocument(); 
string htmlString = "<html>blabla</html>";
document.LoadHtml(htmlString);
HtmlNodeCollection collection = document.DocumentNode.SelectNodes("//a");
foreach (HtmlNode link in collection)
{
     string target = link.Attributes["href"].Value;
}
2020-05-19