SGMLReader - HTML 和 SGML 解析库
Apache
Windows
C#
软件简介
SgmlReader 是一个敏捷的 C# .NET 库,通过 XmlReader API 解析 HTML 和 SGML
文件。同时提供一个命令行工具可以对这些内容进行格式化输出到 XML 结果。
示例代码:
XmlDocument FromHtml(TextReader reader) {
// setup SgmlReader
Sgml.SgmlReader sgmlReader = new Sgml.SgmlReader();
sgmlReader.DocType = "HTML";
sgmlReader.WhitespaceHandling = WhitespaceHandling.All;
sgmlReader.CaseFolding = Sgml.CaseFolding.ToLower;
sgmlReader.InputStream = reader;
// create document
XmlDocument doc = new XmlDocument();
doc.PreserveWhitespace = true;
doc.XmlResolver = null;
doc.Load(sgmlReader);
return doc;
}