我有以下XML文件,该文件相当大,我无法获取simplexml来打开和读取该文件,因此我正在尝试XMLReader,但在php中没有成功
<?xml version="1.0" encoding="ISO-8859-1"?> <products> <last_updated>2009-11-30 13:52:40</last_updated> <product> <element_1>foo</element_1> <element_2>foo</element_2> <element_3>foo</element_3> <element_4>foo</element_4> </product> <product> <element_1>bar</element_1> <element_2>bar</element_2> <element_3>bar</element_3> <element_4>bar</element_4> </product> </products>
不幸的是,我还没有找到关于PHP的很好的教程,很想看看我如何才能将每个元素的内容存储在数据库中。
这完全取决于工作单元的大小,但是我想您正在尝试<product/>连续对待每个节点。
<product/>
为此,最简单的方法是使用XMLReader到达每个节点,然后使用SimpleXML访问它们。这样,您可以将内存使用率保持在较低水平,因为您一次要处理一个节点,并且仍然利用SimpleXML的易用性。例如:
$z = new XMLReader; $z->open('data.xml'); $doc = new DOMDocument; // move to the first <product /> node while ($z->read() && $z->name !== 'product'); // now that we're at the right depth, hop to the next <product/> until the end of the tree while ($z->name === 'product') { // either one should work //$node = new SimpleXMLElement($z->readOuterXML()); $node = simplexml_import_dom($doc->importNode($z->expand(), true)); // now you can use $node without going insane about parsing var_dump($node->element_1); // go to next <product /> $z->next('product'); }
快速概述不同方法的优缺点:
仅XMLReader
优点:速度快,占用内存少
缺点:很难编写和调试,需要大量的用户区代码才能做有用的事情。用户域代码很慢,容易出错。另外,它为您提供了更多的代码行来维护
XMLReader + SimpleXML
优点:不需要使用太多内存(仅用于处理一个节点所需的内存),顾名思义,SimpleXML确实非常易于使用。
缺点:为每个节点创建SimpleXMLElement对象不是很快。您真的必须对其进行基准测试,以了解它是否对您造成问题。不过,即使是一台普通的机器,也能够每秒处理一千个节点。
XMLReader + DOM
优点:使用的内存与SimpleXML差不多,并且[XMLReader ::expand()比创建新的SimpleXMLElement更快。我希望可以使用,simplexml_import_dom()但在这种情况下似乎不起作用
simplexml_import_dom()
缺点:DOM很烦人。它位于XMLReader和SimpleXML之间。不像XMLReader那样复杂和尴尬,但是距离使用SimpleXML尚需时日。
我的建议:使用SimpleXML编写原型,看看它是否适合您。如果性能至关重要,请尝试使用DOM。尽可能远离XMLReader。请记住,您编写的代码越多,引入错误或引入性能退化的可能性就越大。