一尘不染

如何在PHP中使用XMLReader?

php

我有以下XML文件,该文件相当大,我无法获取simplexml来打开和读取该文件,因此我正在尝试XMLReader,但在php中没有成功

<?xml version="1.0" encoding="ISO-8859-1"?>
<products>
    <last_updated>2009-11-30 13:52:40</last_updated>
    <product>
        <element_1>foo</element_1>
        <element_2>foo</element_2>
        <element_3>foo</element_3>
        <element_4>foo</element_4>
    </product>
    <product>
        <element_1>bar</element_1>
        <element_2>bar</element_2>
        <element_3>bar</element_3>
        <element_4>bar</element_4>
    </product>
</products>

不幸的是,我还没有找到关于PHP的很好的教程,很想看看我如何才能将每个元素的内容存储在数据库中。


阅读 317

收藏
2020-05-26

共1个答案

一尘不染

这完全取决于工作单元的大小,但是我想您正在尝试<product/>连续对待每个节点。

为此,最简单的方法是使用XMLReader到达每个节点,然后使用SimpleXML访问它们。这样,您可以将内存使用率保持在较低水平,因为您一次要处理一个节点,并且仍然利用SimpleXML的易用性。例如:

$z = new XMLReader;
$z->open('data.xml');

$doc = new DOMDocument;

// move to the first <product /> node
while ($z->read() && $z->name !== 'product');

// now that we're at the right depth, hop to the next <product/> until the end of the tree
while ($z->name === 'product')
{
    // either one should work
    //$node = new SimpleXMLElement($z->readOuterXML());
    $node = simplexml_import_dom($doc->importNode($z->expand(), true));

    // now you can use $node without going insane about parsing
    var_dump($node->element_1);

    // go to next <product />
    $z->next('product');
}

快速概述不同方法的优缺点:

仅XMLReader

  • 优点:速度快,占用内存少

  • 缺点:很难编写和调试,需要大量的用户区代码才能做有用的事情。用户域代码很慢,容易出错。另外,它为您提供了更多的代码行来维护

XMLReader + SimpleXML

  • 优点:不需要使用太多内存(仅用于处理一个节点所需的内存),顾名思义,SimpleXML确实非常易于使用。

  • 缺点:为每个节点创建SimpleXMLElement对象不是很快。您真的必须对其进行基准测试,以了解它是否对您造成问题。不过,即使是一台普通的机器,也能够每秒处理一千个节点。

XMLReader + DOM

  • 优点:使用的内存与SimpleXML差不多,并且[XMLReader ::expand()比创建新的SimpleXMLElement更快。我希望可以使用,simplexml_import_dom()但在这种情况下似乎不起作用

  • 缺点:DOM很烦人。它位于XMLReader和SimpleXML之间。不像XMLReader那样复杂和尴尬,但是距离使用SimpleXML尚需时日。

我的建议:使用SimpleXML编写原型,看看它是否适合您。如果性能至关重要,请尝试使用DOM。尽可能远离XMLReader。请记住,您编写的代码越多,引入错误或引入性能退化的可能性就越大。

2020-05-26