一尘不染

使用PHP手动解析原始的multipart / form-data数据

php

我似乎找不到这个问题的真正答案,所以我去了:

如何解析multipart/form- dataPHP格式的原始HTTP请求数据?我知道,如果格式正确,则原始POST会自动进行解析,但是我要引用的数据来自PUT请求,而PHP并不会自动对其进行解析。数据是多部分的,看起来像:

------------------------------b2449e94a11c
Content-Disposition: form-data; name="user_id"

3
------------------------------b2449e94a11c
Content-Disposition: form-data; name="post_id"

5
------------------------------b2449e94a11c
Content-Disposition: form-data; name="image"; filename="/tmp/current_file"
Content-Type: application/octet-stream

�����JFIF���������... a bunch of binary data

我像这样(伪代码)使用libcurl发送数据:

curl_setopt_array(
  CURLOPT_POSTFIELDS => array(
    'user_id' => 3, 
    'post_id' => 5, 
    'image' => '@/tmp/current_file'),
  CURLOPT_CUSTOMREQUEST => 'PUT'
  );

如果删除CURLOPT_CUSTOMREQUEST位,则该请求将在服务器上作为POST处理,并且一切都将被解析。

有没有一种方法可以手动调用PHP的HTTP数据解析器或其他一些不错的方法呢?是的,我必须以PUT的形式发送请求:)


阅读 1163

收藏
2020-05-26

共1个答案

一尘不染

编辑-请先阅读:
此答案在7年后仍然很受欢迎。从那时起,我就再也没有使用过此代码,并且不知道这些天是否有更好的方法。请查看下面的注释,并了解在许多情况下此代码将无法工作。使用风险自负。

-

好的,因此,根据Dave和Everts的建议,我决定手动解析原始请求数据。经过大约一天的搜索,我没有找到其他方法来执行此操作。

我没有像在引用线程中那样篡改原始数据,因为那样会破坏正在上传的文件。这就是正则表达式。测试的效果不是很好,但似乎适用于我的工作案例。事不宜迟,并希望有一天能对其他人有所帮助:

function parse_raw_http_request(array &$a_data)
{
  // read incoming data
  $input = file_get_contents('php://input');

  // grab multipart boundary from content type header
  preg_match('/boundary=(.*)$/', $_SERVER['CONTENT_TYPE'], $matches);
  $boundary = $matches[1];

  // split content by boundary and get rid of last -- element
  $a_blocks = preg_split("/-+$boundary/", $input);
  array_pop($a_blocks);

  // loop data blocks
  foreach ($a_blocks as $id => $block)
  {
    if (empty($block))
      continue;

    // you'll have to var_dump $block to understand this and maybe replace \n or \r with a visibile char

    // parse uploaded files
    if (strpos($block, 'application/octet-stream') !== FALSE)
    {
      // match "name", then everything after "stream" (optional) except for prepending newlines 
      preg_match("/name=\"([^\"]*)\".*stream[\n|\r]+([^\n\r].*)?$/s", $block, $matches);
    }
    // parse all other fields
    else
    {
      // match "name" and optional value in between newline sequences
      preg_match('/name=\"([^\"]*)\"[\n|\r]+([^\n\r].*)?\r$/s', $block, $matches);
    }
    $a_data[$matches[1]] = $matches[2];
  }        
}

通过引用使用(以免在数据周围复制过多):

$a_data = array();
parse_raw_http_request($a_data);
var_dump($a_data);
2020-05-26