一尘不染

从stat函数输出了解并解码文件模式值

linux

我一直在试图了解下面提到的代码中到底发生了什么。但是我听不懂。

$mode = (stat($filename))[2];
printf "Permissions are %04o\n", $mode & 07777;

可以说我的$ mode值为33188

$ mode和07777产生一个值= 420

  • $ mode值是十进制数字吗?

  • 为什么选择07777,为什么要按位进行运算。我无法理解这里的逻辑。


阅读 497

收藏
2020-06-03

共1个答案

一尘不染

您问题的模式对应于具有644个权限的常规文件(所有者为只读文件,其他所有人为只读文件),但请不要误解。

$ touch foo
$ chmod 644 foo
$ perl -le'print +(stat“ foo”)[2]'
33188

的值$mode 可以 看作是十进制整数,但是这样做并不是特别有启发性。看到八进制表示形式会使您更加熟悉。

$ perl -e'printf“%o \ n”,(stat“ foo”)[2]'
100644

与07777的按位与运算给出数字二进制表示形式的最后十二位。在Unix模式下,此操作将给出许可或模式位,并丢弃所有类型信息。

$ perl -e'printf“%d \ n”,(stat“ foo”)[2]&07777'#十进制,无用
420
$ perl -e'printf“%o \ n”,(stat“ foo”)[2]&07777'#八进制,尤里卡!
644

下面是一种更好的方法。继续阅读以获取所有详细信息。


模式位

从返回的第三个元素stat(对应于st_modein struct stat)是一个位字段,其中不同的位位置是二进制标志。

例如,st_modePOSIX名称中的一位S_IWUSR。设置了该位的模式的文件或目录可由其所有者写。一个相关的位是S_IROTH,当置位时表示其他用户(
所有者或组中的任何一个)都不能读取该特定文件或目录。

为perlfunc文档stat提供了常用的模式位的名称。我们可以检查它们的价值。

#! /usr/bin/env perl

use strict;
use warnings;
use Fcntl ':mode';

my $perldoc_f_stat = q(
  # Permissions: read, write, execute, for user, group, others.
  S_IRWXU S_IRUSR S_IWUSR S_IXUSR
  S_IRWXG S_IRGRP S_IWGRP S_IXGRP
  S_IRWXO S_IROTH S_IWOTH S_IXOTH

  # Setuid/Setgid/Stickiness/SaveText.
  # Note that the exact meaning of these is system dependent.
  S_ISUID S_ISGID S_ISVTX S_ISTXT

  # File types.  Not necessarily all are available on your system.
  S_IFREG S_IFDIR S_IFLNK S_IFBLK S_IFCHR S_IFIFO S_IFSOCK S_IFWHT S_ENFMT
);

my %mask;
foreach my $sym ($perldoc_f_stat =~ /\b(S_I\w+)\b/g) {
  my $val = eval { no strict 'refs'; &$sym() };
  if (defined $val) {
    $mask{$sym} = $val;
  }
  else {
    printf "%-10s - undefined\n", $sym;
  }
}

my @descending = sort { $mask{$b} <=> $mask{$a} } keys %mask;
printf "%-10s - %9o\n", $_, $mask{$_} for @descending;

在Red Hat Enterprise Linux和System V系列中的其他操作系统上,以上程序的输出将为

S_ISTXT-未定义
S_IFWHT-未定义
S_IFSOCK-140000
S_IFLNK-120000
S_IFREG-100000
S_IFBLK-60000
S_IFDIR-40000
S_IFCHR-20000
S_IFIFO-10000
S_ISUID-4000
S_ISGID-2000
S_ISVTX-1000
S_IRWXU-700
S_IRUSR-400
S_IWUSR-200
S_IXUSR-100
S_IRWXG-70
S_IRGRP-40
S_IWGRP-20
S_IXGRP-10
S_IRWXO-7
S_IROTH-4
S_IWOTH-2
S_IXOTH-1

位旋转

上面的数字是八进制数(以8为底),因此任何给定的数字都必须为0-7,并且具有位置值8 n ,其中 n
是小数点左侧的从零开始的位置数。要查看它们如何映射到位,八进制具有方便的属性,即每个数字对应于三个位。4、2和1都是2的精确幂,因此以二进制形式分别是100、10和1。二进制中的七个(=
4 + 2 +1)是111,因此70 8是111000 2。后一个示例说明了如何来回转换是直接的。

与位域,你不在乎究竟 是什么 在那个位置有点值,但 是否 是零或非零,所以

if ($mode & $mask) {

测试是否设置了$mode对应的任何位$mask。举一个简单的例子,给定4位整数1011和掩码0100,它们的按位与为

  1011
& 0100
------
  0000

因此,该位置上的位是清楚的,而不是0010或1100的掩码。

清除1011的最高有效位看起来像

    1011      1011
& ~(1000) = & 0111
            ------
              0011

回想一下,~在Perl中是按位补码。

为了完整起见,请按如下所示使用按位OR进行设置

$bits |= $mask;

八进制和文件权限

对于Unix权限,八进制数字直接映射到三位非常方便,因为它们以三位一组出现。例如,产生上面输出的程序的权限为

-rwxr-xr-x 1个gbacon用户1096年2月24日20:34 modebits

也就是说,所有者可以读取,写入和执行;但是其他所有人都可以阅读和执行。八进制为755,这是紧凑的缩写形式。根据上表,该模式下的设置位为

  • S_IRUSR
  • S_IWUSR
  • S_IXUSR
  • S_IRGRP
  • S_IXGRP
  • S_IROTH
  • S_IXOTH

通过在上面的程序中添加几行,我们可以从您的问题中分解模式。

my $mode = 33188;
print "\nBits set in mode $mode:\n";
foreach my $sym (@descending) {
    if (($mode & $mask{$sym}) == $mask{$sym}) {
        print "  - $sym\n";
        $mode &= ~$mask{$sym};
    }
}

printf "extra bits: %o\n", $mode if $mode;

模式测试必须格外小心,因为某些掩码是多个位的简写形式。当一些位被置位但不是全部被置位时,进行测试以获取准确的掩码返回可以避免误报。

循环还会从所有检测到的命中清除位,因此最后我们可以检查是否已考虑到每个位。输出是

在模式33188中设置的位:
  -S_IFREG
  -S_IRUSR
  -S_IWUSR
  -S_IRGRP
  -S_IROTH

没有额外的警告,所以我们得到了一切。

那魔术07777

将7777 8转换为二进制得到0b111_111_111_111。回想一下7 8是111
2,四个7对应于4×3。该掩码对于选择最后十二个设置的位很有用。回顾我们之前生成的位掩码

S_ISUID-4000
S_ISGID-2000
S_ISVTX-1000
S_IRWXU-700
S_IRWXG-70
S_IRWXO-7

我们看到最后9位是用户,组和其他用户的权限。在它们之前的三位是setuid,setgroupid,有时也称为粘性位。例如,sendmail我系统上的完整模式为-rwxr- sr-x或34285 10。按位与的结果是

  (dec)      (oct)                (bin)
  34285     102755     1000010111101101
&  4095 = &   7777 = &     111111111111
-------   --------   ------------------
   1517 =     2755 =        10111101101

丢弃模式下的高位为S_IFREG,表明它是一个常规文件。请注意,与十进制或二进制的相同信息相比,八进制表示的模式更清晰。

stat文档提到了一个有用的功能。

…的S_IF*功能是

S_IMODE($mode)
的部分$mode包含所述许可位和的setuid / setgid的/粘性位

在中ext/Fcntl/Fcntl.xs,我们在最后一行找到其实现和一个熟悉的常量。

void
S_IMODE(...)
    PREINIT:
        dXSTARG;
        SV *mode;
    PPCODE:
        if (items > 0)
            mode = ST(0);
        else {
            mode = &PL_sv_undef;
            EXTEND(SP, 1);
        }
        PUSHu(SvUV(mode) & 07777);

为了避免在源代码中使用幻数的错误做法,请编写

my $permissions = S_IMODE $mode;

使用S_IMODEFcntl模块提供的功能和其他功能还隐藏了低级位混乱,并专注于程序所需的域级信息。该文档继续

S_IFMT($mode)
$mode包含文件类型 的部分,可以使用(例如)S_IFREG或以下功能进行位与运算

# The operators -f, -d, -l, -b, -c, -p, and -S.
S_ISREG($mode) S_ISDIR($mode) S_ISLNK($mode)
S_ISBLK($mode) S_ISCHR($mode) S_ISFIFO($mode) S_ISSOCK($mode)

# No direct -X operator counterpart, but for the first one
# the -g operator is often equivalent.  The ENFMT stands for
# record flocking enforcement, a platform-dependent feature.
S_ISENFMT($mode) S_ISWHT($mode)

使用这些常量和函数可以更直接地表达您的意图,从而使您的程序更加清晰。

2020-06-03