一尘不染

如何尽快实施strlen

algorithm

假设您正在使用x86 32位系统。您的任务是尽快完成更新。

您需要注意两个问题:1.地址对齐。2.读取机器字长(4个字节)的存储器。

在给定的字符串中找到第一个对齐地址并不难。

然后,我们可以用4个字节读取一次内存,并计算其总长度。但是,一旦4个字节中有一个零字节,我们就应该停止,并在零字节之前计数剩余的字节。为了快速检查零字节,glibc提供了一个代码段:

unsigned long int longword, himagic, lomagic;
himagic = 0x80808080L;  
lomagic = 0x01010101L;

// There's zero byte in 4 bytes.
if (((longword - lomagic) & ~longword & himagic) != 0) {
    // do left thing...
}

我在Visual C ++中使用它来与CRT的实现进行比较。CRT的速度比上述速度快得多。

我不熟悉CRT的实现,他们是否使用更快的方法来检查零字节?


阅读 339

收藏
2020-07-28

共1个答案

一尘不染

第一个CRT是 直接 用汇编器编写的。您可以在此处看到其源代码C:\Program Files\Microsoft Visual Studio 9.0\VC\crt\src\intel\strlen.asm(这是针对VS 2008的)

2020-07-28