objectivec-确保内存区域为空(全部为NULL)的最快速方法



如果我有一个unsigned char *data指针,并且我想检查该指针处的数据的size_t length是否为NULL,那么最快的方法是什么?换句话说,确保内存区域为空的最快方法是什么?

我在iOS中实现,所以如果有帮助的话,你可以假设iOS框架是可用的。另一方面,简单的C方法(memcmp等)也可以

请注意,我不是试图清除内存,而是试图确认内存已经清除(如果有帮助的话,我正在试图找出某些位图数据中是否有任何内容)。例如,我认为以下方法会起作用,尽管我还没有尝试过:

- BOOL data:(unsigned char *)data isNullToLength:(size_t)length {
    unsigned char tester[length] = {};
    memset(tester, 0, length);
    if (memcmp(tester, data, length) != 0) {
        return NO;
    }
    return YES;
}

不过,我宁愿不创建测试仪数组,因为源数据可能相当大,我宁愿避免为测试分配内存,即使是暂时的。但我可能只是太保守了。

更新:一些测试

感谢大家在下面的精彩回复。我决定创建一个测试应用程序来看看这些结果如何,答案让我很惊讶,所以我想分享一下。首先,我将向您展示我使用的算法的版本(在某些情况下,它们与所提出的算法略有不同),然后我将分享一些来自该领域的结果。

测试

首先我创建了一些样本数据:

    size_t length = 1024 * 768;
    unsigned char *data = (unsigned char *)calloc(sizeof(unsigned char), (unsigned long)length);
    int i;
    int count;
    long check;
    int loop = 5000;

每个测试包括循环运行loop次。在循环期间,一些随机数据被添加到data字节流中并从中移除。请注意,一半的时间实际上没有添加数据,因此一半的时间测试不应该找到任何非零数据。请注意,testZeros调用是下面测试例程调用的占位符。计时器在循环之前启动,在循环之后停止。

    count = 0;
    for (i=0; i<loop; i++) {
        int r = random() % length;
        if (random() % 2) { data[r] = 1; }
        if (! testZeros(data, length)) {
            count++;
        }
        data[r] = 0;
    }

测试A:nullToLength。这或多或少是我上面的原始公式,经过调试和简化。

- (BOOL)data:(void *)data isNullToLength:(size_t)length {
    void *tester = (void *)calloc(sizeof(void), (unsigned long)length);
    int test = memcmp(tester, data, length);
    free(tester);
    return (! test);
}

测试B:allZero。Carrotman的提议。

BOOL allZero (unsigned char *data, size_t length) {
    bool allZero = true;
    for (int i = 0; i < length; i++){
        if (*data++){
            allZero = false;
            break;
        }
    }
    return allZero;
}

测试C:is_all_zero。由伦丁提出。

BOOL is_all_zero (unsigned char *data, size_t length)
{
    BOOL result = TRUE;
    unsigned char* end = data + length;
    unsigned char* i;
    for(i=data; i<end; i++) {
        if(*i > 0) {
            result = FALSE;
            break;
        }
    }
    return result;
}

测试D:sumArray。这是vladr提出的几乎重复的问题的最高答案。

BOOL sumArray (unsigned char *data, size_t length) {
    int sum = 0;
    for (int i = 0; i < length; ++i) {
        sum |= data[i];
    }
    return (sum == 0);
}

测试E:lulz。由Steve Jessop提议。

BOOL lulz (unsigned char *data, size_t length) {
    if (length == 0) return 1;
    if (*data) return 0;
    return memcmp(data, data+1, length-1) == 0;
}

测试F:NSData。这是一个使用NSData对象的测试,我在处理所有这些时在iOS SDK中发现了该对象。事实证明,苹果确实有一个如何比较字节流的想法,它被设计成独立于硬件。

- (BOOL)nsdTestData: (NSData *)nsdData length: (NSUInteger)length {
    void *tester = (void *)calloc(sizeof(void), (unsigned long)length);
    NSData *nsdTester = [NSData dataWithBytesNoCopy:tester length:(NSUInteger)length freeWhenDone:NO];
    int test = [nsdData isEqualToData:nsdTester];
    free(tester);
    return (test);
}

结果

那么,这些方法的比较如何呢?以下是两组数据,每组数据表示通过检查的5000个循环。首先,我在一台相对较旧的iMac上运行的iPhone模拟器上尝试了这个,然后我在第一代iPad上尝试了它。

在iMac:上运行的iPhone 4.3模拟器上

// Test A, nullToLength:  0.727 seconds
// Test F, NSData:        0.727
// Test E, lulz:          0.735
// Test C, is_all_zero:   7.340
// Test B, allZero:       8.736
// Test D, sumArray:     13.995

在第一代iPad上:

// Test A, nullToLength: 21.770 seconds
// Test F, NSData:       22.184
// Test E, lulz:         26.036
// Test C, is_all_zero:  54.747
// Test B, allZero:      63.185
// Test D, sumArray:     84.014

这只是两个样本,我进行了多次测试,结果略有不同。表演的顺序总是一样的:A&F非常接近,E紧随其后,C、B和D。我认为A、F和E是虚拟联系,在iOS上我更喜欢F,因为它利用了苹果对处理器更改问题的保护,但A&E非常接近。memcmp方法显然胜过了简单的循环方法,在模拟器中快了近十倍,在设备本身上快了一倍。奇怪的是,D,来自另一个线程的获胜答案在这次测试中表现非常糟糕,可能是因为它在达到第一个差异时没有跳出循环。

我认为你应该用一个显式循环来完成,但只针对lulz:

if (length == 0) return 1;
if (*pdata) return 0;
return memcmp(pdata, pdata+1, length-1) == 0;

memcpy不同,memcmp不要求两个数据段不重叠。

不过,它可能比循环慢,因为输入指针的不对齐意味着memcmp的实现可能无法进行太多优化,而且它将内存与内存进行比较,而不是将内存与常量进行比较。很容易对其进行分析并找出答案。

不确定它是否是最好的,但我可能会这样做:

bool allZero = true;
for (int i = 0; i < size_t; i++){
    if (*data++){
        //Roll back so data points to the non-zero char
        data--;
        //Do whatever is needed if it isn't zero.
        allZero = false;
        break;
    }
}

如果您刚刚分配了这个内存,那么您可以始终调用calloc而不是malloc(calloc要求将所有数据清零)。(编辑:阅读你对第一篇文章的评论,你真的不需要这个。我只留下它以防万一)

如果你自己分配内存,我建议使用calloc()函数。它就像malloc()一样,只是先将缓冲区清零。它用于为Objective-C对象分配内存,也是所有ivar默认为0的原因。

另一方面,如果这是一个静态声明的缓冲区,或者是一个您自己没有分配的缓冲区时,memset()是实现这一点的简单方法。

获取值、检查并设置它的逻辑至少与设置它一样昂贵。您希望它为null,所以只需使用memset()将其设置为null。

这将是在C:中执行此操作的首选方式

BOOL is_all_zero (const unsigned char* data, size_t length)
{
  BOOL result = TRUE;
  const unsigned char* end = data + length;
  const unsigned char* i;
  for(i=data; i<end; i++)
  {
    if(*i > 0)
    {
      result = FALSE;
      break;
    }
  }
  return result;
}

(不过请注意,严格来说,包含NULL指针的内存单元不一定是0,只要空指针强制转换会导致值为零,而将零强制转换为指针会导致NULL指针。在实践中,这并不重要,因为所有已知的编译器都使用0或(void*)0表示NULL。)

注意对上面初始问题的编辑。我做了一些测试,很明显,memcmp方法或使用苹果的NSData对象及其isEqualToData:方法是提高速度的最佳方法。简单的循环对我来说更清晰,但在设备上速度较慢。

最新更新