指针转换到64位环境中的长移植问题

我正在将一个应用程序从32位移植到64位
它是C风格的编码（遗留产品），尽管它是C++。我遇到了一个问题，使用联合和结构的组合来存储值。这里使用了一个名为"Any"的自定义数据类型，它应该包含任何基本数据类型的数据。Any的实现如下：

typedef struct typedvalue
{
long data; // to hold all other types of 4 bytes or less
short id; // this tells what type "data" is holding
short sign; // this differentiates the double value from the rest
}typedvalue;
typedef union Any 
{
double any_any;
double any_double; // to hold double value
typedvalue any_typedvalue;
}Any;

联合的大小为8字节。他们使用了并集，这样在给定的时间只有一个值，并且他们使用了struct来区分类型。您可以在任何给定时间存储double、long、string、char、float和int值。这就是想法。如果是双值，则该值存储在any_double中。如果它是任何其他类型，那么它存储在"data"中，值的类型存储在"id"中。"符号"将判断值"Any"是包含双精度还是其他类型。代码中大量使用anyany来复制地址空间中的值，而不考虑类型。（这是我们最大的问题，因为我们不知道在给定的时间它会保持什么！）

如果它是一个字符串或指针"Any"，则它被存储在"data"（类型为long）中。在64位中，这就是问题所在。指针是8个字节。因此，我们需要将"long"更改为等效的8字节（long-long）。但这会将并集的大小增加到16个字节，自由使用"any_any"会带来问题。"any_any"的用法太多了，你永远不确定它能容纳什么。

我已经尝试了这些步骤，但没有成功：
1.将结构体中的"long data"更改为"long long data"，这将使并集的大小变为16字节。-这将不允许数据以"any_any"（8字节）的形式传递
2.将结构声明为联合内部的指针。并将struct内部的"long data"更改为"long long数据"。-这里遇到的问题是，由于它是一个指针，我们需要为结构分配内存。随意使用"any_any"使我们很难分配内存。有时我们可能会覆盖内存，从而擦除值
3.创建一个单独的集合，该集合将保存"data"（键值对）的值。-这将不起作用，因为此实现是应用程序的核心，收集的数据将达到数百万。

有人能帮我吗？

"有人能帮帮我吗"这听起来像是绝望的呼喊，我完全理解。

无论是谁编写了这段代码，都完全不尊重的未来证明或可移植性，现在你要为此付出代价。

^{（这对任何说"但我们的平台是32位的！我们永远不会使用64位！"的人来说都是一个教训）}

我知道你会说"但代码库太大了"，但你最好重写产品。这次要好好做！

忽略原始设计是疯狂的这一事实，您可以使用<stdint.h>（或很快使用<cstdint>）来获得一点可预测性：

struct typedvalue
{
  uint16_t id;
  uint16_t sign;
  uint32_t data;
};
union any
{
  char any_raw[8];
  double any_double
  typedvalue any_typedvalue;
};

您仍然不能保证typedvalue将被紧密封装，因为对于非char成员没有对齐保证。你可以制作一个struct Foo { char x[8]; };并键入双关语，如果必须的话，比如*(uint32_t*)(&Foo.x[0])和*(uint16_t*)(&Foo.x[4])，但这也会非常难看。

如果您在C++0x中，我肯定会在某个地方为sizeof(typedvalue) == sizeof(double)抛出一个静态断言。

如果您需要同时存储一个8字节的指针和一个"类型"字段，那么您别无选择，只能使用至少9个字节，在64位系统上，对齐可能会将其增加到16个字节。

您的数据结构应该看起来类似：

typedef struct {
    union {
        void   *any_pointer;
        double  any_double;
        long    any_long;
        int     any_int;
    } any;
    char        my_type;
} any;

如果使用C++0x，请考虑对my_type字段使用强类型枚举。在早期版本中，enum所需的存储取决于实现，并且可能超过一个字节。

为了节省内存，您可以使用（编译器特定的）指令来请求数据结构的最佳打包，但由此产生的内存访问错误可能会导致性能问题。

相关内容

最新更新

热门标签：