我发现如果我添加-shared,它将解决make问题,但是,我不知道在哪里修改Makefile。我已经尝试了LDFLAGS,CXXFLAGS在Makefile https://gist.github.com/anonymous/5453234,它不能工作。
[dlin@h perf]$ make V=1
/bin/sh ../libtool --tag=CXX --mode=link g++ -O2 -pipe -shared -shared -o local_lat local_lat.o ../src/libzmq.la -lrt -lpthread -shared
libtool: link: g++ -O2 -pipe -o .libs/local_lat local_lat.o ../src/.libs/libzmq.so -lrt -lpthread
/usr/bin/ld: .libs/local_lat: hidden symbol `__sync_fetch_and_add_2' in /usr/lib/gcc/sh4-linux/4.2.4/libgcc.a(linux-atomic.o) is referenced by DSO
/usr/bin/ld: final link failed: Nonrepresentable section on output
collect2: ld returned 1 exit status
make: *** [local_lat] Error 1
[dlin@h perf]$ g++ -O2 -pipe -o .libs/local_lat local_lat.o ../src/.libs/libzmq.so -lrt -lpthread
/usr/bin/ld: .libs/local_lat: hidden symbol `__sync_fetch_and_add_2' in /usr/lib/gcc/sh4-linux/4.2.4/libgcc.a(linux-atomic.o) is referenced by DSO
/usr/bin/ld: final link failed: Nonrepresentable section on output
collect2: ld returned 1 exit status
[dlin@h perf]$ g++ -O2 -pipe -o .libs/local_lat local_lat.o ../src/.libs/libzmq.so -lrt -lpthread -shared
-shared选项可以在最后一个命令中手动写入,但是如何放入Makefile?
很可能是-shared
将错误延迟到运行时,看起来GCC对于SuperH没有完全的原子支持。因此,选项是编码所需的原子或使用互斥锁回退。
你可以强制使用一个互斥锁,通过下面的configure.ac
补丁:
sh-* | sh[34]*-*)
AC_DEFINE(ZMQ_FORCE_MUTEXES, 1, [Force to use mutexes])
;;
这不会比本地支持差很多,因为SuperH硬件只通过tas.b
操作提供对字节的测试和设置。互斥锁操作可以用下面的比较和交换操作来代替:
static unsigned char sh_critical_section = 0;
inline static void sh_enter_critical_section (void)
{
unsigned int oldval;
do
__asm__ __volatile__ ("tas.b @%1; movt %0"
: "=r" (oldval)
: "r" (&sh_critical_section)
: "t", "memory");
while (oldval == 0);
}
inline static void sh_leave_critical_section (void)
{
__asm__ __volatile__ (" " ::: "memory");
sh_critical_section= 0;
}
因此可以做以下修改:
#elif defined ZMQ_ATOMIC_COUNTER_SH
sh_enter_critical_section ();
old_value = value;
value += increment_;
sh_leave_critical_section ();
#elif defined ZMQ_ATOMIC_COUNTER_MUTEX
sync.lock ();
old_value = value;
value += increment_;
sync.unlock ();
#else
这是冗余的,因为功能与互斥锁实现相同,所以可以将tas.b
op移动到mutex_t
实现,但需要为锁引入一个全局变量,您几乎不会获得任何比pthread互斥锁实现的东西。
运行一个性能测试,看看是否有任何可测量的性能改进或甚至下降,并提交一个pull request upstream给其他人享受!