我在PHP中有一个多维数组,其中外部数组包含数千个项目,每个项目内部都是一个数组本身,值为"key1", "key2"one_answers"count":
myExistingArray (size=99999 VERY BIG)
public 0 =>
array (size=3)
'key1' => string '15504'
'key2' => string '20'
'count' => string '1'
public 1 =>
array (size=3)
'key1' => string '15508' (length=5)
'key2' => string '20' (length=2)
'count' => string '2' (length=1)
public 2 =>
array (size=3)
'key1' => string '15510' (length=5)
'key2' => string '20' (length=2)
'count' => string '5' (length=1)
....many more similar items
我想将其转换为一个非常简单的数组,其中先前的值"key1"one_answers"key"被连接成一个指向相应"count"值的新键,如下所示:
myNewArray (size=99999 VERY BIG)
<key1>_<key2> => <count>
15504_20 => string '1' (length=1)
15508_20 => string '2' (length=1)
15510_20 => string '5' (length=1)
性能对我来说非常重要,因为外部数组有几千个元素。PHP中有快速方法吗?我唯一得到的是一个简单的迭代,但这对我来说似乎很慢:
// works but I am looking for a faster version
$myNewArray = array();
foreach ($myExistingArray as $item) {
$myNewArray [$item["key1"]."_".$item["key1"]]=$item["count"];
}
EDIT/底层问题
一些人正确地补充说,我目前的解决方案已经在0 (n),并提到PHP中没有内置的函数来加快这个速度。
我得到"myExistingArray"从mysql数据库查询。我基本上有工作对象,并希望按它们的状态和event_id对它们进行分组。类似于这样的查询:
select count(job.id) as count, job.status as key1, job.event_id as key2
from job
group by job.status, job.event_id
我想重新排列键,以便以后我可以轻松地访问具有特定状态的特定事件的作业计数。
通常,您会寻找array_walk
或array_map
函数来转换PHP中的数组,但不幸的是,它们都不能改变要转换的数组的键。array_walk
将保存密钥,但不会更改它们。很遗憾,没有内置的功能来完成你的要求。
做了一些测试,结果如下(几乎都一样):
Test 1: [0.25861501693726]
Test 2: [0.20804476737976]
Test 3: [0.21039199829102]
Oldskool:[0.26545000076294]
Test 4: [0.35072898864746]
在合并的数组上执行var_dump()
将减慢速度(如预期的那样),但是如果您将其保存在内存中,则数据不会太糟糕。
和用于测试的PHP:
// Construct the raw data
$i = 0;
do {
$raw[] = array('key1' => mt_rand(10000,99999), 'key2' => mt_rand(10,99), 'count' => $i);
} while(++$i < 100000);
// Test 1
$before = microtime(true);
foreach($raw as $k => $v) {
$clean[$v['key1'].'_'.$v['key2']] = $v['count'];
}
$after = microtime(true);
echo 'Test 1:['.($after - $before).']<br />';
$clean = false;
$i = 0;
// Test 2
$before = microtime(true);
$max = count($raw);
do {
$clean[$raw[$i]['key1'].'_'.$raw[$i]['key2']] = $raw[$i]['count'];
} while(++$i < $max);
$after = microtime(true);
echo 'Test 2:['.($after - $before).']<br />';
$clean = false;
$i = 0;
// Test 3
$before = microtime(true);
$max = count($raw);
for($i; $i < $max; $i++) {
$clean[$raw[$i]['key1'].'_'.$raw[$i]['key2']] = $raw[$i]['count'];
}
$after = microtime(true);
echo 'Test 3:['.($after - $before).']<br />';
$clean = false;
// Test of Oldskool's suggestion
$before = microtime(true);
foreach (array_keys($raw) as $item) {
$clean[$raw[$item]['key1'].'_'.$raw[$item]['key2']] = $raw[$item]['count'];
}
$after = microtime(true);
echo 'Test Oldskool:['.($after - $before).']<br />';
$clean = false;
$i = 0;
// Test 4, just for fun
$before = microtime(true);
$max = count($raw);
do {
$c = array_pop($raw[$i]);
$clean[join('_', $raw[$i])] = $c;
} while(++$i < $max);
$after = microtime(true);
echo 'Test 4:['.($after - $before).']<br />';
Edit:添加一个测试Oldskool的例子
您可以将foreach更改为只遍历键而不遍历整个子数组,方法是将其更改为:
foreach (array_keys($myExistingArray) as $item) {
$myNewArray[$myExistingArray[$item]['key1'] . '_' . $myExistingArray[$item]['key2']] = $myExistingArray[$item]['count'];
}
这将使您获得一些速度优势(请参阅此处(array_keys方法)和此处(原始方法)的时间比较)。对于非常大的数组,差异可能会变得更加明显。
如果速度是问题,并且您不使用最终数组作为映射,我会创建一个生成器,这样您就不必预先计算所有内容。
$myExistingArray = [ ... ];
class MyNewArrayIterator implements IteratorAggregate {
protected $array;
public function __construct(array $array) {
$this->array = $array;
}
public function getIterator() {
foreach ($this->array as $value) {
yield $value['key1'] . '_' . $value['key2'] => $value['count'];
}
}
}
然后你可以这样做:
$myNewArray = new MyNewArrayIterator($myExistingArray);
foreach($myNewArray as $key => $value) {
echo $key . ": " . $value;
}
在您的用例中可能有用,也可能没用。