如何解决没有响应/失败的bosh-lite云代工vms



我正在(尝试!)在MacBook Pro上使用bosh-lite学习Cloud Foundry。我设法让它运行起来,但每次从零开始后,它都会停止工作,我怀疑这与停止[virtualbox]虚拟机/让笔记本电脑进入睡眠状态有关,但无法确认是否确实如此。

我的经验有限,我不仅在解决问题方面遇到了困难,而且在理解问题所在方面也遇到了困难。如果这是一个明显的问题,我很抱歉,但我还无法清楚地确定如何阻止这个问题的发生,到目前为止,我唯一的解决方案是使用Vagrant破坏部署,然后从头开始-这需要一段时间,我相信这不是最佳的解决方案。:)

我注意到"bosh-vm"显示代理没有反应,而且他们没有正确地盯着。bosh cck中的错误表明存在锁定问题,但我怀疑这可能是用词不当,因为运行bosh锁表明没有锁。再说一次,我是一个新手,所以这可能只是一个误解。。。

救命-我该怎么解决这个问题!!有没有一种方法可以快速"重置"到工作状态?(流浪者重新加载——规定没有帮助)问题究竟在哪里?

此外,流浪cloudfoundry/bosh-lite虚拟机的(默认)根密码是什么?

> bosh vms
+---------------------------------------------------------------------------+--------------------+-----+-----------+--------------+
| VM                                                                        | State              | AZ  | VM Type   | IPs          |
+---------------------------------------------------------------------------+--------------------+-----+-----------+--------------+
| api_z1/0 (8dfeb143-59b1-46dd-9482-e90931a70a0d)                           | unresponsive agent | n/a | large_z1  | 10.244.0.138 |
| blobstore_z1/0 (7795ce02-d64e-4cc7-be1e-0e328384d568)                     | unresponsive agent | n/a | medium_z1 | 10.244.0.130 |
| consul_z1/0 (e92f6bfd-f623-4ba4-abf3-3d4baa0953fa)                        | unresponsive agent | n/a | small_z1  | 10.244.0.54  |
| doppler_z1/0 (049eaa18-3d4f-48d8-92ed-ea4b6a20cd29)                       | unresponsive agent | n/a | medium_z1 | 10.244.0.146 |
| etcd_z1/0 (e45a7648-e43d-4753-8a18-3ab21b86293d)                          | unresponsive agent | n/a | large_z1  | 10.244.0.42  |
| ha_proxy_z1/0 (ba6e8ce6-8f40-4868-8a71-c74119f173ea)                      | failing            | n/a | router_z1 | 10.244.0.34  |
| hm9000_z1/0 (ff8ae6a3-1889-4fb0-aabf-072012cf9f48)                        | unresponsive agent | n/a | medium_z1 | 10.244.0.142 |
| loggregator_trafficcontroller_z1/0 (8f2e4ea1-dda7-4d15-9050-528338824e3b) | unresponsive agent | n/a | small_z1  | 10.244.0.150 |
| nats_z1/0 (9e4eab32-ac91-4f05-83be-b8189c2991e7)                          | unresponsive agent | n/a | medium_z1 | 10.244.0.6   |
| postgres_z1/0 (fb8d1eee-3ade-480e-aa01-3db26a64b447)                      | unresponsive agent | n/a | medium_z1 | 10.244.0.30  |
| router_z1/0 (f9ce017b-580f-4fce-b79d-01ceef190e19)                        | unresponsive agent | n/a | router_z1 | 10.244.0.22  |
| runner_z1/0 (c0b0871b-c672-46c8-ac4a-1aabd81864f6)                        | unresponsive agent | n/a | runner_z1 | 10.244.0.26  |
| uaa_z1/0 (63b4bfa7-499d-4dba-93f6-2017b04a7588)                           | unresponsive agent | n/a | medium_z1 | 10.244.0.134 |
+---------------------------------------------------------------------------+--------------------+-----+-----------+--------------+

> bosh cck
Acting as user 'admin' on deployment 'cf-warden' on 'Bosh Lite Director'
Performing cloud check...
Director task 96
Error 100: Unable to get deployment lock, maybe a deployment is in progress. Try again later.
Task 96 error
For a more detailed error report, run: bosh task 96 --debug
> bosh locks
Acting as user 'admin' on 'Bosh Lite Director'
No locks

可以使用下面的命令进行"重置"并重新启动和运行,但这需要相当长的时间,而且肯定比所需的更像是一把"锤子"!

# bosh-lite dir 
vagrant destroy && vagrant up
# cd cf-release dir 
bosh upload release
bosh deploy 
# cd bosh-lite dir
bin/add-route
cf api --skip-ssl-validation https://api.bosh-lite.com
cf create-org my_org
cf create-space development -o my_org

您可以在使用vagrant ssh登录到bosh-lite虚拟机后使用sudo su成为root用户,而无需输入root密码。

BOSH lite在虚拟机重新启动/休眠后总是很难复活
最近有人(2016年12月)写了一个实用程序,"优雅地让运行BOSH Lite的机器进入睡眠状态",并在系统唤醒时恢复它,以解决这个问题:https://github.com/henryaj/ambient

我通常先执行vagrant suspend,然后执行vagrant up,以避免BOSH Lite中出现容器/VM失效的情况。

您可以执行bosh cck,但我的经验表明,简单的部署重新创建要快得多,也更可靠。

建议在Bosh-lite虚拟机未使用时暂停它,以便在系统进入睡眠/重新启动后恢复;否则虚拟机将被操作系统暂停(Bosh-lite虚拟机进入中止状态)。在中止的bosh-lite上运行vagrant up,使其运行,但在这种情况下,CF虚拟机将处于无响应状态,需要重新部署。

在暂停时运行vagrant suspend,在重新启动工作时运行vagrant resume有助于避免CF VM无响应的情况。

最新更新