Dell PowerEdge R620 のセットアップにまつわる騒動

ヤフオクで中古のDellサーバ PowerEdge R620を購入した。

目的はCMLを使うことである。

今は自宅のWindowsPCで動かしているが、ややスペック不足なのと、

外部から常にアクセスできるようにしておきたいと思った。


スペックは

メモリ32GB

ディスクは900GBが2個

CPUはXeonの8coreのが2個


ディスプレイ出力がVGAなのでVGA-HDMI変換アダプタを買った。

単なる形状変換ではなく、8000円ほどした。

HDMIインターフェースからVGAに出力するケーブルは2000円弱で売っていて、

最初はそれを買ってしまった。

買ってから箱に「VGA -> HDMI の変換はできない」と書いてあることに気づいた。

そんなバカなと思いつつ開封してつないでみたが、

つなぎながら、『でもわざわざ箱に書いてあるくらいだからダメなのかな』と思い始め、

やはりダメだった。

(このVGA-HDMI接続がトラブルの発端であった...)


変換アダプタとVGAケーブルを買ってHDMIのモニタにつないで起動する。

しばらく何も表示されない。1分や2分ではなかった気がする。


Dellのロゴが表示される。BIOS Setupとかに入れる画面だ。

OSは消去済みとは聞いていたが、とりあえずそのまま起動させてみる。


ロゴが消えるとまたしばらく真っ暗になる。

やはり数分待つと、system initialization(うろ覚え)

みたいな文字が表示される。


それが消えて、どうなったか忘れたが、

OSがないとかどうとか何も表示されなかった気がする。


いったん再起動してBIOSセットアップを起動して、

メモリが32GB認識されていること、

ディスクが2個認識されていることなどを確認。


外付けDVDドライブをUSBポートに接続し、

BIOS設定でブートデバイスのトップをDVDドライブにする。

ESXiのインストールディスクをDVDに焼いてセットし再起動する。


再起動は時間がかかったがESXiのインストーラが起動しインストールが始まった。

が、ディスクを選ぶところで何も出てこない。


ESXiが7.0.0だったので、古いRAIDコントローラを認識しないとかいう問題かと思い、

(そういう経験があった)

centosのインストーラを起動してみたが、同様にディスクを認識しない。


そうこうしているうちに、再起動しても画面が真っ暗な状態で何もでなくなってしまった。

Dellのロゴも出ないし、initializationがどうのこうのも出ない。


キーボードで ctl+alt+delを押すとリブートする。

リブートしていることは筐体前面にある小さなLCDに「system is rebooting....」とか表示されるのでわかる。

即リブートするので、システムがハングアップしているという感じではない。


筐体前面のディスプレイの横にボタンがあり、

iDRACというポートのIPアドレスが設定できることがわかったので設定してアクセスしてみた。


ブラウザでアクセスでき、ユーザ認証があるがデフォルト設定で入れた。

その管理画面で見る限りは特に異常はなさそうだ。


いったん電源を落とし、コンセントも抜いて、

メモリを外して付け直した。


8GBのメモリが4枚入っている。

メモリ装着スロットが24スロットもある。

そのうちの4つを、とびとびに使用している。

未使用のスロットにはフィラーのようなものがついている。


CPUは確かに2個ついている。


NICのポートが4つある。

そんなにいらないが...


WEBで軽く調べた結果、どうもPOSTで失敗しているようだ。

(実はそうではなかったのだが)


メモリか、ディスクか、CPUか、マザーボードか....

故障しそうなのはディスクかメモリだが、

挙動からしてもっと根幹がイカれている感じがする。


POSTしてるなら「POSTしてます」みたいなメッセージを出せよ、そもそも。

で、失敗したら「何のPOSTで失敗しました」と出せよ。


そういうのも出せないところで失敗しているのか...

でも、最初になんとか起動していた時は何も出なかった。


3万円だからな...

安いなとは思ったのだが...


4枚ついているメモリを1枚だけ残し、2台ついているHDDを外して起動したが、

挙動は変わらず。

外したデバイスが原因ではないということだ。

(もしかしたらそれらも故障しているかもしれないが、それが原因で起動できないのではない。)


残るは、メモリ1、CPU1、CPU2、マザーボード、電源、RAIDコントローラ、NIC、か。


NICがだめでも起動はするだろう....

ディスクが選べなくても起動はしたからRAIDコントローラも違うかな...


ディスクはiDRACで見ると物理的には認識していたのだが、

iDRACで設定を消そうとしたりしていたら物理的にも見えなくなってしまった。


iDRACで接続できるので動いていることは動いていると思っていたが、

iDRACは電源オフの状態でも電源ケーブルが接続されていればアクセスできて、

要はリモートから電源のオフだけでなくオンもできるという機能であった。


電源オフでもアクセスできるのだから、

iDRACに接続できてもあまり意味がない。


あとできることは...

・マザーボードの外観チェック(コンデンサが破裂してないかとか)

・まだ外してないメモリを外して残り3枚のメモリ1枚ずつで起動してみる

・マザーボードの電池を交換してみる

・NVRAMクリアしてみる

・CPUを1個ずつにして起動してみる


すぐにはできないが...

・メモリを別のPCにさしてみる

・CPUを別のPCにさしてみる

・マザーボード交換

・電源ユニット交換


ヤフオクなんかじゃなくてotto認定中古品とかを買えばよかったかなと思う。

同等品は10万円くらいする。



翌朝。


カバーを開けて破裂や液漏れしているコンデンサはないか見てみる。

内部は非常にきれいで、ホコリや汚れもほとんどなく、部品が壊れている形跡はない。

メモリスロットの番号を見て、A1が一番端ではないことに気づいた。

この前1枚だけさして起動したのはB1だった。

A1だけにさして試すがやはり画面に何も表示されない。


シャーシのカバーを開けて起動して確認していた。

「カバーを開けたまま5分以上運用するな」と書いてあったので、

『ということは開けたままでも動くんだな』と思って。


前面LCDに「intrusion detected」というメッセージが出るので

もしかしてカバーをつけないと起動しないのかと思いカバーをするが同じ。


再びカバーを外して起動する。

すると、シャーシの真ん中あたりにある小さなLEDが点滅しているのに気付いた。


調べるとRAIDコントローラだった。

これか!とほとんど確信して外して起動してみるが、同じ。

外すときにロックしているプラスチックの部品が折れてしまった。

付け直して起動する。


CPUを1個外してみようかと思いドライバーでカバーを止めている2本のねじをゆるめて

カバーを外してみる。グリスもついているし、どうしてもCPUだとは思えず、

カバーを戻す。


また電源を入れてiDRACを見る。


「仮想コンソール」みたいな機能があって表示するとファイルがダウンロードされてしまうので見ていなかったのだが、調べると何かの設定を「html」にするとブラウザで開けるとのことだった。

htmlにしてコンソールを表示してみると....


普通に起動している!


OSがないというメッセージが出ている。


試しに再起動したら、Dellのロゴも表示されるし随時メッセージも表示される!


何も問題なく起動している!!!


ディスプレイに表示されていないだけだった!!!!!


なんだろう?


サーバのVGA機能がおかしいのか、VGA-HDMI変換アダプタがおかしいのか。

一時は表示されていたから、それはないと思っていたのだが.....


メモリ、RAIDコントローラ、ディスク等全部つけて起動する。

BIOSセットアップ画面に入って状態を見る。


全部問題ない。


起動させると「virtualディスクがないけど設定しますか」

みたいなメッセージが出てyesとか答えるとユーティリティが起動する。


よくわからなかったがほとんどデフォルト設定のまま、

RAID 0でディスクを作り「初期化する」だけを有効にする。


作成後、ユーティリティを終了する方法がわからず、

ctrl+alt+deleteで再起動する。


iDRACで(仮想)ディスクができたことを確認



ESXiのインストールも無事に完了し、

CMLの仮想マシンも動いた。


CML起動後の初期画面でなぜかEnterが効かないのだが....

まあこれは大した問題じゃないでしょ。



というわけで、PowerEdgeはiDRACが使えれば、

ディスプレイもキーボードもつけずにセットアップできるということがわかった!!


VGAからモニタに映せない理由は不明だが、もうどうでもいい....