駄文。

プログラマーの日常でつまずいたこと・気づいたことなどの記録です

Threadripper Proでサーバを作ってみた

ディープラーニングの評価でメモリ、GPUの要求が厳しくなってきてついに、ワークステーションクラスのマシンを構築しました。

最近流行りのChatGPTに始まるLLM(Large Language Model)は本当にリソースに優しくない。 流石に自宅でChatGPTレベルのものは稼働できないけど、OSSで出ているChatGPTもどきはなんとか色々工夫すれば動くことが 見えてきた。

とはいえ、vramは24Gクラスはないとまともなスピードで動かない。ではどのくらいのGPUが必要かとというと、RTX 3090 / 4090クラスが必要なんだよね。いわゆるコンシューマ機の最上位機種。 こだわらなければ、マイニングのお下がりが今なら格安で手に入るので RTX3090はおすすめかも。

RAMもそれなりに必要なので、最近はPCだと上限が128Gですが、ワークステーションクラスであれば PC用の安価なunbufferedなUDIMMを使っても256Gまで実装できるし、 まぁないけど、RDIMMを使えば上限2Tまで実装できるらしい。

ということで中古でいいマザー(ASUS PRO WS WRX80E-SAGE WIFI)見つけたので組み立ててみたらいきなり動かない。

マザーボードのQ-Codeの起動処理診断コードはなんと 00。マニュアル見ると示す意味は undefined だと。 なお、診断用のLEDはメモリチェックが光っている状況。

うーん、とりあえずメモリ1枚挿しで確認してみる... 状況変わらず ググる... どうやら 00は実際に世の中ではみられる現象らしい。どうもCPUの認識前で発生しているらしい。

そういえば、今回のCPUは 5955wxで3000番台の互換の後継機種CPU。 もしかすると、マザーボードは意外に古いのかも(30x5wxが出てた当時にリリースされたものか?)

bingo!

HP上のボード紹介は 59xxもサポートと書いているがBIOSの新しいもの(ver1003@2022/3月版)でサポートになっている。 当然、マザーボードBIOSは古い(マザーの発表時期のもの = ver 0211 @ 2020/12月版、当然2022年に発売された5000番台のCPUはサポートされないのだ)ので動かないわけだ。

なんか、以前 5950xでPC組んだ時も同じ話があったなぁ。あの時はショップが親切で5900番台CPUを 使用する時はBIOSアップデートしてね(このボードはCPUなしでBIOS更新もできるよとも書いてて)安心して購入していたんだけどね。

流石に中古で買うマザーボードにそこまで期待しちゃダメだね。

ということで早速BIOSアップデートについてASUSのHPで調べる。 あれ、もしかしてこのマザーボード CPUなしでBIOS更新できないの?

やばい、詰んだかも。

こんな時はサポートに電話。ASUSに電話すると代理店で聞いてとあっさりした応対。 で代理店に電話したら、やっぱりないという話。

やっぱり詰んだ。

マザーを買うか、CPUを買うか。どうしようと無駄に悩んでいたら先ほどの代理店から 折り返しの電話があり、あの後もう少し調べてくれたようでマニュアルにはないが、 CPUなしでBIOS更新できる BIOS Flashback機能が搭載されているとのことで そちらで更新可能ということを教えてもらった。

神様はいた。

ということで、無事BIOSアップデートして今、動くワークステーションが出来上がった。

いやぁ、ヒヤヒヤした。

あ、実はラックマウント用のレールスライドは型番間違って書い直しになったのは ちょっと秘密。

同じ4Uのケースなのに必要なレールスライドが違うって、気が付かないよねw

--

本当にBIOS Flashback機能って隠しだったのか?という疑問が頭をよぎり(だって堂々とバックパネルにボタンがあるんだから)、 もう少し、HPやマニュアル見返してみた。

いやぁ、まいったHPに堂々と書いてますね。目玉機能の一つにもなっている(かなり後ろに書いてますが、CPUメモリなしで更新可能ともしっかり書いてましたw) マニュアルにもしっかり書いてました。(BIOS更新の章ではなく、独自に前に説明が書いてありましたw) BIOSマニュアルって出ているのに、そっちには記載なし。

うーん、機能はありがたいが、もう少しマニュアルは丁寧にあって欲しかった。

結果、ちゃんと書いてありました。しっかり調べましょう>自分。