После апдейта 0.5-54 увеличелось потребление карт

Добрый день.

В соответствии с Changelog в версии 0.5-54 изменился подход к даунвольтингу.

Огромным бенефитом этого апдейта для меня стало то, что за двое суток у меня на 3 ригах под управлением HiveOS не было ни одной перезагрузки, что до обновления казалось невозможным. Причем эти карты всегда подглючивали и в SimpleminingOS и в HiveOS и в чистой Ubuntu вне зависимости от настроек даунвольтинга, ASIC quality или позиции в риге.

Однако, не обошлось и без ложки дегтя. После этого обновления риги стали потреблять ~ на 10-12% больше.

При чем, если смотреть на потребление карт, то наблюдается странная картина: потребление по ядру последних 3 карт в ригах (всего в ригах по 7 карт) прыгает до 123W, а первых четырех максимум до 96W. Что наводит на мысль, что новые настройки применены не ко всем картам. Утилиты же выдают для всех карт идентичную информацию о текущих частотах и вольтаже.

Если бы последние 4 карты потребляли так же как первые 3 — было бы просто замечательно.

P.S. До обновления все 7 карт имели одинаковое потребление.

Карты: Sapphire Nitro + RX570 4Gb Elpida
Карт в риге: 7
Алгоритм: CryptoNight
Майнер: sg-miner


Hi there.

According to the changelog in the version 0.5-54 the core undervolting approach has been changed.

A huge benefit of this update for me is that for last two days there was not a single reboot on any of my 3 rigs under HiveOS, which before the update seemed to be impossible. Moreover, these cards have always random fails on SimpleminingOS, HiveOS and on pure Ubuntu as well despite of overclock settings, ASIC quality or position in the rig.

But there is a fly in the ointment. After update the rigs began to consume approx. 10-12% more power.

If we look at the rig’s page we can see the following: the consumption of the core of the last 3 cards in the rig (there are 7 cards in the rig in total) jumps up to 123W but the first 4 cards have their wattage jumps maximum to 96W. Which suggests that the overclock settings are not applied to all of the cards. At the same time Linux utilities provide identical information for all of the cards about the current frequencies and voltage.

It would be perfect if the last 4 cards consume the same power as the first 3.

P.S. Before this update all of the 7 cards had the same wattage.

Cards: Sapphire Nitro + RX570 4Gb Elpida
Cards in the rig: 7
Algo: CryptoNight
Miner: sg-miner

Before the update, the undervolt didn’t really work - now it does. You must reapply it and watch for instability. Start with 1150MHz/950mV and work your way down.

What does mean “didn’t really work”? How did it work not really? )))

I’m satisfied with my current settings. I just do mention that my settings are not applied to the all of the cards in the rig.

Just for example

duplicate removed

Программмно даунвольт не работал на напряжениях ядра ниже 1В … ну может 950мВ.
На картах 5хх серии это было не так заметно благодаря лайф-хаку с MDPM = 1
Карты же 4хх серии потребляли значительно больше в сравнении с Windows например при тех значениях “даунвольтинга”.
Пользователи линукс как правило для достижения показателей использовали даунвольтинг через биос. С одной стороны это давало результат, с другой было не универсально, так как любое изменение требовало бы перепрошивки биос. На таких биос или не частично измененных в эту сторону как раз и возникают проблемы при программном изменении, которое появилось в 54 версии.

Понимая, что часть пользователей уже решило свои вопросы по потреблению другими способами думаю прийдется сделать вилку ввиде опции в АМД ОС - “как было” и “таблетка”.

У меня BIOS с зашитыми значениями по даунвольтингу. Я уже подзабыл реальную причину, зачем это было сделано так. Спасибо, что напомнили.

Но речь, все же, вот о чем: при том, что BIOS на всех GPU один и тот же, настройки так же общие, карты ведут себя по-разному.
Это четко видно на скриншоте:

Первые 3 карты потребляют ожидаемо, оставшиеся (неважно 4 или 2) — нет.

Show me your overclock settings from the web dashboard and the result from “amd-info”, please.
If I understood you correctly - you have a voltmodded bios. Redo your bios mod, this time only with custom straps.

Yea, you got it right. An I did it 5 minutes ago. The result is absolutely the same.


Sun Jun  3 10:08:22 CEST 2018

=== GPU 0, 01:00.0 /sys/class/drm/card1 ===
Adapter 0: Device 67df
  Core: 1244 MHz, Mem: 2000 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 51 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 2000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 1 MEM 2000Mhz 		PWR 71.209 W

=== GPU 1, 02:00.0 /sys/class/drm/card2 ===
Adapter 1: Device 67df
  Core: 1244 MHz, Mem: 2000 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 52 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 2000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 1 MEM 2000Mhz 		PWR 94.200 W

=== GPU 2, 03:00.0 /sys/class/drm/card3 ===
Adapter 2: Device 67df
  Core: 1244 MHz, Mem: 2000 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 50 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 2000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 1 MEM 2000Mhz 		PWR 72.153 W

=== GPU 3, 06:00.0 /sys/class/drm/card4 ===
Adapter 3: Device 67df
  Core: 1244 MHz, Mem: 2000 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 49 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 2000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 1 MEM 2000Mhz 		PWR 74.207 W

=== GPU 4, 07:00.0 /sys/class/drm/card5 ===
Adapter 4: Device 67df
  Core: 1244 MHz, Mem: 2000 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 52 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 2000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 1 MEM 2000Mhz 		PWR 97.214 W

=== GPU 5, 08:00.0 /sys/class/drm/card6 ===
Adapter 5: Device 67df
  Core: 1244 MHz, Mem: 2000 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 51 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 2000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 1 MEM 2000Mhz 		PWR 127.240 W

=== GPU 6, 09:00.0 /sys/class/drm/card7 ===
Adapter 6: Device 67df
  Core: 1244 MHz, Mem: 2000 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 47 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 2000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 1 MEM 2000Mhz 	

That’s partly good because you will not need voltmod from now on. :slight_smile:
Your cards are using memstate #1, but you apply the overclock to #2. Can you try MDPM 1 or restore the default 1000MHz frequency of #1 and reflash the bios back?
Are you sure that the power draw is actually higher? It could be a sensor misreporting, AMD cards are really inaccurate when reporting their power draw.

The first amd-info was from the rig with voltmodded BIOS.

Here is amd-info from the rig with original BIOS with last 2 straps modified and last memory state frequency. Voltage is original.


Sun Jun  3 11:46:40 CEST 2018

=== GPU 0, 01:00.0 /sys/class/drm/card1 ===
Adapter 0: Device 67df
  Core: 1244 MHz, Mem: 1980 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 53 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 1000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 2 MEM 1980Mhz 		PWR 74.1 W

=== GPU 1, 02:00.0 /sys/class/drm/card2 ===
Adapter 1: Device 67df
  Core: 1244 MHz, Mem: 1980 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 50 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 1000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 2 MEM 1980Mhz 		PWR 84.85 W

=== GPU 2, 03:00.0 /sys/class/drm/card3 ===
Adapter 2: Device 67df
  Core: 1244 MHz, Mem: 1980 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 48 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 1000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 2 MEM 1980Mhz 		PWR 74.19 W

=== GPU 3, 06:00.0 /sys/class/drm/card4 ===
Adapter 3: Device 67df
  Core: 1244 MHz, Mem: 1980 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 48 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 1000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 2 MEM 1980Mhz 		PWR 71.197 W

=== GPU 4, 07:00.0 /sys/class/drm/card5 ===
Adapter 4: Device 67df
  Core: 1244 MHz, Mem: 1980 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 52 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 1000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 2 MEM 1980Mhz 		PWR 87.65 W

=== GPU 5, 08:00.0 /sys/class/drm/card6 ===
Adapter 5: Device 67df
  Core: 1244 MHz, Mem: 1980 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 50 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 1000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 2 MEM 1980Mhz 		PWR 118.132 W

=== GPU 6, 09:00.0 /sys/class/drm/card7 ===
Adapter 6: Device 67df
  Core: 1244 MHz, Mem: 1980 MHz, CoreOD: 0, MemOD: 0, Load: 100%, Temp: 47 C, Fan: 40%
  Core clocks: 300 1244
  Memory Clocks: 300 1000 1980
manual 	DPM 1 CORE 1244Mhz V 900	MEMSTATE 2 MEM 1980Mhz 		PWR 85.138 W

Yes I’m quite sure because each rig is plugged to the smart outlet with consumption meter + I use classic watt meter.

Regarding sensor inaccurate behavior. Before update all cards visually behaved identically.

No idea then, sorry. Try changing the voltage up or down and see if it changes the power draw on the affected cards.

Anyway, thanks for assistance. Hope you will find this bug someday. Regardless to this matter I’m happy because of increased stability for not so much price.