Ремонт: Ноутбуков, Компьютеров
https://vlab.su/

need some help for ati cards with memory errors for making script
https://vlab.su/viewtopic.php?f=48&t=100822
Страница 21 из 56

ellf32 [ 05 фев 2021, 00:08 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

перекопал всю тему но так и не нашол нигде рабочей ссылки на 5.pmf, ежели есть у кого поделитесь плиз.

Plintus [ 05 фев 2021, 01:01 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

pEEp писал(а):
1 и 2 банки, считая от PCIE - верно!


1-я была дохлая.

Gas_man [ 05 фев 2021, 07:29 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Plintus писал(а):
1-я была дохлая.


Как раз A0! В итоге кто правильно подсказал? DMGG? TSERVER?

Как по этой подсказке

Изображение

ellf32 писал(а):
перекопал всю тему но так и не нашел нигде рабочей ссылки на 5.pmf, ежели есть у кого поделитесь плиз.


Этот образ весит 20 ГБ. Его заливали на торрент. Но сейчас "СИДОВ" и "ПИРОВ" - НЕТ.

Если есть другие варианты, как тебе быстро передать 20 ГБ - пиши.
Перешлю,
Но сутками на раздаче сидеть не собираюсь.

Alex_shmel [ 05 фев 2021, 08:46 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Gas_man писал(а):
Копался с своих старых фотках.
Нашел эту фоткую
Обратите внимание на:
./tserver -test=memfa -stress
Нажмите на это поле, чтобы приблизить изображение.
Изображение
Работает она или нет? (под рукой нет карты AMD для проверки)



сегодня попробую запустить, есть RX 580 "голубая устрица".

ellf32 [ 05 фев 2021, 11:30 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Gas_man писал(а):
Этот образ весит 20 ГБ. Его заливали на торрент. Но сейчас "СИДОВ" и "ПИРОВ" - НЕТ.

Если есть другие варианты, как тебе быстро передать 20 ГБ - пиши.

есть такой файлообменик пишут что до 50 гб - https://dropmefiles.com
моя почта elektron83@gmail.com

Crimfell [ 05 фев 2021, 14:18 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

ellf32 писал(а):
перекопал всю тему но так и не нашол нигде рабочей ссылки на 5.pmf, ежели есть у кого поделитесь плиз.


Она уже не актуальная. Почитайте срй ответ на прошлой странице, это версия самая стабильная. Да, основана как раз на 5.pmf

Alex_shmel [ 05 фев 2021, 15:27 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Gas_man писал(а):
Копался с своих старых фотках.
Нашел эту фоткую
Обратите внимание на:
./tserver -test=memfa -stress
Нажмите на это поле, чтобы приблизить изображение.
Изображение
Работает она или нет? (под рукой нет карты AMD для проверки)


Вот что имеем. Запускал тесты из архива 5.pmf из разных папок. Результат один и тот же:
https://b.radikal.ru/b11/2102/23/99e569618167.jpg
А если сделать так: https://b.radikal.ru/b32/2102/85/25db60c93bb4.jpg
и потом так https://d.radikal.ru/d30/2102/77/1bd9cb6e7069.jpg
то получим результат, как в одном из видеороликов, выложенных китайцем (пингвины, слоны, рыбы и т.д.). Интересно, команды на фотке, выложенной Gas_man, должны были к такому же результату привести?

cxav [ 06 фев 2021, 22:11 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Hi, I have an ASUS RX580 8GB Samsung memory, I typed "python3 ./dmgg.py e0000000 32 8" and got this result :
Цитата:
number of chips is set to: 8
This test is working to detect bad chips. Warning it can give wrong faulty chip number ; only the amount of faulty chips will be good
count the chips counter-clockwise from right to left with pcie near you

chip 7 and/or 8 is faulty at address: 21843968

number of faulty chips= 1
Total bytes tested: 4*16777216
Total errors count: 511 - every 131072.0 OK: 67108353


So only one faulty chip however I don't really know which chip between the 7 and the 8 is dead, how to figure it out ?
Thanks you

tem4ek [ 06 фев 2021, 22:28 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Всем доброй ночи ! А не мог ли кто либо встать на раздачу образа фул версии которая лежит в теме выше..... в торренте с радостью бы выкачал 60гг и пораздавал
Не могу другими тестами проверить память на r9 280x vapor

uncledim [ 07 фев 2021, 00:41 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

cxav

it seems all is ok with memory, try e1000000 start address instead of e0000000

cxav [ 07 фев 2021, 02:54 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

uncledim
It clearly say that there is one faulty chip and it could be 7 or 8, same result with address E1000000, where are located chip 7 and 8 ?
Are chip located like in this picture ?
Изображение
https://imgur.com/a/ftnOcPW

pEEp [ 07 фев 2021, 05:09 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

cxav писал(а):
where are located chip 7 and 8 ?

7+8 = TRUE (like on photo)

anton127 [ 07 фев 2021, 05:45 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Alex_shmel писал(а):
Вот что имеем. Запускал тесты из архива 5.pmf из разных папок. Результат один и тот же:
https://b.radikal.ru/b11/2102/23/99e569618167.jpg


А вы не вглядывались, что у вас не так???
У вас, видимо, процессор амд. тсервер видит 2 карты под тест - потому и не тестирует, что надо карту то выбрать. Надо выбирать ellesmere. Полагаю, pdf почитать, как это сделать.

uncledim [ 07 фев 2021, 10:35 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

cxav писал(а):
It clearly say that there is one faulty chip

"511 errors" often caused by concurrent video-output processes like flashing console cursor or smth like this.
So try test your card being second in system, without monitor attached. Or test with tserver.

cxav [ 07 фев 2021, 13:18 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

uncledim писал(а):
"511 errors" often caused by concurrent video-output processes like flashing console cursor or smth like this.
So try test your card being second in system, without monitor attached. Or test with tserver.

I'm getting this error with "./agt -mem=2000" then "./tserver -boardtest=memfa":
Цитата:
Exception during attempt to execute test: TcoreSilicontarget: Failed to load ME microcode using toollib on Tonga/Ellesmere RF

So I need to use dmgg.py with the RX580 as secondary card ? the issue of this card is a black screen when the driver is loaded in windows.
The issue might not be GDDR5 related ? Is the core okay ? Should I try a core reflow ? Voltage are okay too.
The card came with two missing resitor that I fixed, one behind the 5th ram chip and an other one near the voltage controller, they were probably ripped by the previous owner not carefull with his card...

edit : no error in dmgg.py when nvidia is used as video output card, memory adress was adjusted too, and in tserver I get the same error

uncledim [ 07 фев 2021, 15:05 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

cxav писал(а):
Failed to load ME microcode

It's GPU related error.
Have you tried to run tserver without "mem=2000"? Have you got the same error too?

cxav [ 07 фев 2021, 16:37 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

uncledim писал(а):
It's GPU related error.
Have you tried to run tserver without "mem=2000"? Have you got the same error too?

I just realise that the card works as long as it's not the card that output video, with the nvidia as video output I can use the card (mining :p), I didn't try it at full speed (I'm running now at 1150MHz 0.95v and 2150MHz on the mem) but it works for about an hour now... I don't know what to think about it :/

Plextor [ 09 фев 2021, 12:32 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Дорогие друзья
Имеется rx-580-4g-m - 6 штук, с разными симптомами
На всех картах ситуация следующая:
Тест dmgg не выдает ошибок (на убунту образ с tserver), тот же тест на archlinux - пишет что все чипы неисправны
Tserver не запускается, пишет Failed to load ME microcode (errorid: AK600.001PA)
Что сие значит ? Прочитал выше что GPU беда, так ли это ?

ilie321 [ 09 фев 2021, 13:14 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Try to use rhe full version of tserver from original images 2.pmf i think it was. See if any difference

Crimfell [ 09 фев 2021, 23:53 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Plextor писал(а):
Failed to load ME microcode (errorid: AK600.001PA)

Мое сообщение на прошлой странице. Тест брал в его группе в телеграмме.

kripto.emre [ 10 фев 2021, 00:25 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

R9 270 vram test как я могу проверить

pEEp [ 10 фев 2021, 01:10 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Plextor писал(а):
Что сие значит ? Прочитал выше что GPU беда, так ли это ?

1806v3 пробовали? Если с нее тестить, то работать с "cd 480".
Plextor писал(а):
тест на archlinux - пишет что все чипы неисправны

Значит не в памяти дело.

Симптомы опишите по каждой из 6 карт, а то симптомы разные, а ищите причину по одному сценарию.

TheMArcos [ 11 фев 2021, 05:05 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

привет, rx 580X, у меня была эта ошибка с dmgg.py плохим контроллером памяти?

Изображение

cxav [ 11 фев 2021, 11:52 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

TheMArcos писал(а):
привет, rx 580X, у меня была эта ошибка с dmgg.py плохим контроллером памяти?

Use tserver instead, I got the same type of error on my RX580 with dmgg.py using nvidia card as video output if I remember correctly.

Вместо этого используйте tserver, я получил тот же тип ошибки на моем RX580 с dmgg.py с использованием карты nvidia в качестве видеовыхода, если я правильно помню.

acidwise [ 11 фев 2021, 16:20 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Здравствуйте.
Имеется R9 290 (GV-R929OC-4GD) изначально с гнутым текстолитом и артефактами, проблемные связи (чипы памяти) корректно определены последней версией dmgg.py. Текстолит выпрямлен, один чип памяти заменен и еще 2 отреболены. Ошибок больше не обнаруживается, но драйвер все равно падает (BSOD - ребут по кругу). Для теста на расчетных частотах поставил tserver из usb1804v3. Тест из папки 390 отказывается работать:
[info] Kernel: Linux 5.4.0-52-generic #57~18.04.1-Ubuntu SMP Thu Oct 15 14:04:49 UTC 2020
[info] CPU System Physical Memory: 12GB
[info] Virtual Memory: 11GB
[info] MSR_lin: Could not open MSR device file (/dev/cpu/0/msr):
[info]    No such device or address
[info] Device not supported with current TCore config

Путь /dev/cpu/0/msr в системе присутствует. Что там должно быть? Должен ли работать с такой картой тест для 590? Сейчас он показывает FAIL, но с причиной пока не разобрался - непонятно, запускается ли он вообще.

Стенд LanParty X58-T3H6, Core i7-920.

anton127 [ 11 фев 2021, 17:37 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Тест 590 работает только с 470-490 и 570-590.

acidwise [ 11 фев 2021, 18:16 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Продвинулся дальше. Против
Цитата:
[info] MSR_lin: Could not open MSR device file (/dev/cpu/0/msr):
помогла команда modprobe msr
Дальше уперся в следующую проблему:
<Msg type="error">Failed to allocate 16384 bytes contiguous physical memory; please configure /etc/default/grub and run update-grub</Msg>
  <Msg type="error">TCore Exception: ASIC_QUIETDOWN_RBBM exceeded maximum number of register reads</Msg>
Тут стоит отметить, что загрузки сразу не было, восстанавливал из boot-repair-disk-64bit.iso . Похоже, что-то пошло не так и настройки grub слетели. Перешел на версию от Mafiya67.
От этого стало, правда, только веселее. memfa на 150 МГц без ошибок, после agt до 1250 МГц вылезло следующее:
testid.log:
./tserver-exec -cf=tserver.cf -cf=NEW -boardtest=memfa (2021-02-11T19:51:20+00:00)
AK600.001  [1]    Fail   190.609 sec.
ERROR: TCore: Timeout waiting for timestamp, exceeded 180 seconds
ERROR: TCore Exception: Timeout waiting for timestamp
ERROR: Max Temperature Limit Exceeded: 511.0 °C / 100.0 °C
DONE 2021-02-11T19:54:31+00:00

results.xml:
  <Test time="19:51:20.860" id="AK600.001" alt="McMemfaTest">
    <Run time="19:51:21.133" device="1" result="fail" elapsed="182583">
      <Msg type="info">gpu:Hawaii Start Peak Temperature: 90.0°</Msg>
      <Msg type="info">gpu:Hawaii Start Current Temperature: 90.0°</Msg>
      <Msg type="info">gpu:Hawaii Start Peak VDDC: 6.0 Volt</Msg>
      <Msg type="info">gpu:Hawaii Start Current VDDC: 1.0 Volt</Msg>
      <Msg type="info">gpu:Hawaii Start Peak MVDDC: 0.0 Volt</Msg>
      <Msg type="info">gpu:Hawaii Start Current MVDDC: 0.0 Volt</Msg>
      <Msg type="error">TCore: Timeout waiting for timestamp, exceeded 180 seconds</Msg>
      <Msg type="error">TCore Exception: Timeout waiting for timestamp</Msg>
      <Msg type="info">gpu:Hawaii End Peak Temperature: 511.0°</Msg>
      <Msg type="info">gpu:Hawaii End Current Temperature: 511.0°</Msg>
      <Msg type="info">gpu:Hawaii End Peak VDDC: 6.0 Volt</Msg>
      <Msg type="info">gpu:Hawaii End Current VDDC: 1.0 Volt</Msg>
      <Msg type="info">gpu:Hawaii End Peak MVDDC: 0.0 Volt</Msg>
      <Msg type="info">gpu:Hawaii End Current MVDDC: 0.0 Volt</Msg>
      <Msg type="error">Max Temperature Limit Exceeded: 511.0 °C / 100.0 °C</Msg>

Что я делаю не так?

BIOS оригинальный, прошит с techpowerup. Оплавления чипа, конечно, не произошло... Показания датчиков явно неверные. Карта стоит второй, изображение с GT 640.
---------- Добавлено спустя 47 минут 11 секунд: ----------
acidwise писал(а):
Карта стоит второй, изображение с GT 640.
Похоже, проблема в этом. Оставил одну карту:
./tserver-exec -cf=tserver.cf -cf=NEW -boardtest=memfa (2021-02-11T20:51:10+00:00)
AK600.001  [1]    Pass    10.370 sec.
DONE 2021-02-11T20:51:24+00:00
<Msg type="info">gpu:Hawaii Start Peak Temperature: 82.0°</Msg>
      <Msg type="info">gpu:Hawaii Start Current Temperature: 82.0°</Msg>
Охлаждение временное, радиатор и правда горячий. Тест memfa пройден на 150, 500 и 1250 МГц. После перезагрузки система запустилась (райзер 1x), буду собирать и наблюдать дальше.

TheMArcos [ 12 фев 2021, 00:33 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

is there a tserve tutorial in english?

есть ли учебник по tserve на английском языке?

Gas_man [ 12 фев 2021, 21:09 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Раз эта тема посвящена диагностированию банок (чипов) памяти GDDR5 для видеокарт.
Решил выложить тут информацию, которая мне помогает понять в каком состоянии демонтированная память с доноров.
Замеры для банок SAMSUNG сделана мною.

Изображение

Замеры для банок HYNIX взята с каналов телеграмм от МИХЕЯ (вроде от @Mihey3)

Изображение

Данные замеры сделанные с доноров, запустили карту и держали частоты в разгоне в плоть до 1980МГц
Делала замеры "Падения напряжения - прозвонки" "Черный щуп" - "-" "Красный щуп" - "+"
У кого есть какие замечания и уточнения.
Прошу сделать указанные замеры на новых чипах памяти и выложить значения.

uncledim [ 12 фев 2021, 21:54 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Gas_man писал(а):
У кого есть какие замечания и уточнения.

хорошо бы при публикации показаний диодной прозвонки указывать ток прозвонки используемого тестера (они вообще-то бывают разные, да)

Страница 21 из 56 Часовой пояс: UTC + 4 часа
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/