Ремонт: Ноутбуков, Компьютеров https://vlab.su/ |
|
need some help for ati cards with memory errors for making script https://vlab.su/viewtopic.php?f=48&t=100822 |
Страница 4 из 56 |
Gas_man [ 26 авг 2020, 12:53 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Mafiya67 писал(а): А у Вас при этом изображение во время теста в цветную кашу не превращается? Да, бывало такое, только не на этих картах. Особенно такое происходит когда загружаешь на 1мб, а 10мб и более. На первой или второй странице этой темы уже такая картинка встречалась |
galkinvv [ 26 авг 2020, 14:26 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Conqueror писал(а): Я правильно понимаю, что ваш скрипт для АМД (обсуждаемый здесь) - также не запускает карту в 3D turbo режим, и тестирование происходит на минимальных (2D) частотах? Вцелом да, правильно - частоты поднимает только драйвер. Для тестирования памяти на высоких частотах после установки драйвера есть следующие подходы: 1. Ставим драйвер. Будь то windows или linux, подход одинаковый. 2. Переключаем карту в режим производительности - или через натсройки драйвера, или, если не каршится, запустив фурмарк или другое 3d-приложение. Чтоб частоты на следующем этапе был высокие.
Если на одном из предыдущих этапов получится адрес - то его надо как-то конвертировать в модуль памяти. Для rx470-580 - это делается также как и с адресом физической памяти - viewtopic.php?p=775703#p775703 Для других карт с 2-4-8 гигами обычно тоже простое правило получается. А вот для карт с некратным количеством памяти в 6 ГБ - такого красивого отображения адресов получить не удалось. Там даже если на жанном этапе получится адрес - как его сконвертировать в модуль памяти - неясно. Только физический вариант: "поставьте щуп мультиметра на зачищенную сигнальную дорожку данных между gpu и памятью. Он будет давать слабые помехи, изредка приводящие к ошибкам. Если утилита умеет отображать адреса с ошибками - так можно оценить, какие адреса соотвествтуют модулю, на дорожку которого приложили щуп". При малом числе ошибок и устанавливающемся драйвере на практике данный вариант ни разу не применял. Mafiya67 писал(а): @galkinvv, подскажите, дальнейшее совершенствование скрипта с Вашей стороны будет?) или текущая версия итог? Текушую версию в https://github.com/galkinvv/galkinvv.gi ... em-test.py уже около года не менял, пока не планирую. По сути единственное, что добавил по сравнению с 2018 (только что залил) - отображение диапазонов адресов, где ошибок НЕТ (раздел noerr_big+). Я по большей части рассказываю о принципах тестирования памяти, а скрипт, лично меня и в текущем виде устраивает (максимально гибкий вариант, а найти модуль по таблице особо не проблема). Короче, вариант только если есть время и желание исследовать, понять и разобраться, и потом быстро применять на практике, а не сразу быстро применять на практике) Отмечу, что уважаемые ilie321 и suhar777777 сделали/делают более автоматизированный вариант с именем dmgg. Gas_man писал(а): ilie321 писал(а): Также большую часть времени вы получаете 2 диапазона адресов для карты. В одном диапазоне у вас нет доступа, и он дает неисправность всей микросхемы У меня возникли трудности в понимании того что перевел переводчик. Предполагаю, что ilie321 имел ввиду что в выводе lspci -v несколько строк, надо выбирать ту у которой наибольший объём отображённой памяти. Например: Код: Выделить всё 04:00.0 VGA compatible controller: NVIDIA Corporation GM200 [GeForce GTX 980 Ti] (rev a1) (prog-if 00 [VGA controller]) |
ilie321 [ 26 авг 2020, 14:41 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
galkinvv писал(а): Предполагаю, что ilie321 имел ввиду что в выводе lspci -v несколько строк, надо выбирать ту у которой наибольший объём отображённой памяти. Например: Galknivv maybe you can tell what is the correct procedure to test and what to expect in different situations For example Card is good =script will fail to give good card Card is second in system and display is on first good card =... Cover all tou know |
galkinvv [ 26 авг 2020, 15:03 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
ilie321 писал(а): Galknivv maybe you can tell what is the correct procedure to test and what to expect in different situations For example Card is good =script will fail to give good card Card is second in system and display is on first good card =... Cover all tou know I wrote about this in russian here - viewtopic.php?p=796659#p796659 (forum is a bit broken, its my last message on page3, you may need scroll up a bit) Since Google translate isn't good, here are main points formulated in English: Unfortunately I DON'T know myself how to make "stable" testing for many situations. I have only some ideas that sometimes works. The main problem for bad-memory-cards: if card is not inited - memory cannot be tested. Initing is done by BIOS at start or by amdgpu during linux load. Sometimes initing itself hangs system. No solution for such situation( MATS also don't work on non-inited nvidia cards. For working cards the sitaution is different: if driver is used to init memory - after driver successfull load it is problematic to access the same memory in a raw way. Well, testing raw memory access for cards that accepts driver is not very useful. Such cards should a better to be checked with high clocks via opencl api. List of initing methods to try:
With good cards that accepts driver - attach monitor, load linux with amdgpu framebuffer, prss enter many times to move cursor to the bottom of screeen, use Код: Выделить всё MEM=fb0 python3 /path/to/direct-mem-test.py 0 5 However, this tests memory via driver, not via direct access. For experimenting with working card installed as a second gpu you can try to unload driver (rmmod -f amdgpu), that run as usual. |
suhar777777 [ 26 авг 2020, 15:56 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
galkinvv писал(а): Текушую версию в https://github.com/galkinvv/galkinvv.gi ... em-test.py уже около года не менял, пока не планирую. # This file may be used and redistributed accorindg to GPLv3 licence. Можно было на licenSe заменить) |
Conqueror [ 28 авг 2020, 23:32 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
galkinvv писал(а): если ошибки не кажет на полном объёме (для покрытия всего объёма можно запустить несколько экземпляров указав им по 2-3ГБ) - то 95% что память впорядке, проблема в gpu или питаниях. А если кажет - то варианты. Тут как с артефактами - часто из-за памяти, но иногда и от gpu бывают. понял, спасибо! |
Eujen [ 02 сен 2020, 14:20 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Привет всем Народ подскажите Я взял кастомный образ и он сразу тестит память при этом там стоит 16 чипов в настройках а как поменять на 8? ---------- Добавлено спустя 42 минуты 22 секунды: ---------- Простите за назойливость Беру простой линкс или надо какой нить другой? Тот кастом который тут пишет что у меня 390 карта и потом если я ручками пытаюсь запустить его он говорит что тест уже прошёл и меняй плохие банки Ссылки на другие образы устарели Прошу помочь ссылко на линукс который поймёт RX 480 и ссылкой на последний скрипт Спасибо |
Conqueror [ 03 сен 2020, 13:31 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Eujen писал(а): Беру простой линкс или надо какой нить другой? я брал archlinux, как советует тот же iToffer на ютубе - но - пока не могу сказать, что всё в порядке!!! Коллеги, подскажите пожалуйста! Пишу здесь, потому что по теме именно теста красных карт - и особенно вопрос к @galkinvv - вы мне писали вот тут, что 511 ошибок - это как раз значит, что какой-то другой параллельный процесс пишет что-то в память. Пробовал на двух дополнительных системах: 1. записал флешку в режиме GPT с ArchLinux-ом: матплата x299 с UEFI - запускается, на РАБОЧЕЙ карте даёт число битых чипов - 0, при этом число ошибок - 510! (то есть тоже что-то пишет параллельно) 2. в режиме виртуального CD-диска (ISO образ через жесткий диск Zalman) на старой матплате НЕ-uefi на 775-ом сокете - загружается, но постоянно сыпет какой-то лог процесса audit type = 1130 - понять кто сыпет в лог не смог (пробовал убивать вслепую процессы, но так ничего и не добился) Если я правильно понимаю, - корректно запустить не получится тест, если есть параллельный процесс, который может нарушать структуру видеопамяти (или даже обычной памяти). В связи с чем вопрос - как этот процесс вычислить или убрать? Или проще взять другой дистрибутив Линукс? |
galkinvv [ 03 сен 2020, 16:33 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Проще взять другой дистрибутив. Вообще вывод на экран является проблемой только в той ситуации, когда отображение идёт через тестируемую карту. Если отображение идёт через другую карту - вывод на экран не проблема. Однако если ошибки могут быть даже если отображение на другую, а драйвер установился. Можно пробовать его выгрузить как Код: Выделить всё rmmod -f amdgpu |
ilie321 [ 05 сен 2020, 14:26 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Hei when we can test those new updates you made? :) |
Gas_man [ 07 сен 2020, 21:26 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
У вьетнамцев что-то новое по скрипту - https://www.bilibili.com/video/BV1bK411p7cV |
suhar777777 [ 08 сен 2020, 02:33 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Gas_man писал(а): У вьетнамцев что-то новое по скрипту - https://www.bilibili.com/video/BV1bK411p7cV Ну это не новое) И похоже и не скрипт, а скорее всего софт, возможно амдешный. Называется TserverLite. Встречаются по фоткам разные версии от 16.07.06 до 17.03.03. Та что на видео 16.07.14. |
meohaimat2021 [ 08 сен 2020, 04:58 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
This software is sold in china at the price depending on the seller and sold in the hard drive. I bought a hard drive to use for testing |
Gas_man [ 08 сен 2020, 07:10 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
suhar777777 писал(а): а скорее всего софт, возможно амдешный Да, уже увидел - https://www.chinafix.com/thread-1242188-1-1.html ---------- Добавлено спустя 1 час 50 секунд: ---------- Как -то встретил на форуме вопрос "как можно определить неисправную банку/канал с битой памятью по картинке" Вот, нашел ответ на вопрос Применительно к картам RX 470 / 480 / 570 / 580 |
Oger [ 08 сен 2020, 14:55 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
suhar777777 писал(а): За одним еще проверил взаимозаменяемость памяти, hynix можно заменить на samsung. В GPU-Z память стала отображаться как Samsung, после замены двух банок? |
suhar777777 [ 08 сен 2020, 17:22 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Oger писал(а): память стала отображаться как Samsung, после замены двух банок? Ну не только в GPU-Z) А так да Samsung. |
Oger [ 08 сен 2020, 17:40 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
suhar777777 писал(а): Ну не только в GPU-Z) А так да Samsung. Значит, все таки правда, что память читается с первого канала, если не брать в расчет страпы. P.S. Досталась MSI R9 390 8Gb. Валится в синий экран atikmpag.sys, как только перезагружаешься, после установки драйвера. Без драйвера или со встроенной ВК, комп работает прекрасно. В диспетчере отображается без ошибок, но GPU-Z не читает датчики. Прогнал на скорую руку скриптом, результата не дало особо. Когда устанавливал драйвер, перед перезагрузкой запустил GPU-Z, память отображалась Hynix (она и стоит), а теперь со встройки показывает Микрон. Биос хотел прошить с течпаверапа, но там был всего 1, который и был залит на карте. Скрипт же явно не панацея? Может и соврать? |
madking [ 08 сен 2020, 19:36 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Oger писал(а): Валится в синий экран atikmpag.sys, как только перезагружаешься, после установки драйвера. ГПУ в мусорку |
Oger [ 09 сен 2020, 10:27 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Скрипт тестирует максимум 256Мб памяти? Нельзя ли добавить некую переменную, как в матсе, что бы можно было выбрать не кол-во мегабайт, а, например, 10-20-100 процентов? P.S. После того, как переключился с iGPU на тестируемую карту (r9 390), тест немного изменил строки описания и общий вид (тоже засыпает экран разноцветными пикселями, на время теста). dmgg.py по прежнему пишет, что ошибки отсутствуют, старый скрипт direct-mem-test выдает вот это : |
galkinvv [ 09 сен 2020, 15:30 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
511 ошибок на карте, которая выдаёт картинку - норма. Что-то свзанное с тем что факт вывода на экран тоже привдоит к записи в память. Аналогично 33м ошибкам в mats. Максимум столько, сколько отображается на адресное пространство PCIe Bar. От материнки и видяхи зависит, но обычно 256, да. Для тестирования большего объёма нужен какой-то другой подход. |
Oger [ 09 сен 2020, 16:50 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
galkinvv писал(а): 511 ошибок на карте, которая выдаёт картинку - норма. Что-то свзанное с тем что факт вывода на экран тоже привдоит к записи в память. Аналогично 33м ошибкам в mats. Эхх, печаль беда. Значит буду ждать, пока дособираю ИК станцию, попробую отреболлить чип, потом продолжу с пациентом. |
Gas_man [ 09 сен 2020, 17:59 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Подскажите, что это значит? В разделе 2:00.0 не показывается AMD карта |
galkinvv [ 09 сен 2020, 19:01 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Gas_man писал(а): В разделе 2:00.0 не показывается AMD карта Восклицательные знаки вместо деталей об устройстве в lspci обычно бывают когда в момент старта системы карта как устройство определялась, а теперь никак не отвечает (например на ней исчезли питания или отсоединили на горячую от райзера и т.д.) На пратике сталкивался с таким когда радиатор-времянка не прилегал или вообще был забыт, и карта выключала питания по перегреву, или при неполадках с ситемой питания. Память непричём, gpu теоретически может быть виноват, но маловероятно. |
Gas_man [ 09 сен 2020, 19:17 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
galkinvv писал(а): На пратике сталкивался с таким когда радиатор-времянка не прилегал или вообще был забыт, и карта выключала питания по перегреву, или при неполадках с ситемой питания. Память непричём, gpu теоретически может быть виноват, но маловероятно. Спасибо за наводку. Указанная информация дала некоторое поле для раздумий. Пытаюсь завести карту после ремонта по питанию. Карта ASUS AMD Radeon RX 570 EXPEDITION [EX-RX570-4G] Менялись резиторы 2R2 - ВСЕ, драйвера RT 9611 (4j=) - DCT, ключи 4G09B - которые были в К.З. и шим ASP1106. Питания поднялись, изображение есть. Но как только доходит до установки драйверов на видеокарту экран гаснет (черный экран) Биос шил с techpowerup - на памяти Hynix Может у кого мысли есть. |
vitok70 [ 09 сен 2020, 20:10 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Gas_man писал(а): как только доходит до установки драйверов на видеокарту экран гаснет (черный экран) Да уже много этих с таким с дефектном с неисправным процем было, вот такие то мысли... |
Gas_man [ 09 сен 2020, 20:23 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
vitok70 писал(а): Да уже много этих с таким с дефектном с неисправным процем было, вот такие то мысли... Если честно, все концы ведут к этому... Но надежда умирает последней. |
pEEp [ 10 сен 2020, 17:43 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Oger писал(а): Валится в синий экран atikmpag.sys, как только перезагружаешься, после установки драйвера. madking писал(а): ГПУ в мусорку Такая же ситуация, но виновата (предварительно) память. ГПУ в мусорку пока что не обязательно... Сегодня точно попробую исключить ГПУ посредством TermoStrike-а |
galkinvv [ 25 сен 2020, 23:52 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
Стектрейсы вначале от amdgpu - норма при запуске с нерабочей картой. Драйвера не пишут с расчётом на то, что карта будет нерабочая и они крашатся. Про то что постоянно лезет "спам" про аудит, довольно сильно мешает, от каких-то настроек зависит, точно не знаю. У меня такого нет, максимум 3-4 строки вначале и всё тихо потом. Но есть относительно простой workaround: нажатие ctrl+L в процессе ввода команды всё почистит (попробуйте). Теперь по делу, о видеокарте. В конце вывода показывает что ошибки "Every 1.00..." - то есть везде. Это означает или что gpu труп, или что тест неприменим, т.к. из-за проблемы с памятью её инициализация не прошла. Бывает ли реально на практике ситуация "тест неприменим, т.к. из-за проблемы с памятью её инициализация не прошла" - неизвестно, т.к. неизвестно методики отличить этот случай от gpu труп. |
Naik [ 30 сен 2020, 00:44 ] | |
Заголовок сообщения: | Re: need some help for ati cards with memory errors for making script |
galkinvv писал(а): Теперь по делу, о видеокарте. В конце вывода показывает что ошибки "Every 1.00..." - то есть везде. Это означает или что gpu труп, или что тест неприменим, т.к. из-за проблемы с памятью её инициализация не прошла. Бывает ли реально на практике ситуация "тест неприменим, т.к. из-за проблемы с памятью её инициализация не прошла" - неизвестно, т.к. неизвестно методики отличить этот случай от gpu труп. Вот у меня сейчас такая ситуация. Пришла 570 4гб проблемная, поставил на неё 8гб, прошил биос, карта висла на посткоде b2. Прогнал скриптом, показало, что 7\8 банка ошибку даёт. Поменял сразу 2 банки. Теперь карта даёт изо, но винда крашится. Тест показывает теперь ошибки по всем банкам. Попробую менять по 2 банки... |
Страница 4 из 56 | Часовой пояс: UTC + 4 часа |
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group http://www.phpbb.com/ |