Ремонт: Ноутбуков, Компьютеров
https://vlab.su/

Asus r9 280 артефакты памяти
https://vlab.su/viewtopic.php?f=48&t=107292
Страница 1 из 1

ArhangelSM [ 26 сен 2020, 09:20 ]
Заголовок сообщения:  Asus r9 280 артефакты памяти

Здравствуйте, есть способ выяснить какая память артифачит?

aleksros [ 26 сен 2020, 12:03 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

есть. Вам сюда viewtopic.php?f=48&t=100822

ArhangelSM [ 26 сен 2020, 17:12 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

Эту тему находил, но не внимательно прочёл. Спс
---------- Добавлено спустя 3 часа 36 минут 58 секунд: ----------
После того как прописал запуск теста(монитор подключён через материнку) все загрузилось и проц и видео карта на максимум, а на экране выдало вот такой пийзаж. Как долго проходит тест на 3гб? И стоит ли ждать? Покажет ли что?

Запускаю тест повторно, картина примерно та же.
Запустил 4 раз, жму тест, через секунды полторы-две маргнул экран, подсветка горит, на мониторе ничего нет

dikabraz [ 27 сен 2020, 02:04 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

Хмм, а вы верный адрес для проверки выбираете? У меня подобные глюки были, когда пытался тестировать "не то"

galkinvv [ 27 сен 2020, 02:27 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

Не надо тестировать 3гб, будет вечность тетсировать. Тестируйте 1-16МБ.

ArhangelSM [ 27 сен 2020, 08:34 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

dikabraz писал(а):
Хмм, а вы верный адрес для проверки выбираете? У меня подобные глюки были, когда пытался тестировать "не то"


100% то, почитал темы, нужно просто ждать.
galkinvv писал(а):
Не надо тестировать 3гб, будет вечность тетсировать. Тестируйте 1-16МБ.

О как, спс понял.

А сколько ждать при dmgg c0000000 3 16 по времени?
---------- Добавлено спустя 1 час 30 минут 53 секунды: ----------
Делаю вот так, потом вот так становится.
---------- Добавлено спустя 27 минут 1 секунду: ----------
Посмотрев ещё форум, осознал ошибку dmgg.py потом количество мб далее указывают количество банок памяти, указал так но результат тот же, все в полоску не видно не чего. Первый тест с 1мб делаю.

galkinvv [ 27 сен 2020, 16:28 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

1-16МБ должны тестироваться в пределах 5сек-5 минут.

Судя по тому, что картинка "едет" - в процессе тестирования задеваются системные обасти памяти, отвечающие за вывод изображения.
Обычно это не проблема, всё в конце восстанавливается, но может зависеть от модели карты.

Попробуйте начинать тестирование не с C0000000, а скажем с С1000000 (это сдвиг на 16МБ от начала, это допустимо, т.к. размер PCIe bar равен 256МБ).

К слову вариация скрипта dmgg.py вам скорее всего бесполезна. Она исходит из предположения относительно соответствия адресов памяти и номеров банок для чипов Ellesmere, а у вас чип Tahiti. Соответствия адресов и чипов для Tahiti я нигде не видел, да и сам не занимался такими картами.
В том случае применима только вариация скрипта direсе-mem-test.py - в той же теме. Она выдаёт только адреса, а соотвествие адресов и чипов можно понимать внося дополнительные помехи во взаимодействия с чипом (например подтяжкой к нулю резистора, отвечающего за сигнал reset чипа памяти)

dikabraz [ 27 сен 2020, 22:51 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

dmgg c0000000 3 16
Ээээ, dmgg.py c0000000 16 12, где 16- мб памяти, а 12- физическое кол-во чипов. откуда на r9 280 16 банок, если ее объем памяти - 3гб?

pEEp [ 28 сен 2020, 11:10 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

galkinvv
dikabraz
Для Радиков всегда справедливо наличие 4х каналов памяти? Т.е., если банок 12, то по 3 банки на канал или все же пара на канал и каналов 6 ? Что верно?

galkinvv [ 28 сен 2020, 15:29 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

Если хотите названия каналов памяти - смотрите board C386PI3 viewtopic.php?f=48&t=602&p=571099&hilit=%2Ac386pi3%2A#p571099 - там сигнальные пятаки DQ на модулях именованы.

Получается что-то типа A0, A1, B0, B1, ... , F0, F1
Но количество каналов - это некая абстракция, напрямую при ремонте вроде бы редко применимая. Или вообще неприменимая, поправьте елси знаете где именно она полезна?
Я честно и не знаю в чём разница между одним каналом на 12 модулей и 6ю каналами по 6 модулей. На каком уровне вобще термин канал вводится и что именно он значит?

Для карт с объёмом памяти, не являющимся степенью двойки, в частоности 3ГБ, наибольшая проблема понять соответствие адрес ошибки<->физический модуль.
Оно там может быть нифига не тривиальное. А для того чтоб сделать вывод по адресу, который найдётся в процессе тестирования - нужно именно оно.

pEEp [ 28 сен 2020, 16:56 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

galkinvv писал(а):
Но количество каналов - это некая абстракция, напрямую при ремонте вроде бы редко применимая. Или вообще неприменимая, поправьте елси знаете где именно она полезна?

Я бы сказал "условно применимая", ведь при имеемом изо и некрасивой банке на мониторе мы можем визуально увидеть, какой из BACD каналов дает сбой и, тем самым, наугад поменять одну, а затем и другую (в случае неудачи) банку памяти.
И если мы принимаем за условие, что у 12-модульных карт присутствует 6 каналов (A0..F1), то можем получить разбиение монитора по вертикали по принципу 6+6 по аналогии с 4+4. А вот очередность каналов можно и отсекателем найти: или там BACDEF или ABCDEF, а может и CDABEF ? В любом случае попробую (парочка 280х с проблемами памяти - будет на чем попрактиковаться и сравнить результаты).

galkinvv [ 28 сен 2020, 17:17 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

Не уверен что стоит мыслить именно в терминах каналов.
Единственное что связывает модули из пары на rx470-580 - то, что "часто неисправность (или даже банальное отсуствие) одного модуля " - выглядят как нерабочесть сразу пары модулей. Это вероятно как-то связано с порядком инициализации модулей, что успешная инициализация на тех картах происходит парами. На rx560 - тоже парами (т.е. при проблеме в одном модуле - не работает 2 из 4х). Сколько там каналов я не знаю.

То есть практическое соображние состоит в том, что на каких-то чипах проблемный модуль также приводит к тому что второй модуль из пары не проходит инициализацию.
Однако процедура инициализации процесс достаточно сложный, и нет никакой уверенности в том, что такая связность модулей в точности соответствует понятю канала в "документации" gpu.

Не удивлюсь что на каких-то картах отказывает совместно 2 канала, а на каких-то (nvidia) вполне себе отказывает только половина канала.

---------- Добавлено спустя 11 минут 59 секунд: ----------
Ещё кстати если верить схеме на MSI V341 то U2000-U2100 - это канал A в официальной терминологии AMD (а не канал B). То что у него смещение адреса 0x200 в памяти, а не 0x0 - вот это действительно важно.
Так что лучше всего по смещениям писать 0x200-0x300-0x0-0x100-0x400-0x500-0x600-0x700.
А вот какими буквами называются в схеме - только путаницу наводит.
---------- Добавлено спустя 29 минут 18 секунд: ----------
Сам запутался, но наконец понял от чего. Когда говорят в терминах каналов с буквенными обозначениями - то приходится держать в голове 2 соответствия - каналов <-> столбцов на мониторе (считай порядка в памяти), и каналов <-> банок на плате.

Проще держать в голове одно соотношение - порядка в памяти <-> банок на плате.
То есть для rx470-580 записать можно так:
Порядок в памяти (удачно визуализируемый на разрешении 1024x*) оказывается U2200-U2300-U2000-U2100-U2400-U2500-U2600-U2700
Смещения, записанные в порядке банок на плате оказываются 0x200-0x300-0x0-0x100-0x400-0x500-0x600-0x700.

Тут ещё повезло, что "перестановка" является обратной самой себе. Если бы было не так - то запутались бы конкретно, т.к. тогда 2 строки выше имели бы НЕ одинаковые циферки.
Хорошо что 16-модульные r9 390 с проблемной памятью не попадались)) Там если нетривиальное соотношение - то путаница адовая будет.

pEEp [ 28 сен 2020, 18:31 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

galkinvv
Очень подробно написано, спс!
У меня в голове (да и на бумаге) точно такой же порядок, а ориентиром выступают именно смещения 0x0..0x700, но никак не обозначения на плате (U2000..U2700) и уж точно не официальная терминология AMD про А-канал.

galkinvv писал(а):
То есть практическое соображение состоит в том, что на каких-то чипах проблемный модуль также приводит к тому что второй модуль из пары не проходит инициализацию.

Вооот! Вот с этим я сталкиваюсь часто.

Покажу на примере RX480 (смещения 0х600 - 7 банка, 0х700 - 8 банка, условно канал D):
Случай №1:
Скрипт дает 0х600. Заменяю 7 банку, карта оживает. Виновата 7.

Случай №2:
Скрипт дает 0х600. Заменяю 7 банку, карта НЕ оживает. Скрипт снова дает 0х600!!! Заменяю 8 банку, карта оживает. Виновата 7 и/или 8 (второй модуль влияет на первый или виноваты оба?).

Случай №3:
Скрипт ОК. Но я знаю, что 8 глючит - отсекаю ее, скрипт дает 0х700. Виновата 8 банка.

Что хочу сказать: если взять условный канал, в котором виновата нечетная, то скрипт покажет на нее. Если виновата четная, то скрипт может показать как на нее, так и на нечётную данного канала. Ну и крайний случай, когда виноваты обе - скрипт покажет на нечётную.
Т.е., если виноваты сразу обе: 7 и 8, то скрипт отработает с ошибкой 0х600 (но НЕ покажет 0х600 и 0х700).

galkinvv писал(а):
Хорошо что 16-модульные r9 390 с проблемной памятью не попадались)) Там если нетривиальное соотношение - то путаница адовая будет.

И с этой попробую разобраться - ждет меня MSI 290X (полосатая)...

galkinvv [ 28 сен 2020, 23:14 ]
Заголовок сообщения:  Re: Asus r9 280 артефакты памяти

pEEp писал(а):
то скрипт отработает с ошибкой 0х600 (но НЕ покажет 0х600 и 0х700)

Тот который direct-mem-test - он только первую показывает.

Так как он вообще не заточен под какое-либо конкретное поклоение видеокарт, а тупо показывает 2 вещи:
- первый адрес ошибки.
- процент ошибочных байт.

dmgg заточен более специфично, но соотвественно если в тестируемом поколении что-то не соответствует сделанном в нём предположениям - он выдаст ерунду.

Ибо на разных поколениях даже объём последовательно приходящийся на 1 модуль - может быть разный. На rx470-580 - 0x100, а например на 8-гиговых nvidia 1070-1080 0x400.

А то что иногда глючит 2 модуля при неисправном одом - мне кажется это происходит тогда, когда один был неисправен в момент инициализации (а не стал искусственно неисправен позднее)

Страница 1 из 1 Часовой пояс: UTC + 4 часа
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/