|
Текущее время: 21 ноя 2024, 19:09
|
Сообщения без ответов | Активные темы
|
Страница 1 из 1 [ Сообщений: 15 ] |
|
|
|
|
|
Автор |
|
Madox
[ТС]
|
Заголовок сообщения: Dell 3080 10gb зависает при изменении нагрузки Добавлено: 26 дек 2022, 11:45 |
Я тут случайно |
|
|
Зарегистрирован: 15 фев 2022, 23:28 Наличности на руках: 19.04
Сообщения: 11 Откуда: Ulyanovsk
|
Здравствуйте, форумчане! Я новичок в ремонте, просьба судить слишком строго. Имеется 3080 LHR 10gb от Dell, дефект проявляется следующим образом: 1. Фурмарк крутит нормально, но по завершению теста, либо при начале очередного -- черный экран, при перегрузке видеокарта не определяется, пока не остынет 2. В Superposition тот же самый эффект, черный экран и зависание при смене сцен и не определяется, пока не остынет 3. Эффект наступает только при прогреве карты. 4. mats проходит на 5 мб, больше не пробовал 5. gputest.js -test 275 не проходит, зависает. 6. В "горячем" состоянии, когда она биосом не определяется, подкидывал на лабораторник -- потребление около 2 ампер, кульки крутятся. Подскажите пожалуйста, куда копать, что можно проверить в первую очередь?
gputest.js
Heating GPU=0 at 10:46:52 at 64 C for 30 sec. ERROR: bp @ <fileid:0x000239>:2633
ERROR: ** ModsDrvBreakPoint on GPU 0 [05:00.0] **
[ 0] ------------------------- BEGIN ASSERT INFO DUMP ------------------------- [ ] EccErrCountDisabled: false [ ] MassertVerboseFlags: 0x0000 [ ] MassertAllowed: 0x0 [ ] MassertDisabled: false [ ] UnexpectedHwIntVerboseFlags: 0x0000 [ ] UnexpectedHwIntAllowed: 0x0 [ ] UnexpectedHwIntDisabled: false [ ] EdcErrCountVerboseFlags: 0x0000 [ ] EdcErrCountAllowed: 0x0, 0x0, 0x0, 0x0, 0x0, 0xffffffffffffffff [ ] EdcErrCountDisabled: false [ ] OverTempCountVerboseFlags: 0x0000 [ ] OverTempCountAllowed: 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0 [ ] OverTempCountDisabled: false [ ] PrintQueueOverflowVerboseFlags: 0x0000 [ ] PrintQueueOverflowAllowed: 0x0 [ ] PrintQueueOverflowDisabled: false [ ] Testing device : GPU 0 [05:00.0] [ ] DisableRcWatchdog : false [ ] PwrSampleIntervalMs : 500 [ ] TargetNvSwitch : false [ ] CheckPickers : false [ ] TestConfiguration Js Properties: [ ] StartLoop: 0 [ ] RestartSkipCount: 100 [ ] Loops: 1000 [ ] Seed: 0x12345678 [ ] TimeoutMs: 1000.000000 [ ] Display: 1024x768x32 60Hz [ ] ZDepth: 32 [ ] FSAAMode: Disabled [ ] Surface: 1024x768 [ ] PushBufferLocation: Memory::Coherent [ ] DstLocation: Memory::Optimal [ ] SrcLocation: Memory::Optimal [ ] MemoryType: Memory::Coherent [ ] UseIndMem: false [ ] ChannelType: UseNewestAvailable (multiple channels NOT allowed) [ ] ChannelSize: 0x00100000 (1048576) [ ] UseTiledSurface: false [ ] DisableCrt: false [ ] EarlyExitOnErrCount: false [ ] Verbose: false [ ] ShortenTestForSim: false [ ] Dma Protocol: Default [ ] NotifierLocation: Memory::Coherent [ ] GpFifoEntries: 0x00000200 (512) [ ] AutoFlush: true [ ] AutoFlushThresh: 256 [ ] ChannelLogging: false [ ] AllowVIC: true [ ] SemaphorePayloadSize: Default [ ] DisplayMgrRequirements: RequireNullDisplay [ ] UseOldRNG: false [ ] UphyLogMask: 0x0 [ ] GoldenValues Js Properties: [ ] PlatformName: GA102 [ ] NameSuffix: [ ] Action: Golden.Check [ ] SkipCount: 100 [ ] Codes: 0 [ ] NumCodeBins: 97 [ ] StopOnError: true [ ] BufferFetchHint: opCpuDma [ ] CalculationAlgorithm: CpuCalcAlgorithm [ ] CheckDmaOnFail: false [ ] RetryDmaOnFail: false [ ] SendTrigger: false [ ] TriggerLoop: 0 [ ] TriggerSubdevice: 0 [ ] PrintCsv: false [ ] Print: 0 (Never) [ ] Interact: 0 (Never) [ ] DumpTga: 0 (Never) [ ] DumpPng: 0 (Never) [ ] CheckLoops 100 [ ] RuntimeMs: 5000 [ ] KeepRunning: true [ ] Test type: Normal [ ] MNK Align mode: Permit [ ] Max data dump: 4294967295 [ ] NumNewMatrices: 0 [ ] Dump Miscompares: false [ ] Dump Matrices: false [ ] GflopsLowerBound: 0.000000 [ ] GflopsUpperBound: 0.000000 [ ] Verify Results: true [ ] Naive Init: false [ ] Alpha: 0.500000 [ ] Beta: 0.500000 [ ] Synchronous Mode: false [ ] CPU threads: 0 [ ] LaunchDelay(uSec): 0.000000 [ ] UseCrcToVerify: false [ ] SkipAlphaBetaCheck: false [ ] CMatrixScale: 1 [ ] CtaSwizzle: true [ ] Mtx fill data type: Random [ ] Mtx fill mean: 0.000000 [ ] Mtx fill std dev: 5.000000 [ ] Loading CUDA module linpack86.cubin [ ] Function name cutlass_simt_sgemm_128x128_8x2_nt_align1 [ ] Buffer size: 2299904 elements [ ] Allocating on GPU: 17.336 MB [ ] Num SM: 68 [ ] Block size 0 0 [ ] Grid size 68 2 [ ] Msize: 8704 (x128) [ ] Nsize: 256 (x128) [ ] Ksize: 8 (x1) [ ] Matrix A: 0x10012c80000 [ ] Matrix B: 0x10012cc4000 [ ] Matrix C: 0x10012400000 [ ] Matrix RefC: 0x10012e00000 [ ] CudaLinpack run: M=8704 N=256 K=8 Loops=1000 TimePerLoop=27us [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 1 sec temp=61 tach=1182, 1179 pwr=190 g=1440 v=775 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 2 sec temp=61 tach=1450, 1442 pwr=190 g=1440 v=775 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 3 sec temp=61 tach=1656, 1644 pwr=190 g=1440 v=775 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 4 sec temp=61 tach=1798, 1787 pwr=190 g=1440 v=775 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 5 sec temp=61 tach=1896, 1886 pwr=190 g=1440 v=775 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 6 sec temp=60 tach=1960, 1951 pwr=190 g=1440 v=775 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 7 sec temp=60 tach=2010, 1994 pwr=190 g=1440 v=775 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] usb 1-10.4: USB disconnect, device number 44 [ ] Monitor gpu=0 8 sec temp=60 tach=2039, 2027 pwr=190 g=1440 v=775 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 9 sec temp=60 tach=2058, 2058 pwr=190 g=1440 v=775 [ ] usb 1-10.4: new low-speed USB device number 45 using xhci_hcd [ ] usb 1-10.4: New USB device found, idVendor=0458, idProduct=003a, bcdDevice= 1.00 usb 1-10.4: New USB device strings: Mfr=1, Product=2, SerialNumber=0 usb 1-10.4: Product: Optical Mouse usb 1-10.4: Manufacturer: Genius [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] input: Genius Optical Mouse as /devices/pci0000:00/0000:00:01.2/0000:02:00.0/usb1/1-10/1-10.4/1-10.4:1.0/0003:0458:003A.002B/input/input59 hid-generic 0003:0458:003A.002B: input,hidraw3: USB HID v1.11 Mouse [Genius Optical Mouse] on usb-0000:02:00.0-10.4/input0 [ ] Monitor gpu=0 10 sec temp=59 tach=2078, 2078 pwr=190 g=1440 v=775 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 11 sec temp=59 tach=2094, 2086 pwr=190 g=1440 v=775 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 12 sec temp=59 tach=2101, 2098 pwr=190 g=1440 v=775 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 13 sec temp=59 tach=2110, 2102 pwr=189 g=1440 v=775 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 14 sec temp=59 tach=2114, 2110 pwr=190 g=1440 v=781 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 15 sec temp=59 tach=2114, 2110 pwr=189 g=1440 v=781 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 16 sec temp=58 tach=2118, 2114 pwr=189 g=1440 v=781 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 17 sec temp=58 tach=2118, 2118 pwr=189 g=1440 v=781 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 18 sec temp=58 tach=2118, 2118 pwr=189 g=1440 v=781 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] Monitor gpu=0 19 sec temp=58 tach=2122, 2123 pwr=189 g=1440 v=781 [ ] Warning: MSI for device 0000:05:00.0 not serviced [ ] NVRM: RG underflow reported on head 0 (line 109, pixel 1646) [ ] NVRM: Window 0 (head 0) mempool occupancy = 0 pixels [ ] NVRM: Window 1 (head 0) mempool occupancy = 0 pixels [ ] NVRM: Head 0 cursor mempool occupancy = 0 pixels [ ] NVRM: Window 0 (head 0) mempool Virtual Occupancy = 137lines, latency in hubclks = 138 [ ] NVRM: Window 0 (Head 0) underflow status, formatterentries for Luma = 0, Chroma upper = 0, Chroma lower= 0, hold entries = 0, RDOUT thread id for Luma =0,chroma upper = 2, chroma lower = 0 [ ] NVRM: Window 0 (Head 0) window pixel packet count = 0,precompinputwaitcount = 0, counterclearstatus = 0 [ ] NVRM: Window 0 (Head 0) number of thread entries,decompThread0Entries = 0, decompThread1Entries = 0,decompThread2Entries = 0, decompThread3Entries = 0,decompThread4Entries = 0, decompThread5Entries = 0,decompThread6Entries = 0, decompThread7Entries =0 [ ] NVRM: Window 1 (head 0) mempool Virtual Occupancy = 0lines, latency in hubclks = 0 [ ] NVRM: Window 1 (Head 0) underflow status, formatterentries for Luma = 0, Chroma upper = 0, Chroma lower= 0, hold entries = 0, RDOUT thread id for Luma =0,chroma upper = 0, chroma lower = 0 [ ] NVRM: Window 1 (Head 0) window pixel packet count = 0,precompinputwaitcount = 0, counterclearstatus = 0 [ ] NVRM: Window 1 (Head 0) number of thread entries,decompThread0Entries = 0, decompThread1Entries = 0,decompThread2Entries = 0, decompThread3Entries = 0,decompThread4Entries = 0, decompThread5Entries = 0,decompThread6Entries = 0, decompThread7Entries =0 [ ] NVRM: Head 0 X(= 360) and Y(=41) position of pixel when underflow [ ] NVRM: Head 0 latency in hubclks = 193, pixel packet count = 0 [ ] NVRM: Head 0 formatter entries = 0, holdfifo entries = 0,thread0entries = 0 [ ] NVRM: bp @ <fileid:0x000239>:2633 [ ] bp @ <fileid:0x000239>:2633 [ ] [ ] ** ModsDrvBreakPoint on GPU 0 [05:00.0] **
[ 0] -------------------------- END ASSERT INFO DUMP -------------------------- Error 073100275818 : GpuSubdevice.GetClock Mods detected an assertion failure [0.008 seconds]
|
|
|
|
|
madking
|
Заголовок сообщения: Re: Dell 3080 10gb зависает при изменении нагрузки Добавлено: 26 дек 2022, 13:27 |
Продвинутый форумчанин |
|
|
Зарегистрирован: 03 ноя 2017, 01:24 Наличности на руках: 4,972.02
Сообщения: 4134 Откуда: Budapest
|
Madox писал(а): Я новичок в ремонте, просьба судить слишком строго. с таким дефектом и новичок, тут уже сразу все под подозрением начните с того что без ремонта вернете карту и на этом и закончите принимать то на что нет знаний, тут за вас никто не будет производить ремонт если хотите продвинуть знания то читайте форумы подобной темы, смотрите много роликов на ютубе, там их уже дохрена, один вик-он/офф заливает всякую порнографию с извращением, достаточно для того чтоб понять какие знания нужны и на что надо обращать внимание и разжевывает почти в каждом ролике а так просто угробите карту, да еще и не дешевую
|
|
|
|
|
Nomad.Net
|
Заголовок сообщения: Re: Dell 3080 10gb зависает при изменении нагрузки Добавлено: 26 дек 2022, 13:28 |
Я тут случайно |
|
|
Зарегистрирован: 15 дек 2022, 14:54 Наличности на руках: 15.05
Сообщения: 16 Откуда: Saratov
|
Цитата: mats проходит на 5 мб, больше не пробовал Может для начала попробовать? Термопаста/термопрокладки, возможно, отвал. Разобрать, посмотреть...
|
|
|
|
|
Madox
[ТС]
|
Заголовок сообщения: Re: Dell 3080 10gb зависает при изменении нагрузки Добавлено: 26 дек 2022, 15:12 |
Я тут случайно |
|
|
Зарегистрирован: 15 фев 2022, 23:28 Наличности на руках: 19.04
Сообщения: 11 Откуда: Ulyanovsk
|
Возвращать карту некуда. Карту обслуживал, гпу по цвету компаунда в идеале. У меня 3 гипотезы: 1. Что-то с питанием гпу при нагреве происходит 2. ГПУ от платы отваливается, либо где-то микротрещина 3. Неисправность ГПУ.
Получается только заменой на заведомо исправный GPU или хотя бы реболлом часть версий проверить? Против теории проблем с памятью тот факт, что карта вообще не определятся, когда этот глюк наступает.
Как вариант ещё думаю, подогреть плату градусов до 70-80 на нижнем подогреве, и подключить к компьютеру, проверить често термически будет вызываться проблема, без реальной нагрузки...
|
|
|
|
|
madking
|
Заголовок сообщения: Re: Dell 3080 10gb зависает при изменении нагрузки Добавлено: 26 дек 2022, 15:25 |
Продвинутый форумчанин |
|
|
Зарегистрирован: 03 ноя 2017, 01:24 Наличности на руках: 4,972.02
Сообщения: 4134 Откуда: Budapest
|
Madox писал(а): 1. Что-то с питанием гпу при нагреве происходит 2. ГПУ от платы отваливается, либо где-то микротрещина ну тогда начните с осмотра карты, на трещины возле разъема PCI, на изгиб PCB, на качество пайки, еще смотрите на память Б1, конечно все это смотреть под микроскопом ---------- Добавлено спустя 1 час 49 минут 27 секунд: ---------- смотрите ЛС
|
|
|
|
|
Nomad.Net
|
Заголовок сообщения: Re: Dell 3080 10gb зависает при изменении нагрузки Добавлено: 26 дек 2022, 20:05 |
Я тут случайно |
|
|
Зарегистрирован: 15 дек 2022, 14:54 Наличности на руках: 15.05
Сообщения: 16 Откуда: Saratov
|
Цитата: Как вариант ещё думаю, подогреть плату градусов до 70-80 на нижнем подогреве Это безсвинцовку-то греть 70-80 градусов? Вы даже не написали какая температура памяти и проца в нагрузке. Про конкретную модель не знаю, но греются карты 3ххх серии от Нвидиа ох как не хило. И частенько отваливаются. Греть чип (желательно захватив память) надо в первую очередь - потом думать :)
|
|
|
|
|
Nomad.Net
|
Заголовок сообщения: Re: Dell 3080 10gb зависает при изменении нагрузки Добавлено: 23 янв 2023, 13:56 |
Я тут случайно |
|
|
Зарегистрирован: 15 дек 2022, 14:54 Наличности на руках: 15.05
Сообщения: 16 Откуда: Saratov
|
Цитата: жалко просто гпу феном фигачить, компаунд совсем светлый ) Ни в коем случае не греть феном!!! Верхний и нижний ИК подогрев и следы будут видны только под микроскопом.
|
|
|
|
|
ayobisinen
|
Заголовок сообщения: Re: Dell 3080 10gb зависает при изменении нагрузки Добавлено: 07 фев 2023, 19:50 |
Интересующийся |
|
|
Зарегистрирован: 12 авг 2020, 04:47 Наличности на руках: 2.04
Сообщения: 82 Откуда: Москва
|
Madox писал(а): Как вариант ещё думаю, подогреть плату градусов до 70-80 на нижнем подогреве, и подключить к компьютеру, проверить често термически будет вызываться проблема, без реальной нагрузки...
Отличная идея. Принесли карту на обслуживание - отдать гретую нерабочую назад, класс. Вот прям чувствуется уровень. Скриншот бы хоть с gpuz сделали. На этих деллах пластина, толщина прокладок нестандартная. (если двухвентильная, зелёный текстолит).
|
|
|
|
|
|
|
|
|
|
|
Страница 1 из 1 [ Сообщений: 15 ] |
|
|
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения
|
|