Перейти к контенту

Ошибки CRC в Antminer S19 и S21: Причины, диагностика и ремонт

Antminer hashboard ASIC chip diagnosis with thermal camera for reg CRC error repair
Ошибка CRC регистра — одна из самых досадных неисправностей на хеш-плате Antminer, но почти всегда это аппаратная проблема с устранимой первопричиной. Вот как диагностировать и устранить ошибки CRC на платформах S19 и S21.

Немногие сообщения об ошибках настолько повсеместно разочаровывают — или так широко неправильно понимаются — как ошибка reg CRC на хеш-плате Antminer. Она появляется в логах ядра на всех моделях S19 и S21, вызывает падение хешрейта и всплески ошибок оборудования, а во многих ремонтных мастерских ее ошибочно принимают за «случайный сбой чипа», в то время как настоящая первопричина гораздо более конкретна.

В этом руководстве подробно объясняется, что такое ошибки reg CRC, почему они возникают на платформах Antminer, а также пошаговые процедуры диагностики и ремонта, которые восстанавливают полную работоспособность затронутых хеш-плат.

Что на самом деле представляет собой ошибка Reg CRC

CRC расшифровывается как Cyclic Redundancy Check (циклическая проверка избыточности) — низкоуровневый механизм проверки целостности данных, используемый во всех цифровых протоколах связи. На хеш-плате Antminer прошивка постоянно выполняет проверки CRC данных, возвращаемых каждым чипом ASIC в цепочке. Когда возвращенные данные не соответствуют ожидаемой контрольной сумме, майнер записывает «ошибку reg CRC» для этого чипа или домена.

Критически важно понимать: ошибка reg CRC — это не болезнь. Это симптом. Она говорит вам о том, что что-то мешает чистой передаче данных между платой управления и одним или несколькими чипами. Задача техника по ремонту — найти причину.

Данные одного специалиста по ремонту ASIC, выполнившего более 13 000 ремонтов хеш-плат, недвусмысленны в этом вопросе: ошибки reg CRC почти всегда связаны с аппаратным обеспечением. Перепрошивка прошивки, перезагрузки и изменения конфигурации пула могут иногда маскировать симптом, но они не устраняют основную неисправность. Именно вмешательство на уровне компонентов решает проблему в долгосрочной перспективе.

Четыре основные причины ошибок Reg CRC

1. Нестабильность домена напряжения

Хеш-платы Antminer организуют свои чипы ASIC в домены напряжения — группы чипов, которые используют общую регулируемую шину питания. Когда регулятор для домена выходит из строя, стареет или испытывает повышенное сопротивление в своем тракте подачи питания, чипы в этом домене получают нестабильное напряжение. Чипы, работающие при нестандартном напряжении, ведут себя непредсказуемо, а непредсказуемое поведение приводит к ошибкам CRC.

Распространенные причины внутри домена напряжения: неисправные ИС понижающего преобразователя, старые электролитические конденсаторы, потерявшие емкость, и плохие паяные соединения на силовых дорожках, которые приобрели сопротивление от термического циклического воздействия.

2. Потеря синхронизации ФАПЧ

Каждый чип ASIC содержит фазовую автоподстройку частоты (ФАПЧ), которая синхронизирует внутренний тактовый сигнал чипа с тактовым сигналом хеш-платы. Когда ФАПЧ чипа теряет синхронизацию — либо из-за внутренней деградации чипа, либо из-за суровых условий эксплуатации, таких как длительный перегрев — чип работает рассинхронизированно с остальной частью цепочки. Несинхронизированные данные производят сдвинутые по фазе возвраты, которые не проходят проверку CRC.

Потеря ФАПЧ особенно распространена на платах, которые подвергались многократным термическим отключениям или работают в помещениях с плохим охлаждением. Это один из наиболее надежных показателей того, что чип приближается к концу срока службы.

3. Отказавшие или умирающие чипы ASIC

Чипы ASIC не всегда выходят из строя полностью. Частично вышедший из строя чип может по-прежнему реагировать на команды, но возвращать неверные или искаженные данные. На исправном чипе хешрейт на один чип в тестовых логах должен составлять около 5000. Чип, возвращающий ~1092 или другие значительно уменьшенные значения, почти наверняка является источником ошибки CRC и нуждается в замене.

Деградация чипов ускоряется термическим циклическим воздействием, событиями перенапряжения и длительной работой при температурах выше номинальных.

4. Плохие паяные соединения

Это самая недооцененная причина. Чипы ASIC на хеш-платах Antminer монтируются по технологии BGA — их шарики припоя находятся под корпусом чипа, невидимые сверху. Паяное соединение, которое выглядит идеальным при визуальном осмотре, на самом деле может быть треснутым, холодным или вообще не соединенным. Техники по ремонту часто сообщают о случаях, когда контакты казались правильно припаянными сбоку, но при извлечении чипа обнаруживалось, что эти контакты изначально никогда не образовывали соединения.

Плохие паяные соединения обычно проявляются после термического циклического воздействия: плата работает нормально, когда она холодная, но выдает ошибки CRC, как только чипы нагреваются и микроперемещения нарушают краевые соединения.

Диагностика ошибки CRC: эффективный путь

Устранение ошибок CRC вручную с помощью мультиметра и осциллографа возможно, но медленно. Эффективный подход использует специальный тестер ASIC для локализации неисправности за считанные минуты.

Шаг 1 — Определите затронутую плату и положение чипа. Прочитайте лог ядра, чтобы определить, какая хеш-плата выдает ошибку и локализована ли она на определенном номере чипа или охватывает несколько чипов. Если ошибка локализована в узком диапазоне, этот диапазон обычно соответствует одному домену напряжения — что указывает на сбой чипа или неисправность подачи питания в этом домене.

Шаг 2 — Проверьте подозрительную плату на стенде. Извлеките хеш-плату из майнера и подключите ее к диагностическому тестеру. Многофункциональный тестер ASIC K9 поддерживает более 70 моделей майнинговых машин — включая полную линейку S19 и S21 — и сканирует плату по чипам, сообщая точное положение любого неисправного чипа вместе с диагностическими данными о напряжении и хешрейте для каждого чипа. Это превращает часы догадок в минуты целенаправленной диагностики.

Шаг 3 — Проверьте неисправный компонент перед заменой. Для плат платформы S21 специальный тестер чипов ASIC серии BM1368 может проверить, неисправен ли сам чип, прежде чем вы его удалите. Для плат S19 XP и S19K Pro эквивалентом является тестер чипов ASIC серии BM1366. Эти тестеры также позволяют проверять заменяемые чипы перед установкой — это критически важно, если вы покупаете чипы на вторичном рынке.

Контекст ремонта S19 против S21

Различные варианты S19 и S21 используют разные чипы ASIC, и выбор правильной замены имеет значение:

  • Antminer S19 / S19 Pro / S19j: чипы серии BM1397 (TSMC FinFET, эффективность ~30 Дж/Т)
  • Antminer S19j Pro: серия BM1362 (особенно BM1362AC)
  • Antminer S19 XP / S19K Pro: серия BM1366 (BM1366BS, BM1366BP)
  • Antminer S21 / S21 Pro / S21 XP / T21 / S21 Hydro: серия BM1368 (BM1368AA, BM1368PA, BM1368PB, BM1368PM, BM1368PV)

Помимо различий в семействах чипов, платформа S21 представляет собой значительное архитектурное изменение по сравнению с S19: BM1368 исключает MOS- и PIC-схемы, присутствовавшие на более ранних чипах Antminer, и добавляет 11 операционных усилителей, начиная со второго домена напряжения, для суммирования сигналов. На практике это означает, что диагностика CRC на плате S21 иногда требует проверки цепей операционных усилителей на стыке двух доменов — диагностический шаг, который не применяется к платам S19.

Рабочий процесс ремонта: от журнала ошибок до рабочей платы

После того, как диагностика локализовала неисправность до определенного чипа или компонента питания, рабочий процесс ремонта следует последовательной схеме:

1. Переплавка до замены. Для незначительных проблем с паяными соединениями переплавка подозрительного чипа является самым дешевым решением. Нанесите флюс вокруг чипа, нагрейте каждое паяное соединение до расплавленного состояния с помощью станции горячего воздуха и дайте припою снова стечь, чтобы он чисто контактировал с площадкой. Если ошибка исчезает после переплавки, проблема была связана с припоем, и сам чип все еще исправен.

2. Замена чипа, если переплавка не помогла. Если ошибка CRC сохраняется после переплавки, сам чип неисправен и нуждается в удалении. Используйте станцию горячего воздуха для снятия чипа, очистки площадок и установки нового чипа с помощью трафарета для нанесения припоя, чтобы обеспечить равномерное формирование шариков припоя. Всегда проверяйте заменяемый чип специальным тестером чипов перед пайкой — неисправные новые чипы являются реальным риском при покупке на вторичном рынке.

3. Замена компонента домена напряжения. Если диагностика указывает на неисправность подачи питания, а не на неисправность чипа, замените подозрительный понижающий преобразователь, конденсаторы или другие компоненты питания в затронутом домене. Повторно проверьте плату под нагрузкой, прежде чем возвращать ее в эксплуатацию.

4. Полная повторная проверка платы. После любого ремонта проверьте плату на стенде в течение полного цикла хешрейта. Ошибки CRC, которые появляются только при термической нагрузке, не проявятся при холодном тесте — запускайте плату достаточно долго, чтобы все чипы достигли нормальной рабочей температуры, прежде чем объявлять ремонт завершенным.

Когда ремонт нецелесообразен

Не каждую плату с ошибками CRC стоит ремонтировать. Плата с множественными отказавшими чипами в разных доменах напряжения, обширной коррозией или повреждением базовой печатной платы обычно находится за пределами экономически выгодного ремонта — стоимость деталей и работ приближается или превышает стоимость замены платы. В таких случаях правильным решением является извлечение пригодных к использованию компонентов (исправные чипы, радиаторы, разъемы) и полная замена платы.

Для всего остального сочетание правильных диагностических инструментов и качественных сменных чипов превращает то, что выглядит как мертвая хеш-плата, в однодневную работу и восстановленную машину.

Получите правильные детали и инструменты

У нас есть в наличии чипы ASIC серий BM1368, BM1366, BM1397 и BM1362, специальные тестеры чипов для каждой платформы, универсальные тестеры хеш-плат и полный ассортимент инструментов, необходимых для диагностики и ремонта ошибок CRC — по ценам производителя из Шэньчжэня и с доставкой DDP в США.

Просмотрите тестовые приспособления и тестеры чипов для хеш-плат ASIC

Нужна помощь в определении правильного чипа или тестера для вашей конкретной модели Antminer? Наша техническая команда может подобрать правильные детали для вашего оборудования. Свяжитесь с нами по адресу contact@lys-sz.com или через WhatsApp.

Вернуться к блогу
Вам может понравиться