Термоконтроль в будущих процессорах AMD Zen 4 на сокете AM5

25.10.2021
Цод Миранов

Процессоры AMD следующего поколения на архитектуре Zen 4 ожидаются в 2022 году, скорее всего, во второй половине года. Возможно, официальный анонс состоится на CES в январе. Но уже сейчас благодаря утечкам официальных документов можно оценить некоторые технические характеристики, в том числе температурный режим новых APU/CPU и схему управления питанием.

Сразу скажем, что слухи о высоких температурах Zen 4 не соответствуют действительности. Скорее наоборот, довести процессор Zen 4 до перегрева будет практически невозможно.

Немецкий специалист Игорь Валлоссек разобрался в документации и грамотно разложил всё по полочкам. Вот объяснение, как правильно интерпретировать Tcontrol (Tctl).

TL;DR. Значение Tcontrol (Tctl) — это значение для термоконтроля, а не температура чипа или корпуса микросхемы. Максимальное значение Tcontrol всегда равно 100 для всех CPU, независимо от максимально возможной температуры корпуса микросхемы (Tcase).

Вот как выглядит соотношение относительных и абсолютных величин в документации:

СимволОписаниеTDP процессора
45 Вт65 Вт95 Вт105 Вт120 Вт170 Вт
Tctl maxЗначение термоконтроля100
Tcase °СТемпература корпуса59,266,765,860,96046,7

Один пункт Tctl — это один градус. Получается, что реальную температуру корпуса можно вычислить по разнице Tctl и Tctl max, исходя из ориентировочного значения Tcase, указанного в таблице. То есть для процессора с TDP 120 Вт значение Tctl=90 будет соответствовать температуре корпуса 50°C.

Нужно учитывать, что температура корпуса Tcase значительно выше реальной температуры кристалла Tjunction. Обычно именно этот параметр указывают в официальных спецификациях.

Из документации также известно, что через BIOS можно будет установить лимит PPT (Package Power Tracking), то есть лимит реального энергопотребления, не более 1,35х от официального TDP.

Термоконтроль

На процессорах сокета AM5 будет реализован мониторинг температуры on-die через датчик температуры (SB-TSI) в соответствии со спецификацией SMBus v2.0 или путём чтения регистра THM_TCON_CUR_TMP

Значение Tctl используется для управления скоростью вращения вентилятора и троттлинга (дросселирования), чтобы температура чипа не выходила за пределы, указанные в спецификации.

В новых CPU также реализован фильтр CUR_TEMP, который сглаживает сообщаемую температуру и помогает избежать резких изменений скорости вращения вентилятора в ответ на температурные скачки. Всем известны завывание резко стартующих вентиляторов, особенно на старых материнских платах Intel. Здесь же значения Tctl эффективно урезаются.

В зависимости от класса TDP, документация в качестве ориентира использует разную температуру корпуса как Tctl = 100 (см. таблицу выше). Вдобавок к этим значениям, которые используются для изменения скорости вентилятора, есть и другие функции термоконтроля: cHTC (Configurable Hardware Thermal Control), PROCHOT и ThermTrip, которые работают непосредственно внутри процессора. Особенно интересна функция cHTC, которая обеспечивает плавное изменение состояния CPU для максимизации производительности. 

Интересно, что на уровне операционной системы будут видны только три «средних» состояния, а реальная частота CPU изменяется в гораздо более широком диапазоне.

На уровне ОС видны только три частотных режима

На аппаратном уровне закодировано дефолтное значение Tctl = 95 для активации cHTC, то есть через BIOS невозможно изменить параметры системы охлаждения и температурный режим, если температура процессора приближается на пять градусов к максимальной, согласно спецификациям.

Системная функция PROCHOT за 1,5 мс понижает тактовую частоту процессора до минимально возможной (Fmin), которая тоже установлена на аппаратном уровне и не изменяется.

AMD обращает внимание производителей материнских плат на оптимальную схему понижения вольтажа, чтобы не слишком занижать общий КПД, который падает на каждом этапе. Вольтаж должен соответствовать требованиям из технической документации. При необходимости — использовать импульсные регуляторы, преобразование максимум в две ступени. 

AMD приводит график изменения энергоэффективности в зависимости от нагрузки и энергопотребления CPU. Получается, что чрезмерная нагрузка на процессор не имеет особого смысла, потому что он будет работать в неэффективном режиме и периодически снижать тактовую частоту во избежание перегрева.

Последний рубеж защиты процессора от перегрева — пин Thermtrip_L для отключения (состояние S5) при достижении установленного температурного лимита. Скорость отключения 500 мс.

Таким образом, довести процессор Zen 4 до перегрева будет гораздо сложнее, чем раньше.