skylake-is-already-here-processors-and-memory.jpg

Skylake is already here / Processors and memory

The release of desktop processors Broadwell-DT a couple of months ago passed almost unnoticed. Their assortment in LGA1150-performance includes only two rather expensive quad-core models, which practically do not exceed the performance of Haswell generation predecessors, they have typical heat dissipation reduced to 65 W, low clock frequencies, and also are characterized by mediocre overclocking. In fact, Broadwell-DT is notable only for its graphic core GT3e, which is reinforced with an additional 128-megabyte eDRAM-cache and is the most productive integrated graphics to date. Obviously, with such a combination of characteristics of LGA1150-version Broadwell can claim the interest of only a narrow range of consumers who are interested in building very specific systems of ultra-compact form factor that are not equipped with an external video card.

Why did Intel need to produce a processor with such ambiguous characteristics? The answer to this question we see today, and his name is Skylake-S. The fact is that the practical implementation of Broadwell – the first 14-nm microarchitecture of Intel – went not quite on schedule. Faced with the introduction of the next technological process with serious industrial problems, Intel was forced to postpone the start of the mass production of Broadwell for several months. More or less to debug the company’s 14-nm technology was possible only by the third quarter of last year, but the yield of suitable quad-core semiconductor crystals could not reach an acceptable value even after that. As a result, productive versions of Broadwell were able to see the light only at the beginning of this summer – almost a year later than the original plan.

Meanwhile, the development of the next-generation Broadwell microarchitecture generation, Skylake, was on its way. And in the end it turned out that the release of desktop Broadwell almost coincided with the time of readiness Skylake. In this situation, Intel has made a fundamental decision not to postpone the announcement of the new generation of its processors developed in the frame of the “so” phase, which bring a more progressive architecture with numerous improvements in performance and power consumption. Instead, it was decided to sacrifice the life cycle of the “tick” phase models – the desktop Broadwell. That’s why they were positioned in such a way so as not to delay the attention of enthusiasts for whom the main new products of the summer of 2015 should be the Skylake-DT processors and the new LGA1151 platform coming with them.

The stake of the microprocessor giant on Skylake is quite understandable: according to the company itself, the processors of this generation are the most significant novelty in the last decade. And they certainly deserve such a high estimation for their energy efficiency and ability to become a catalyst for the widespread introduction of various wireless technologies. However, classical processors Skylake-S, oriented to desktop systems, are also of considerable importance for Intel. Despite the fact that sales of personal computers in the past few years feel far from the best, in the segment of high-performance gaming systems there is a rapid growth. Both enthusiasts with experience, and a new generation of gamers with enthusiasm plunged into modern high-tech entertainment – large-scale network 3D games, online streaming and virtual reality. All this requires the use of high-performance systems, and the Skylake-S processors together with the new LGA1151 platform are able to offer the resources necessary for these purposes.

It was with a view to such an advanced audience of Intel and decided to build a market for its new 14-nm processors. While the introduction of Broadwell began with ultra-mobile applications, Skylake does the opposite. Today at the largest in Europe exhibition of interactive games and entertainment Gamescom the company presents the flagship desktop processors Skylake-S, related to the K-series; Two weeks later, as part of the regular session of the Intel Developers Forum, details of the microarchitecture Skylake will be told; and during September – October Skylake design will find its place already in mass desktop, mobile, ultra mobile and server processors. Today we have the opportunity to talk about the performance and features of the older models of Skylake-S for LGA1151-systems: Core i7-6700K and Core i5-6600K.

⇡ # Microarchitecture Skylake: first glance

Unfortunately, little is known about the new microarchitecture of Skylake at the moment. Intel does not provide details on the internal structure of the new processors, exposing the Core i7-6700K and Core i5-6600K as some kind of “black boxes” that can be tested in the case, but can not be opened. The maximum, what can be said with a certain degree of certainty, is that the microarchitecture of their computing cores contains a fairly significant number of improvements compared to Haswell and Broadwell.

First, Intel attributes Skylake to the “so” phase, which usually introduces a new microarchitecture. Secondly, it causes deep changes and the fact that the server modifications of Skylake should get support for 512-bit vector instructions AVX-512.

Implementing the support of such instructions inevitably requires reworking for work with more “broad” data of the executive devices and the caching system. And therefore it is quite logical to expect that Skylake will get an increase in performance, noticeable even when working with more traditional 256-bit vector commands.

To confirm this hypothesis, we conducted our traditional test in synthetic benchmarks offered by SiSoftware Sandra 21.42. This set of tests uses relatively simple algorithms, and therefore the result in them does not depend on the performance of the memory subsystem and well illustrates the computational performance of processor cores . For clarity, the quad-core Skylake performance is compared with the results of similar Haswell and Broadwell operating at the same fixed clock speed of 4.0 GHz.

The assumptions are fully confirmed. In multimedia tests using AVX2- or FMA-instructions, Skylake shows a 25-30% higher performance compared to Haswell’s equal-frequency one. Unfortunately, such an increase in speed is not available on conventional arithmetic-logical operations, but the improvements can give a very good effect in real applications. Especially because the acceleration of vector instructions alone is not limited to: in Skylake it became faster – and noticeably! – Cache memory.

The practical bandwidth of the second and third level cache memory in Skylake grew by about 45 percent. However, it should be borne in mind that the latency of the cache has remained at the same level.

The latency of the cache, the clock
Haswell Broadwell Skylake
L1D-cache 4 4 4
L2-cache 12 12 12
L3-cache 21 23 21

Thus, thanks to microarchitectural improvements, details of which we learn only after two weeks, the Skylake-S processors have an increased IPC (the number of instructions executed per clock) and provide a higher specific performance in comparison with its predecessors. Intel itself promises about 10 percent superiority of novelties over representatives of the Haswell family of the last year and a 30 percent advantage over Ivy Bridge in real applications.

⇡ # Skylake-S and support for DDR4 SDRAM

One of the main innovations implemented in the Skylake processors is a fundamentally new memory controller. With the advent of these processors, the main type of memory used in modern desktop PCs is DDR4 SDRAM, which we already had the opportunity to test in the LGA2011-v3 platform.

However, the Skylake-S processors, unlike the Haswell-E, have a slightly different memory controller: it is dual-channel and can work not only with DDR4 modules, but also maintains backward compatibility with the DDR3L standard. However, this does not mean that Skylake-S can work with both modules simultaneously, because motherboards will be equipped with either one or another type of DIMM slots. And Intel strongly recommends its partners in new platforms to use only DDR4 SDRAM, so that the new generation motherboards with DDR3L support will be few, and all of them, most likely, will be positioned as budget solutions. Typical motherboards for Skylake-S will receive four DDR4 DIMM slots pair-wise connected to a dual-channel processor memory controller.

Formally, Skylake-S processors are compatible with DDR4-2133, but in practice they are able to work with much faster modules. It should not be surprising that manufacturers of high-speed memory for enthusiasts have already announced kits with the frequency up to DDR4-4000 – even such high-speed variants with Skylake-S are quite efficient. The new memory controller has a lot of flexibility: it supports a huge number of dividers, allows you to change the memory frequency in steps of 100/133 MHz, and also maintains stability with a very solid acceleration of the memory bus.

Separately, Intel emphasizes that all memory kits that have been certified to work in four-channel mode with Haswell-E can work without any problems with Skylake-S. And filling all four DIMM slots in systems based on Skylake-S will not lead to any negative effects, but, on the contrary, will allow to obtain optimal performance. In other words, there is no problem with the availability of memory for new CPUs.

However, most enthusiasts refer to DDR4 cool enough. Compared to DDR3, this memory operates at higher frequencies, so it can provide much better bandwidth, but at the same time its latency is noticeably higher. To illustrate all this, using benchmarks from the SiSoftware Sandra 21.42 package, we tested the practical characteristics of the Skylake-S memory subsystem, equipped with DDR4 SDRAM modules at various speeds. For comparison, the results obtained in a similar system with a Haswell processor and the usual memory of the DDR3 SDRAM type are given next.

As it is easy to see, DDR4 SDRAM really provides higher bandwidth. It continues to scale synchronously with the frequency, that is, DDR4 modules with a higher declared speed will always be able to provide better bandwidth in comparison with DDR3. And this is an undoubted advantage of the new technology. However, latency has seriously increased. As you can see from the diagrams, the same as for DDR3-1866, delays can be obtained only when installing DDR4-3000 modules in the system, which are among the premium overclocker offers. In other words, the transition from DDR3 to DDR4 does not yet have obvious advantages. In some aspects, the performance of the next-generation system from the use of other memory technologies will be won, but in some they will lose.

However, we should not lose sight of the fact that with the release of Skylake, the introduction of DDR4 in mass systems should significantly accelerate the advancement of this technology. So low-cost and high-speed DDR4 SDRAM modules, which will exceed the memory of the previous standard in all aspects, can become widespread in the very near future.

⇡ # LGA1151 platform and Intel Z170 chipset

The output of the generation of Intel CPU for desktop systems developed within the “so” phase is always accompanied by a change in the processor socket. Skylake-S is no exception. Simultaneously with these processors, the new socket LGA1151 also comes into use. In terms of size, appearance and number of contacts, it almost does not differ from the previous version – LGA1150, but in fact its appearance is not due to the desire of Intel to once again make users complete the upgrade of the platform.

 Left - LGA 1150; right - LGA 1151 "height =" 294 "width =" 600 "/>


<div class=

Left – LGA1150; on the right – LGA1151

Electrically LGA1151 has significant differences. They are associated with the appearance in Skylake-S of DDR4 memory support, the removal of the built-in power converter (FIVR) from the processor and the introduction of a new high-speed bus connecting the CPU with a set of system logic.

Past Intel chipsets used with Haswell and Broadwell generations of processors are often censured because they themselves do not provide enough high-speed interfaces, and severely limit the ability to add them to the system through external controllers. The root of this problem is in the DMI 2.0 bus, which connects the CPU to a set of logic. Its bandwidth is only 2 GB / s (in each direction), which limits the bandwidth that can be accessed by devices connected through the chipset.

In Intel Skylake-S processors for desktop systems, Intel finally implemented a new version of this bus – DMI 3.0, which is now based on the PCI Express 3.0 protocol and has increased to 3.9 GB / s (each side) bandwidth. This change was a good foundation for revising the functionality of the logic sets, and thanks to this, the Skylake-S chipsets, codenamed Sunrise Point and related to the 100th series, received a much wider range of features.

The family of chipsets of the hundredth series for desktop variants of Skylake-S includes at least six versions, differing in positioning and characteristics. But today, together with the announcement of the flagship quad-core processors, Intel presents to the public only the most senior set of logic with maximum specifications and overclocking support – Intel Z170.

As you can see from the block diagram, this set of logic is fundamentally different from its predecessors by the appearance of support for the PCI Express 3.0 bus and the increase in the number of USB 3.0 ports. However, unfortunately, while Intel has refrained from integrating into the USB 3.1 controller logic set and such high-speed ports will obviously be implemented on the boards through additional chips. However, there is no particular problem in this – the number of supported PCI Express lines in the Intel Z170 has grown to 20, and this should be more than enough for any additional controllers, and branched high-speed interfaces for connecting solid-state drives.

Based on the needs of modern interfaces, a typical motherboard based on Z170 will have four PCI Express 3.0 lines for each M.2 or U.2 port, two lines for each 3.1-port USB port and one line – for each gigabit LAN controller. But even based on this arithmetic it is clear that 20 lines of PCI Express 3.0 will suffice not only for equipping the motherboard with all the necessary additional interfaces, but also for additional PCIe 3.0 x4 or even PCIe 3.0 x8 slots. In other words, thanks to the Intel Z170 logic chipset, the LGA1151 motherboard manufacturers can give them significantly greater capabilities than Haswell or Broadwell motherboards, without resorting to tricks like PCI Express hubs.

By the way, do not forget that in addition to 20 lines of PCI Express 3.0, the Z170 logic set also offers six traditional SATA 6 Gb / s ports and 10 USB 3.0 ports, for which no additional chips are required at all.

The advantages of the new sets of logic do not end there. An important update affected the Intel Rapid Storage technology, whose capabilities in LGA1151 chipsets have significantly expanded. So, it has support for NVMe-drives, and, in addition, it is now possible to combine SSDs connected to the system via PCI Express via SATA Express, M.2, U.2 connectors or directly to RAID arrays.

Thus, Skylake processors are attractive not only for the new microarchitecture with increased specific performance and support for faster and more progressive memory, but also because the whole platform as a whole has become noticeably better and more functional.

⇡ # Core i7-6700K and Core i5-6600K: details

Skylake-S: Core i7-6700K processor top and bottom

Today Intel company represents only two processors, crowning LGA1151-line Core i7 and Core i5 – Core i7-6700K and Core i5-6600K. These are two quad-core processors that have maximum clock speeds for Skylake-S design media and allow overclocking.

[1945909]

Core i7-6700K Core i5-6600K
The code name of the Skylake-S Skylake-S
Nuclei / flows 4/8 4/4
Hyper-Threading Technology There are Нет
Тактовая частота 4,0 ГГц 3,5 ГГц
Максимальная частота в турбо-режиме 4,2 ГГц 3,9 ГГц
Разблокированный множитель Есть Есть
TDP 91 Вт 91 Вт
HD Graphics HD Graphics 530 HD Graphics 530
Частота графического ядра 1150 МГц 1100 МГц
L3-кеш 8 Мбайт 6 Мбайт
Поддержка DDR4 Два канала DDR4-2133 Два канала DDR4-2133
Поддержка DDR3 Два канала DDR3L-1600 Два канала DDR3L-1600
Линии PCI Express 3.0 16 16
Технологии vPro/TSX-NI/TXT/VT-d TSX-NI и VT-d TSX-NI и VT-d
Расширения набора инструкций AVX 2.0 AVX 2.0
Упаковка LGA 1151 LGA 1151
Рекомендованная цена $350 $243

Старший процессор Core i7-6700K имеет номинальную тактовую частоту 4 ГГц. При этом технология Turbo Boost при невысокой нагрузке способна увеличивать эту частоту до 4,2 ГГц. Это означает, что Core i7-6700K несколько уступает по частотам старшему процессору серии Devil’s Canyon, Core i7-4790K. Но объём кеш-памяти третьего уровня в новом Core i7-6700K остался неизменен – 8 Мбайт.

Скриншот диагностической утилиты позволяет сделать ещё несколько интересных наблюдений относительно Core i7-6700K. Во-первых, этот 14-нм процессор использует сравнительно высокое напряжение питания (наш образец работал при 1,2 В). Получается, что, несмотря на совершенствование техпроцесса, в CPU для производительных систем, которые должны функционировать на достаточно высоких частотах, производителю приходится заметно поднимать напряжение. В этой связи не вызывает удивления тот факт, что тепловой пакет новинки вырос до 91 Вт даже вопреки тому, что из неё убрали встроенный преобразователь питания (FIVR), который в платформе LGA1151 вернулся на материнскую плату.

Обратить внимание стоит и на изменение организации кеш-памяти второго уровня. Теперь в ней реализована 4-канальная ассоциативность (раньше была 8-канальная). Это отчасти объясняет тот факт, что L2-кеш в Skylake работает быстрее, чем в предшествующих процессорах. Но не стоит забывать, что уменьшение ассоциативности несёт с собой и негативный эффект – увеличивается число промахов.

Второй процессор из представленных сегодня десктопных Skylake-S – Core i5-6600K. Как и раньше, его принадлежность к семейству Core i5 означает наличие четырёх вычислительных ядер, но, в отличие от 6700K, без поддержки Hyper-Threading. Кроме этого, L3-кеш в Core i5-6600K традиционно урезан до 6 Мбайт.

Номинальная тактовая частота Core i5-6600K составляет 3,5 ГГц, а технология Turbo Boost может увеличивать её до 3,9 ГГц. Это значит, что по частотам он похож на Core i5-4690K серии Devil’s Canyon. Как и Core i7-6700K, Core i5-6600K имеет относительно высокое напряжение питания (у нашего экземпляра – на уровне 1,2 В), а его TDP — 91 Вт.

Оба представленных процессора, и Core i7-6700K, и Core i5-6600K, обладают новым встроенным видеоядром HD Graphics 530, которое относится к девятому поколению интеловской графики. Как видите, в Skylake Intel изменила нумерацию своих 3D-акселераторов и перешла с четырёхзначных на трёхзначные числа. Однако никакого скрытого смысла в таком переименовании нет: на самом деле в Core i7-6700K и Core i5-6600K установлено графическое ядро GT2, оснащенное 24 исполнительными устройствами с максимальными рабочими частотами 1,15 и 1,10 ГГц соответственно. В теории разнообразные процессоры Skylake могут комплектоваться и более мощной графикой GT3 и GT3e, однако в настольные модели, как и в Haswell, будет попадать лишь уполовиненная по числу исполнительных устройств версия графического ядра. Таким образом, представленные совсем недавно десктопные Broadwell-DT, вне всяких сомнений, останутся наиболее производительными в графическом плане CPU, поскольку в них применятся мощное ядро GT3e. Тем не менее не стоит забывать о том, что архитектура графического ядра Skylake претерпела некоторые изменения, и оно первым из интеловских GPU получило совместимость со стандартами DirectX 12, OpenGL 4.4 и OpenCL 2.0, а также полную аппаратную поддержку декодирования видео в форматах HEVC, VP8 и VP9.

Впрочем, встроенная процессорная графика энтузиастов волнует слабо. А вот что действительно заслуживает внимания, так это цена. С появлением десктопных представителей поколения Broadwell компания Intel несколько увеличила стоимость своих флагманских продуктов для энтузиастов, но, к счастью, это оказалось лишь разовой акцией. Рекомендованные цены на Core i7-6700K и Core i5-6600K вернулись на традиционный уровень — $350 и $243 соответственно (в коробочном исполнении). Таким образом, новинки должны стоить в магазинах не дороже предшественников семейства Devil’s Canyon. Убедиться в этом можно будет в ближайшие дни – поставки новых процессоров уже начались.

Правда, в коробках с оверклокерскими Skylake теперь не будет никакого кулера. Intel справедливо посчитала, что энтузиасты всё равно предпочитают использовать более производительные системы охлаждения сторонних производителей.

И кстати, с выходом Core i7-6700K и Core i5-6600K компания Intel решила кардинально переделать дизайн коробок. Теперь их лицевая сторона будет содержать минимум текстовой и графической информации, вместо которой появится радиальная цветная заливка.

⇡#Разгон

В последние годы мы наблюдаем очень печальную тенденцию: с каждым обновлением процессорного дизайна оверклокерский потенциал постепенно снижается. В результате поднятая в процессорах Sandy Bridge до 5-гигагерцовой отметки планка простого разгона (без применения специальных методов охлаждения) так и остаётся недостижимой для всех их последователей. Более того, в процессорах Broadwell-DT положение ухудшилось до того, что нормальным стало считаться достижение весьма скромных частот порядка 4,2 ГГц. Всё это не внушало особого оптимизма и в отношении Skylake-S, которые выпускаются по точно такому же техпроцессу с 14-нм нормами и трёхмерными транзисторами второго поколения.

Однако реальность оказалась не столь печальной. Внесённые инженерами Intel микроархитектурные изменения улучшили частотный потенциал процессоров нового поколения, и к ним вернулась способность работы на скоростях, достаточно ощутимо превышающих номинальные. На руку оверклокерам сыграло и вынесение конвертера питания (FIVR) из процессора на материнскую плату, что, с одной стороны, увеличило ту роль, которую играет в разгоне материнская плата, но, с другой стороны, позволило реализовать качественные и мощные схемы питания CPU, рассчитанные на нагрузку, которая существенно превышает штатную.

Всё это подтвердилось в процессе практических экспериментов по разгону Skylake-S, которые мы провели, используя материнскую плату ASUS Z170-Deluxe и воздушный кулер Noctua NH-U14S с имеющимися в нашей лаборатории образцами Core i7-6700K и Core i5-6600K. В процессе испытаний увеличение рабочих частот процессоров выполнялось привычным путём – через изменение коэффициента умножения, который в процессорах K-серии традиционно не блокируется.

Старший четырёхъядерник Core i7-6700K легко смог разогнаться до частоты 4,6 ГГц. Всё что потребовалось для достижения стабильности системы в таком состоянии, – это увеличение напряжения питания на CPU до примерно 1,33 В. Правда, для поддержания постоянного уровня напряжения вновь пришлось вспомнить об опции UEFI BIOS CPU Load-Line Calibrationкоторая управляет обратной связью цифрового конвертера питания на материнской плате и позволяет противодействовать падению напряжения на процессоре под нагрузкой.

В таком состоянии температура CPU при тестировании стабильности в LinX 0.6.5 оставалась в пределах 93 градусов, что можно считать вполне приемлемым режимом, если принять во внимание, что троттлинг у Skylake включается при достижении уровня 100 градусов.

Второй побывавший в наших руках процессор, Core i5-6600K, разогнался немного хуже. При увеличении его напряжения питания до 1,31 В максимальная частота, при которой сохранялась стабильность, составила 4,5 ГГц.

Максимальная температура при проверке устойчивости разогнанной системы составила 89 градусов.

Стоит уточнить, что при оверклокерских экспериментах мы не ставили своей целью выжать из процессоров все соки. Достигнутые частоты — 4,5–4,6 ГГц – это такой разгон, при котором Skylake-S можно долгосрочно эксплуатировать без опасений преждевременной деградации и потери стабильности. Однако эти же экземпляры Core i7-6700K и Core i5-6600K вполне возможно было бы разогнать и на 100 МГц посильнее, если взять кулер помощнее и закрыть глаза на опасное приближение температуры к 100-градусной границе. Поэтому можно ожидать, что удачные серийные Core i7-6700K и Core i5-6600K смогут стабильно работать и на частотах порядка 4,7 ГГц при использовании мощных серийных охлаждающих систем.

Однако рассчитывать, что Skylake-S станут новой оверклокерской иконой, всё-таки не следует. Дело в том, что они имеют тот же недостаток, что и предшественники, – их теплораспределительная крышка контактирует с полупроводниковым кристаллом через слой полимерного термоинтерфейсного материала с далеко не идеальной теплопроводностью. Поэтому снимать тепло с чипов Skylake-S получается не столь эффективно, как это удавалось в процессорах поколения Sandy Bridge, где крышка соединялась с кристаллом с помощью бесфлюсовой пайки. И данный конструктивный недостаток заметно сдерживает оверклокерский потенциал новинок.

Но даже несмотря на всё это, при разгоне Skylake-S демонстрируют достаточно податливый характер. На увеличение напряжения питания они хорошо откликаются предсказуемым ростом частотного потенциала. И этот факт позволяет нам быть уверенными в том, что Skylake-S окажутся весьма востребованными инструментами в руках наиболее радикальной части оверклокерского сообщества. Привлечение экстремальных методов охлаждения наверняка позволит Core i7-6700K и Core i5-6600K обосноваться на вершинах оверклокерских рейтингов. Кроме того, неплохие результаты должно давать и практикуемое энтузиастами скальпирование Skylake с заменой интеловского полимерного термоинтерфейса другими материалами с более высокой теплопроводностью.

Кстати, дополнительную привлекательность процессорам Skylake-S как объектам для разгона придаёт ещё и то, что их, наконец, можно полноценно разгонять не только через увеличение множителя, но и путём изменения частоты базового тактового генератора – BCLK. Если раньше реально можно было задействовать лишь тройку значений этой частоты – 100/125/166 МГц (и их небольшую окрестность), то в Skylake-S поддерживается непрерывное изменение BCLK с шагом 1 МГц. Например, воспользовавшись этой возможностью, мы повторно разогнали Core i7-6700K до частоты 4,6 ГГц, не повышая его множитель свыше штатного значения 40x.

Как видите, при частоте BCLK, равной 115 МГц, немыслимой для процессоров прошлых поколений, система на базе Skylake полностью работоспособна. Фактически оверклокинг с изменением частоты базового тактового генератора теперь выполняется столь же просто, как и повышением множителя. Частоты шин PCI Express и DMI в платформе LGA1151 отвязаны от BCLK, поэтому такой разгон проводится без каких-либо осложнений. Единственное, при увеличении базовой частоты нужно не забывать увеличивать делитель для частоты DDR4 SDRAM и снижать множитель для частоты процессорного L3-кеша, так как они свою связь с BCLK сохранили.

If you notice an error – select it with the mouse and press CTRL + ENTER.

Tags: , ,
Previous Post
the-price-of-the-game-processors-and-memory.jpg
Uncategorized

the price of the game / processors and memory

Next Post
details-on-the-microarchitecture-processors-and-memory.jpg
Uncategorized

details on the microarchitecture / processors and memory

Leave a Reply

Your email address will not be published. Required fields are marked *