Так вот, первое следствие настоящего четырехъядерного дизайна Phenom и один из самых громких рекламных лозунгов AMD - это новая организация кэш-памяти. Фирма по-прежнему испытывает трудности с ее объемом и не может угнаться за Intel в искусстве выпускать крупные чипы с регулярно уменьшающимся техпроцессом: процессоры Penryn уже хвастаются памятью до 12 Мбайт! В прошлом ситуацию спасал чрезвычайно быстрый встроенный контроллер памяти, отчасти уменьшавший нужду в больших кэшах. Теперь же поневоле пришлось раскошелиться на дополнительные транзисторы: четыре ядра для эффективной работы обязаны обладать общим хранилищем данных. В четырехъядерных Core 2 эту задачу решает разделяемый кэш L2 в каждой паре ядер. AMD сочла такой дизайн слишком сложным и решила оставить иерархию памяти K8 как есть, лишь добавив надстройку в виде общего кэша L3. Кроме общих данных, в нем хранится и весь получаемый процессором код, а каждое из четырех ядер снабжено 64 килобайтами персонального кэша первого уровня и 512 килобайтами второго.
Сам контроллер памяти - конек всех последних процессоров AMD - стал еще более эффективным. Говоря точнее, их теперь две штуки: по одному на каждый канал. Многоядерному процессору это дает ощутимое преимущество, особенно в случае работы с разными потоками. Если же этого не требуется, контроллеры могут перейти в сгруппированный режим, имитируя один. Кроме того, устройство поумнело и научилось выжимать последнее из пропускной полосы памяти: операции записи теперь накапливаются в специальном буфере, и как только набираются в достаточном количестве, выполняются скопом. Заодно происходит слежка за всеми обращениями к оперативке, и потенциально нужные данные заранее скачиваются в "мини-кэш" контроллера. Такая предвыборка на общем уровне тоже приходится весьма кстати для многоядерного CPU. Однако на все эти хитрости AMD пошла не спроста, ведь в поддержке памяти Phenom пока ограничен DDR2 c частотой 1066 МГц, хотя и к работе с DDR3 потенциально готов. AMD снова скептически относится к новому типу памяти, предоставляя другим фирмам прокладывать дорогу прогрессивным стандартам, благо Intel всегда готова быть первопроходцем. Но на самом деле, DDR2 Phenom хватает за глаза, поскольку частота фронтальной шины у него так и не поднялась выше 800 МГц, тогда как Intel готовится удвоить этот показатель. Зато шина HyperTransport прогрессировала до версии 3.0 и теперь будет работать на частотах до 2 ГГц в каждую сторону в зависимости от модели процессора.
Архитектура K10 полна малозаметных по отдельности усовершенствований, копирующих некогда эксклюзивные качества Core 2 Duo. И память - лишь вершина айсберга; куда больше инженеры поработали над вычислительным ядром процессора. Если при работе с данными задержки уменьшает предвыборка, то для того, чтобы непрерывно работали исполнительные устройства, нужно предсказание ветвления кода программы. У K8 оно работало отлично, только в одном Intel была впереди. Pentium M, а затем и Pentium 4 с ядром Prescott обзавелись непрямым предсказателем ветвлений. Что это за устройство? Вместо предсказания конкретной инструкции он лишь указывает место в памяти, где она может оказаться. Prescott в свое время немало выиграл от такого блока, со своим конвейером непомерной длины. У Phenom такой проблемы нет, но AMD решила, что и ему новинка пойдет на пользу. Кроме того, и обычные предсказатели Phenom работают эффективнее, чем раньше. Еще у современных процессоров Intel есть такая важная особенность, как выполнение определенных инструкций загрузки заранее, в обход других команд, стоящих в очереди. В результате, вместо того чтобы дожидаться поступления данных, расчеты, для которых они нужны, получают их немедленно. Это неплохое подспорье для процессора, при том что загрузки составляют около трети всего кода в современном софте. У процессоров K8 таких возможностей не было, а у K10 - уже есть.
Другой мелкой радостью Phenom стало добавление нескольких новых инструкций: двух для нужд криптографии и четырех расширений под названием SSE4а (в интеловском SSE4 их нет, и вряд ли появятся). AMD, заметим, пошла еще дальше и без оглядки на Intel (между прочим, конкуренты за свою историю купили друг у друга немало технологий) разработала набор SSE5, который Intel предала анафеме. Но в Phenom он не попал и дебютирует в составе процессоров Fusion. Да, еще один бонус K10 - аппаратный менеджмент памяти при виртуализации операционных систем. Сейчас, когда одна или несколько ОС работают на машине под надзором основной операционки, последняя до 75% времени тратит на эту работу, и технология Nested Paging должна перенести ее на плечи процессора. AMD говорит, что ввести новинку в оборот будет совсем нетрудно.
Читать дальше